Suchen und Finden

Titel

Autor

Inhaltsverzeichnis

Nur ebooks mit Firmenlizenz anzeigen:

 

Das Zeitalter der Daten - Was Sie über Grundlagen, Algorithmen und Anwendungen wissen sollten

Das Zeitalter der Daten - Was Sie über Grundlagen, Algorithmen und Anwendungen wissen sollten

Holger Aust

 

Verlag Springer-Verlag, 2021

ISBN 9783662623367 , 256 Seiten

Format PDF, OL

Kopierschutz Wasserzeichen

Geräte

14,99 EUR

Mehr zum Inhalt

Das Zeitalter der Daten - Was Sie über Grundlagen, Algorithmen und Anwendungen wissen sollten


 

Vorwort

5

Inhaltsverzeichnis

9

1: Data Science: Die Kunst mit Daten umzugehen

12

1.1 Der Dreiklang aus Data Science, Machine Learning und KI

18

1.2 Big Data: Kommt es auf die Größe an?

20

1.3 Deep Learning: Aus der Tiefe kommt die Intelligenz

23

1.4 Cloud Computing: Alles wird virtuell

26

1.4.1 Infrastructure as a Service – IT-Ressourcen leihen

26

1.4.2 Platform as a Service – ganze Systeme leihen

27

1.4.3 Software as a Service – Programme im Webbrowser

28

1.5 Das Internet der Dinge: Daten ohne Ende

29

Literatur

30

2: KI: Hype oder Technologie der Zukunft?

31

2.1 Kommt der KI-Winter?

33

2.2 Schwache KI liegt in Führung

36

Literatur

41

3: Wie lernt eine Maschine?

43

3.1 Fragen über Fragen: Lernen ist komplex

55

3.1.1 Präzisierung des Problems

55

3.1.2 Künstliches Wissen entsteht aus Daten

57

3.1.3 Statistische Fragen

58

3.1.4 Technische Fragestellungen

62

3.2 Überwachtes Lernen: Lernen unter Aufsicht

67

3.3 Unüberwachtes Lernen: Lernen ohne Vorbild

75

3.3.1 Der k-Means-Algorithmus

77

3.4 Bestärkendes Lernen: Die Erfahrung macht’s

79

3.4.1 Bestärkendes Lernen in der Robotik

82

3.5 Transfer Learning: Übertragen von Wissen

83

Literatur

84

4: Stolz und Vorurteile – Risiken von Data Science

86

4.1 Pfusch am Bau – Handwerkliche Fehler

87

4.1.1 Garbage in, garbage out – Müll bleibt Müll

87

4.1.2 p-Hacking und andere Statistik-Fallen

91

4.1.3 Overfitting – Trainings- oder Wettkampftyp?

95

4.2 Meine Daten gehören mir, oder?

98

4.3 Schubladen im Computerdenken – Vorurteile

102

4.4 Ethische Probleme

105

4.4.1 Machen Daten mich überflüssig?

105

4.4.2 Autonomes Fahren

108

4.4.3 Waffen

110

Literatur

113

5: Typische Aufgaben eines Data Scientists

116

5.1 Data Import: Die Qual der Quellen

121

5.1.1 Datenbanken

124

Relationale Datenbanken

125

Key-value stores – einfach und praktisch

127

Dokumentenorientierte Datenbanken

128

Graphdatenbanken

130

Spaltenorientierte Datenbanken

131

5.1.2 Dateien

132

5.1.3 Services und APIs

133

5.1.4 Internetseiten

135

5.2 Data Cleaning: Nur saubere Daten sind gute Daten

135

5.2.1 Löschen des zugehörigen Datensatzes

137

5.2.2 Korrektur der unplausiblen Werte

137

5.2.3 Rekonstruktion durch Imputation

138

5.2.4 Die Bedeutung von Data Cleaning

139

5.2.5 Data Preparation: Die Daten in Form bringen

139

5.3 Data Exploration: Erste Experimente

141

5.4 Data Modeling: Den Algorithmus anwenden

144

5.4.1 Feature Engineering: Die Wahl der Attribute

146

5.4.2 Model Training: Übung macht den Meister

149

5.4.3 Model Evaluation: Wie gut ist es?

151

5.5 Data Interpreting: Die Insights zählen

157

5.5.1 Data Storytelling: Gut erzählt ist halb gewonnen

158

5.5.2 Data Visualization: Das Auge liest mit

160

5.6 Deployment: An die Öffentlichkeit damit

166

Literatur

167

6: Das Gehirn kopieren? – Künstliche neuronale Netze

170

6.1 Das KNN-Skelett: Knoten & Verbindungen

173

6.1.1 Die Input-Schicht – Was isst ein neuronales Netz?

174

6.1.2 Die Output-Schicht – Entscheidend ist, was hinten rauskommt

176

6.1.3 Zwischenschichten

178

6.1.4 Verbindungen

181

6.1.5 Aktivierungsfunktion

182

6.2 Und so spielen die Teile zusammen

184

6.3 Wie lernt ein neuronales Netz?

186

6.3.1 Gradient Descent: Wo geht’s zur Talsohle?

187

6.3.2 Backpropagation: Rückwärts durchs Netz

189

6.4 Rechenpower satt durch Grafikkarten

191

6.5 Der Neuronale-Netze-Zoo

194

Literatur

201

7: Data Science in der Praxis

203

7.1 Suchmaschinen: Im Alltag unverzichtbar

203

7.1.1 Erfassung

205

7.1.2 Indizierung

206

7.1.3 Bereitstellung

206

7.2 Churn-Rate: Bleib doch noch, lieber Kunde

207

7.3 Recommender Engine: Kunden kauften auch …

212

7.3.1 Inhaltsbasierte Filterung

214

Produktattribute vergleichen

214

Produktbeschreibungen vergleichen

216

7.3.2 Kollaborative Filterung

219

7.4 Face Recognition: Bist Du mein Freund?

220

7.5 Routenplanung: Von A nach B

222

7.6 Disposition: Wie viel soll ich bestellen?

225

7.6.1 Nichtsaisonale Produkte

226

7.6.2 Saisonale Produkte

228

7.7 Fraud Detection: Den Betrügern auf der Spur

229

7.8 Disaster Risk: Naturkatastrophen vorhersagen

235

7.8.1 Was ist ein gutes Vorhersagesystem?

235

7.8.2 Langsame Erdbeben sind besser

237

7.9 Börsenhandel: Ein Milliardengeschäft

238

7.9.1 Technische Analyse: In der Vergangenheit liegt die Zukunft

240

7.9.2 Sentiment-Analyse

242

7.10 Chatbots: Fluch oder Segen für den Kunden

244

Literatur

246

8: Abschluss

249

Stichwortverzeichnis

252