Suchen und Finden
Service
Das Zeitalter der Daten - Was Sie über Grundlagen, Algorithmen und Anwendungen wissen sollten
Holger Aust
Verlag Springer-Verlag, 2021
ISBN 9783662623367 , 256 Seiten
Format PDF, OL
Kopierschutz Wasserzeichen
Geräte
Mehr zum Inhalt
Das Zeitalter der Daten - Was Sie über Grundlagen, Algorithmen und Anwendungen wissen sollten
Vorwort
5
Inhaltsverzeichnis
9
1: Data Science: Die Kunst mit Daten umzugehen
12
1.1 Der Dreiklang aus Data Science, Machine Learning und KI
18
1.2 Big Data: Kommt es auf die Größe an?
20
1.3 Deep Learning: Aus der Tiefe kommt die Intelligenz
23
1.4 Cloud Computing: Alles wird virtuell
26
1.4.1 Infrastructure as a Service – IT-Ressourcen leihen
26
1.4.2 Platform as a Service – ganze Systeme leihen
27
1.4.3 Software as a Service – Programme im Webbrowser
28
1.5 Das Internet der Dinge: Daten ohne Ende
29
Literatur
30
2: KI: Hype oder Technologie der Zukunft?
31
2.1 Kommt der KI-Winter?
33
2.2 Schwache KI liegt in Führung
36
Literatur
41
3: Wie lernt eine Maschine?
43
3.1 Fragen über Fragen: Lernen ist komplex
55
3.1.1 Präzisierung des Problems
55
3.1.2 Künstliches Wissen entsteht aus Daten
57
3.1.3 Statistische Fragen
58
3.1.4 Technische Fragestellungen
62
3.2 Überwachtes Lernen: Lernen unter Aufsicht
67
3.3 Unüberwachtes Lernen: Lernen ohne Vorbild
75
3.3.1 Der k-Means-Algorithmus
77
3.4 Bestärkendes Lernen: Die Erfahrung macht’s
79
3.4.1 Bestärkendes Lernen in der Robotik
82
3.5 Transfer Learning: Übertragen von Wissen
83
Literatur
84
4: Stolz und Vorurteile – Risiken von Data Science
86
4.1 Pfusch am Bau – Handwerkliche Fehler
87
4.1.1 Garbage in, garbage out – Müll bleibt Müll
87
4.1.2 p-Hacking und andere Statistik-Fallen
91
4.1.3 Overfitting – Trainings- oder Wettkampftyp?
95
4.2 Meine Daten gehören mir, oder?
98
4.3 Schubladen im Computerdenken – Vorurteile
102
4.4 Ethische Probleme
105
4.4.1 Machen Daten mich überflüssig?
105
4.4.2 Autonomes Fahren
108
4.4.3 Waffen
110
Literatur
113
5: Typische Aufgaben eines Data Scientists
116
5.1 Data Import: Die Qual der Quellen
121
5.1.1 Datenbanken
124
Relationale Datenbanken
125
Key-value stores – einfach und praktisch
127
Dokumentenorientierte Datenbanken
128
Graphdatenbanken
130
Spaltenorientierte Datenbanken
131
5.1.2 Dateien
132
5.1.3 Services und APIs
133
5.1.4 Internetseiten
135
5.2 Data Cleaning: Nur saubere Daten sind gute Daten
135
5.2.1 Löschen des zugehörigen Datensatzes
137
5.2.2 Korrektur der unplausiblen Werte
137
5.2.3 Rekonstruktion durch Imputation
138
5.2.4 Die Bedeutung von Data Cleaning
139
5.2.5 Data Preparation: Die Daten in Form bringen
139
5.3 Data Exploration: Erste Experimente
141
5.4 Data Modeling: Den Algorithmus anwenden
144
5.4.1 Feature Engineering: Die Wahl der Attribute
146
5.4.2 Model Training: Übung macht den Meister
149
5.4.3 Model Evaluation: Wie gut ist es?
151
5.5 Data Interpreting: Die Insights zählen
157
5.5.1 Data Storytelling: Gut erzählt ist halb gewonnen
158
5.5.2 Data Visualization: Das Auge liest mit
160
5.6 Deployment: An die Öffentlichkeit damit
166
Literatur
167
6: Das Gehirn kopieren? – Künstliche neuronale Netze
170
6.1 Das KNN-Skelett: Knoten & Verbindungen
173
6.1.1 Die Input-Schicht – Was isst ein neuronales Netz?
174
6.1.2 Die Output-Schicht – Entscheidend ist, was hinten rauskommt
176
6.1.3 Zwischenschichten
178
6.1.4 Verbindungen
181
6.1.5 Aktivierungsfunktion
182
6.2 Und so spielen die Teile zusammen
184
6.3 Wie lernt ein neuronales Netz?
186
6.3.1 Gradient Descent: Wo geht’s zur Talsohle?
187
6.3.2 Backpropagation: Rückwärts durchs Netz
189
6.4 Rechenpower satt durch Grafikkarten
191
6.5 Der Neuronale-Netze-Zoo
194
Literatur
201
7: Data Science in der Praxis
203
7.1 Suchmaschinen: Im Alltag unverzichtbar
203
7.1.1 Erfassung
205
7.1.2 Indizierung
206
7.1.3 Bereitstellung
206
7.2 Churn-Rate: Bleib doch noch, lieber Kunde
207
7.3 Recommender Engine: Kunden kauften auch …
212
7.3.1 Inhaltsbasierte Filterung
214
Produktattribute vergleichen
214
Produktbeschreibungen vergleichen
216
7.3.2 Kollaborative Filterung
219
7.4 Face Recognition: Bist Du mein Freund?
220
7.5 Routenplanung: Von A nach B
222
7.6 Disposition: Wie viel soll ich bestellen?
225
7.6.1 Nichtsaisonale Produkte
226
7.6.2 Saisonale Produkte
228
7.7 Fraud Detection: Den Betrügern auf der Spur
229
7.8 Disaster Risk: Naturkatastrophen vorhersagen
235
7.8.1 Was ist ein gutes Vorhersagesystem?
235
7.8.2 Langsame Erdbeben sind besser
237
7.9 Börsenhandel: Ein Milliardengeschäft
238
7.9.1 Technische Analyse: In der Vergangenheit liegt die Zukunft
240
7.9.2 Sentiment-Analyse
242
7.10 Chatbots: Fluch oder Segen für den Kunden
244
Literatur
246
8: Abschluss
249
Stichwortverzeichnis
252
Shop