Schulungsübersicht
Einführung
- Der Data Science Prozess
- Rollen und Verantwortlichkeiten eines Data Scientists
Vorbereitung der Entwicklungsumgebung
- Bibliotheken, Frameworks, Sprachen und Tools
- Lokale Entwicklung
- Webbasierte kollaborative Entwicklung
Datenbeschaffung
-
Verschiedene Arten von Daten
-
Strukturiert
- Lokale Datenbanken
- Datenbankconnectoren
- Gängige Formate: xlxs, XML, Json, csv, ...
-
Unstrukturiert
- Klicks, Sensoren, Smartphones
- APIs
- Internet der Dinge (IoT)
- Dokumente, Bilder, Videos, Sounds
-
Strukturiert
- Fallstudie: Kontinuierliche Sammlung großer Mengen an unstrukturierten Daten
Datenspeicherung
- Relationale Datenbanken
- Nicht-relationale Datenbanken
- Hadoop: Distributed File System (HDFS)
- Spark: Resilient Distributed Dataset (RDD)
- Cloud-Speicher
Datenvorbereitung
- Erfassung, Auswahl, Reinigung und Transformation
- Sicherstellung der Datenqualität - Korrektheit, Sinnhaftigkeit und Sicherheit
- Ausnahmeverwaltung
Sprachen zur Vorbereitung, Verarbeitung und Analyse
-
R-Sprache
- Einführung in R
- Datenmanipulation, Berechnungen und grafische Darstellungen
-
Python
- Einführung in Python
- Manipulation, Verarbeitung, Reinigung und Analyse von Daten
Datenanalyse
-
Explorative Analyse
- Grundlegende Statistik
- Vorläufige Visualisierungen
- Verstehen der Daten
- Kausalität
- Features und Transformationen
-
Maschinelles Lernen
- Überwacht vs. nicht überwacht
- Wann welche Modelle verwendet werden
- Natural Language Processing (NLP)
Datenvisualisierung
- Best Practices
- Wahl der richtigen Darstellung für die Daten
- Farbpaletten
-
Erweiterung der Visualisierungen
- Dashboards
- Interaktive Visualisierungen
- Storytelling mit Daten
Zusammenfassung und Fazit
Voraussetzungen
- Grundlegendes Verständnis von Datenbankkonzepten
- Grundkenntnisse in Statistik
Erfahrungsberichte (4)
Ich mochte Pablos Stil und die Tatsache, dass er viele Themen behandelte, von der Gestaltung von Berichten über die Anpassung mit HTML bis hin zur Implementierung einfacher ML-Algortithmen. Good Gleichgewicht theoretische Informationen / Übungen. Pablo deckte wirklich alle Themen ab, die mich interessierten, und gab umfassende Antworten auf meine Fragen.
Cristian Tudose - SC Automobile Dacia SA
Kurs - Advanced Data Analysis with TIBCO Spotfire
Maschinelle Übersetzung
Tatsächliche Anwendung von Spotfire und alle grundlegenden Funktionen.
Michael Capili - STMicroelectronics, Inc.
Kurs - Introduction to Spotfire
Maschinelle Übersetzung
Wirklichkeitswissen von jemandem aus der Branche
Matthew Cerbas - Shield Consulting Solutions, Inc.
Kurs - Grafana
Maschinelle Übersetzung
Ich habe die vielen Laboreinheiten und Übungen wirklich genossen.
Vivian Feng - Destination Canada
Kurs - Data Analysis with SQL, Python and Spotfire
Maschinelle Übersetzung