Schulungsübersicht

Einführung

  • Verstehen der Bedeutung der Daten-Vorbereitung in der Analyse und beim maschinellen Lernen
  • Daten-Vorbereitungs-Pipeline und ihre Rolle im Datenlebenszyklus
  • Erforschung üblicher Herausforderungen in Rohdaten und deren Auswirkungen auf die Analyse

Datensammlung und -erfassung

  • Datenquellen: Datenbanken, APIs, Tabellenkalkulationen, Textdateien und mehr
  • Techniken zur Datensammlung und Sicherstellung der Datenqualität während der Sammlung
  • Datensammlung aus verschiedenen Quellen

Datenbereinigungstechniken

  • Identifizierung und Bearbeitung von fehlenden Werten, Ausreißern und Inkonsistenzen
  • Behandlung von Duplikaten und Fehlern im Datensatz
  • Bereinigen realer Datensätze

Datentransformation und -standardisierung

  • Techniken zur Datennormalisierung und -standardisierung
  • Behandlung kategorischer Daten: Kodierung, Binning und Feature Engineering
  • Transformieren von Rohdaten in nutzbare Formate

Datenintegration und -aggregation

  • Zusammenführen und Kombinieren von Datensätzen aus verschiedenen Quellen
  • Lösen von Datenkonflikten und Ausrichtung der Datentypen
  • Techniken zur Datenaggregation und -konsolidierung

Datenqualitätssicherung

  • Methoden zur Sicherstellung der Datenqualität und Integrität während des gesamten Prozesses
  • Implementieren von Qualitätsprüfungen und Validierungsverfahren
  • Fallstudien und praktische Anwendungen der Datenqualitätssicherung

Dimensionsreduktion und Feature Selection

  • Verstehen des Bedarfs an Dimensionsreduktion
  • Techniken wie PCA, Feature Selection und Reduktionsstrategien
  • Implementieren von Techniken zur Dimensionsreduktion

Zusammenfassung und Nächste Schritte

Voraussetzungen

  • Grundlegendes Verständnis von Datenkonzepten

Zielgruppe

  • Datenanalysten
  • Datenbankadministratoren
  • IT-Professionals
 14 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Erfahrungsberichte (2)

Kommende Kurse

Verwandte Kategorien