Schulungsübersicht

Python Grundlagen für DatenAufgaben

  • Installation von Python und Einrichtung der Entwicklungsumgebung
  • Sprachgrundlagen: Variablen, Datentypen, Kontrollstrukturen
  • Schreiben und Ausführen einfacher Python-Skripte

Dateihandling: CSV und Excel

  • Lesen und Schreiben von CSV-Dateien mit dem csv-Modul und Pandas
  • Arbeiten mit Excel-Dateien mit openpyxl/xlrd und Pandas
  • Praktische Übungen: Automatisierung von Dateikonvertierungen

Einführung in Pandas

  • Grundlagen von DataFrames: Erstellung, Indizierung, Selektion und Filterung
  • Aggregations- und Gruppierungsoperationen
  • Häufige Reinigungsoperationen: Fehlende Werte, Duplikate und Typkonvertierungen

Einführung in Polars

  • Polars-Konzepte und Leistungseigenschaften im Vergleich zu Pandas
  • Grundlegende DataFrame-Operationen in Polars
  • Anwendungsfallbeispiel: Wann sollte man Polars anstelle von Pandas wählen?

Fortschrittliche Datenverarbeitung (Mittelstufe)

  • Komplexe Joins, Fensterfunktionen und Pivot-Operationen in Pandas
  • Effiziente Datenverarbeitungsmuster mit Polars
  • Verkettete Operationen und Optimierung des Speicherverbrauchs

Prozessautomatisierung mit Python

  • Schreiben von Skripten zur Automatisierung wiederkehrender Datenprozesse und ETL-Schritte
  • Planen von Skripten mit Betriebssystemplanern oder Aufgabenplannern
  • Protokollierung, Fehlerbehandlung und Benachrichtigungen

Packen von Skripten und Best Practices

  • Erstellen von Ausführbaren mit PyInstaller oder ähnlichen Tools
  • Projektstrukturierung, virtuelle Umgebungen und Abhängigkeitsmanagement
  • Versionskontrolle Grundlagen und Dokumentation von Workflows

Hands-on Miniprojekt

  • End-to-End-Aufgabe: Lesen roher Dateien, Reinigen und Transformieren der Daten, Erstellen von Ausgaben
  • Automatisieren des Workflows und Paketieren als ausführbares Skript oder Programm
  • Bewertung und Verbesserungen auf Basis von Peer-Feedback

Zusammenfassung und Nächste Schritte

Voraussetzungen

  • Grundkenntnisse in Programmierkonzepten oder Bereitschaft zum Lernen
  • Komfort bei der Verwendung der Kommandozeile oder des Terminals für die Paketinstallation
  • Erfahrung im Arbeiten mit Tabellenkalkulationen (CSV/Excel)

Zielgruppe

  • Datenanalysten und Operationsmitarbeiter, die Datenprozesse automatisieren möchten
  • Analytische Ingenieure, die auf leichte ETL-Skripte aus sind
  • Profis, die an praktischen Python-basierten Datenworkflows interessiert sind
 14 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Erfahrungsberichte (5)

Kommende Kurse

Verwandte Kategorien