Kontakt aufnehmen

Schulungsübersicht

Detailliertes Schulungsprogramm

  1. Einführung in NLP
    • Verstehen von NLP
    • NLP-Frameworks
    • Kommerzielle Anwendungen von NLP
    • Datenbeschaffung aus dem Web
    • Arbeit mit verschiedenen APIs zur Abfrage von Textdaten
    • Arbeit und Speicherung von Textkorpora unter Wahrung von Inhalten und relevanten Metadaten
    • Vorteile der Nutzung von Python und Knappkurs zu NLTK
  2. Praktisches Verständnis eines Korpus und Datensatzes
    • Warum benötigen wir einen Korpus?
    • Korpusanalyse
    • Arten von Dateneigenschaften
    • Unterschiedliche Dateiformate für Korpora
    • Vorbereitung eines Datensatzes für NLP-Anwendungen
  3. Verstehen der Satzstruktur
    • Komponenten von NLP
    • Verständnis natürlicher Sprache
    • Morphologische Analyse – Stammwort, Wort, Token, Satzgliedtags
    • Syntaktische Analyse
    • Semantische Analyse
    • Umgang mit Ambiguität
  4. Vorverarbeitung von Textdaten
    • Korpus – Rohtext
      • Satz-Tokenisierung
      • Stemming für Rohtext
      • Lemmatisierung von Rohtext
      • Entfernung von Stoppwörtern
    • Korpus – rohe Sätze
      • Wort-Tokenisierung
      • Wort-Lemmatisierung
    • Arbeit mit Term-Dokument- / Dokument-Term-Matrizen
    • Tokenisierung von Text in N-Gramme und Sätze
    • Praktische und maßgeschneiderte Vorverarbeitung
  5. Analyse von Textdaten
    • Grundlegende Funktionen von NLP
      • Parser und Parsing
      • POS-Tagging und Tagging-Tools
      • Erkennen von Named Entities
      • N-Gramme
      • Bag-of-Words-Modell
    • Statistische Merkmale von NLP
      • Konzepte der linearen Algebra für NLP
      • Wahrscheinlichkeitstheorie für NLP
      • TF-IDF
      • Vektorisierung
      • Encoder und Decoder
      • Normalisierung
      • Wahrscheinlichkeitsmodelle
    • Erweiterte Merkmalsentwicklung und NLP
      • Grundlagen von word2vec
      • Komponenten des word2vec-Modells
      • Logik des word2vec-Modells
      • Erweiterung des word2vec-Konzepts
      • Anwendung des word2vec-Modells
    • Studienfall: Anwendung des Bag-of-Words-Modells – automatische Textzusammenfassung mittels vereinfachtem und originalen Luhn-Algorithmus
  6. Dokumentenclustering, Klassifikation und Topic Modeling
    • Dokumentenclustering und Mustererkennung (hierarchisches Clustering, k-Means, Clustering usw.)
    • Vergleich und Klassifikation von Dokumenten unter Verwendung von TFIDF, Jaccard-Index und Cosinus-Abstandsmaßen
    • Dokumentenklassifikation mittels Naiver Bayes und Maximum-Entropy-Modell
  7. Identifizierung wichtiger Textelemente
    • Dimensionsreduktion: Hauptkomponentenanalyse, Singulärwertzerlegung (SVD), nicht-negative Matrixfaktorierung
    • Topic Modeling und Information Retrieval mittels Latent Semantic Analysis
  8. Entnahme von Entitäten, Sentiment-Analyse und erweitertes Topic Modeling
    • Positiv versus Negativ: Grad der Sentiment
    • Item Response Theory
    • POS-Tagging und dessen Anwendung: Identifizierung von Personen, Orten und Organisationen im Text
    • Erweitertes Topic Modeling: Latent Dirichlet Allocation
  9. Fallstudien
    • Extrahieren von Mustern aus unstrukturierten Kundenbewertungen
    • Sentiment-Klassifikation und Visualisierung von Produktdaten
    • Analyse von Suchverläufen zur Mustererkennung
    • Textklassifikation
    • Topic Modeling

Voraussetzungen

Kenntnisse und Verständnis der NLP-Grundprinzipien sowie ein Bewusstsein für die Anwendung von KI im Geschäftskontext

 21 Stunden

Teilnehmerzahl


Preis je Teilnehmer (exkl. USt)

Erfahrungsberichte (1)

Kommende Kurse

Verwandte Kategorien