Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Schulungsübersicht
Detailliertes Schulungsprogramm
- Einführung in NLP
- Verstehen von NLP
- NLP-Frameworks
- Kommerzielle Anwendungen von NLP
- Datenbeschaffung aus dem Web
- Arbeit mit verschiedenen APIs zur Abfrage von Textdaten
- Arbeit und Speicherung von Textkorpora unter Wahrung von Inhalten und relevanten Metadaten
- Vorteile der Nutzung von Python und Knappkurs zu NLTK
- Praktisches Verständnis eines Korpus und Datensatzes
- Warum benötigen wir einen Korpus?
- Korpusanalyse
- Arten von Dateneigenschaften
- Unterschiedliche Dateiformate für Korpora
- Vorbereitung eines Datensatzes für NLP-Anwendungen
- Verstehen der Satzstruktur
- Komponenten von NLP
- Verständnis natürlicher Sprache
- Morphologische Analyse – Stammwort, Wort, Token, Satzgliedtags
- Syntaktische Analyse
- Semantische Analyse
- Umgang mit Ambiguität
- Vorverarbeitung von Textdaten
- Korpus – Rohtext
- Satz-Tokenisierung
- Stemming für Rohtext
- Lemmatisierung von Rohtext
- Entfernung von Stoppwörtern
- Korpus – rohe Sätze
- Wort-Tokenisierung
- Wort-Lemmatisierung
- Arbeit mit Term-Dokument- / Dokument-Term-Matrizen
- Tokenisierung von Text in N-Gramme und Sätze
- Praktische und maßgeschneiderte Vorverarbeitung
- Korpus – Rohtext
- Analyse von Textdaten
- Grundlegende Funktionen von NLP
- Parser und Parsing
- POS-Tagging und Tagging-Tools
- Erkennen von Named Entities
- N-Gramme
- Bag-of-Words-Modell
- Statistische Merkmale von NLP
- Konzepte der linearen Algebra für NLP
- Wahrscheinlichkeitstheorie für NLP
- TF-IDF
- Vektorisierung
- Encoder und Decoder
- Normalisierung
- Wahrscheinlichkeitsmodelle
- Erweiterte Merkmalsentwicklung und NLP
- Grundlagen von word2vec
- Komponenten des word2vec-Modells
- Logik des word2vec-Modells
- Erweiterung des word2vec-Konzepts
- Anwendung des word2vec-Modells
- Studienfall: Anwendung des Bag-of-Words-Modells – automatische Textzusammenfassung mittels vereinfachtem und originalen Luhn-Algorithmus
- Grundlegende Funktionen von NLP
- Dokumentenclustering, Klassifikation und Topic Modeling
- Dokumentenclustering und Mustererkennung (hierarchisches Clustering, k-Means, Clustering usw.)
- Vergleich und Klassifikation von Dokumenten unter Verwendung von TFIDF, Jaccard-Index und Cosinus-Abstandsmaßen
- Dokumentenklassifikation mittels Naiver Bayes und Maximum-Entropy-Modell
- Identifizierung wichtiger Textelemente
- Dimensionsreduktion: Hauptkomponentenanalyse, Singulärwertzerlegung (SVD), nicht-negative Matrixfaktorierung
- Topic Modeling und Information Retrieval mittels Latent Semantic Analysis
- Entnahme von Entitäten, Sentiment-Analyse und erweitertes Topic Modeling
- Positiv versus Negativ: Grad der Sentiment
- Item Response Theory
- POS-Tagging und dessen Anwendung: Identifizierung von Personen, Orten und Organisationen im Text
- Erweitertes Topic Modeling: Latent Dirichlet Allocation
- Fallstudien
- Extrahieren von Mustern aus unstrukturierten Kundenbewertungen
- Sentiment-Klassifikation und Visualisierung von Produktdaten
- Analyse von Suchverläufen zur Mustererkennung
- Textklassifikation
- Topic Modeling
Voraussetzungen
Kenntnisse und Verständnis der NLP-Grundprinzipien sowie ein Bewusstsein für die Anwendung von KI im Geschäftskontext
21 Stunden
Erfahrungsberichte (1)
Individuelle Unterstützung
Simon the 2nd - Cboost
Kurs - ROS: Programming for Robotics
Maschinelle Übersetzung