Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Schulungsübersicht
Einführung
- Was ist GPU-Programmierung?
- Warum CUDA mit Python verwenden?
- Wichtige Konzepte: Threads, Blöcke, Gitter
Überblick über CUDA-Funktionen und Architektur
- Vergleich von GPU- und CPU-Architekturen
- Verstehen von SIMT (Single Instruction, Multiple Threads)
- CUDA-Programmiermodell
Aufbau der Entwicklungsumgebung
- Installieren des CUDA-Toolkits und Treiber
- Installieren von Python und Numba
- Aufsetzen und Überprüfen der Umgebung
Grundlagen paralleler Programmierung
- Einführung in die parallele Ausführung
- Verstehen von Threads und Threadhierarchien
- Arbeiten mit Warps und Synchronisation
Arbeiten mit dem Numba-Kompiler
- Einführung in Numba
- CUDA-Kernels mit Numba schreiben
- Verstehen von @cuda.jit-Dekoratoren
Erstellen eines benutzerdefinierten CUDA-Kernels
- Einen grundlegenden Kernel schreiben und starten
- Threads für elementweise Operationen verwenden
- Gitter- und Blockdimensionen verwalten
Speicherverwaltung
- Ausprägungen von GPU-Speicher (global, geteilt, lokal, konstant)
- Datentransfer zwischen Host und Gerät
- Optimierung der Speichernutzung und Vermeidung von Engpässen
Schwerpunkte bei der GPU-Beschleunigung
- Geteilter Speicher und Synchronisation
- Streams für asynchrone Ausführung verwenden
- Grundlagen der Multi-GPU-Programmierung
CPU-basierte Anwendungen in GPU-Anwendungen umwandeln
- CPU-Code profilieren
- Parallelisierbare Abschnitte identifizieren
- Logik auf CUDA-Kernels übertragen
Fehlerbehebung
- CUDA-Anwendungen debuggen
- Häufige Fehler und deren Behebung
- Tools und Techniken für Testen und Validierung
Zusammenfassung und Nächste Schritte
- Aufblick auf die wichtigsten Konzepte
- Bewährte Methoden der GPU-Programmierung
- Ressourcen für fortgesetztes Lernen
Voraussetzungen
- Erfahrung im Python-Programmieren
- Erfahrung mit NumPy (ndarrays, ufuncs usw.)
Zielgruppe
- Entwickler
14 Stunden
Erfahrungsberichte (1)
Sehr interaktiv mit verschiedenen Beispielen, mit einer guten Progression in der Komplexität zwischen dem Beginn und dem Ende des Trainings.
Jenny - Andheo
Kurs - GPU Programming with CUDA and Python
Maschinelle Übersetzung