GPU-Programmierung - OpenCL vs. CUDA vs. ROCm Schulung

GPU-Programmierung ist eine Technik, die die parallele Verarbeitungsleistung von GPUs nutzt, um Anwendungen zu beschleunigen, die leistungsstarke Berechnungen erfordern, wie künstliche Intelligenz, Spiele, Grafiken und wissenschaftliches Rechnen. Es gibt mehrere Frameworks, die GPU-Programmierung ermöglichen, jedes mit eigenen Vor- und Nachteilen. OpenCL ist ein offener Standard, der zum Programmieren von CPUs, GPUs und anderen Geräten verschiedener Hersteller verwendet werden kann, während CUDA spezifisch für NVIDIA-GPUs ist. ROCm ist eine Plattform, die GPU-Programmierung auf AMD-GPUs unterstützt und auch mit CUDA und OpenCL kompatibel ist.

Diese von einem Dozenten geleitete Live-Schulung (online oder vor Ort) richtet sich an Entwickler im Anfänger- bis Mittelstufenbereich, die verschiedene Frameworks für GPU-Programmierung verwenden und ihre Eigenschaften, Leistung und Kompatibilität vergleichen möchten.

Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:

Eine Entwicklumgebung einzurichten, die das OpenCL SDK, CUDA Toolkit, ROCm-Plattform, ein Gerät, das OpenCL, CUDA oder ROCm unterstützt, und Visual Studio Code umfasst.
Ein grundlegendes GPU-Programm zu erstellen, das Vektorsummen mit OpenCL, CUDA und ROCm ausführt, und die Syntax, Struktur und Ausführung jedes Frameworks zu vergleichen.
Die jeweiligen APIs zu verwenden, um Geräteinformationen abzufragen, Gerätespeicher zuzuweisen und freizugeben, Daten zwischen Host und Gerät zu kopieren, Kerne zu starten und Threads zu synchronisieren.
Die jeweiligen Sprachen zu verwenden, um Kerne zu schreiben, die auf dem Gerät ausgeführt werden und Daten manipulieren.
Die jeweils integrierten Funktionen, Variablen und Bibliotheken zu verwenden, um übliche Aufgaben und Operationen durchzuführen.
Die jeweiligen Speicherbereiche wie global, lokal, konstant und privat zu verwenden, um Datenübertragungen und Speicherzugriffe zu optimieren.
Die jeweiligen Ausführungsmodelle zu verwenden, um die Threads, Blöcke und Gitter zu steuern, die die Parallelität definieren.
GPU-Programme mit Werkzeugen wie CodeXL, CUDA-GDB, CUDA-MEMCHECK und NVIDIA Nsight zu debuggen und zu testen.
GPU-Programme unter Verwendung von Techniken wie Konsolidierung, Zwischenspeicherung, Vorausladen und Profiling zu optimieren.

Kursformat

Interaktiver Vortrag und Diskussion.
Viel Übung und Praxis.
Hands-on-Implementierung in einer Live-Lab-Umgebung.

Kursanpassungsoptionen

Um einen angepassten Kurs anzufordern, kontaktieren Sie uns bitte, um eine Anpassung vorzunehmen.

Hannover

6944 EUR (Online)

7744 EUR (Schulungsraum)

GPU-Programmierung - OpenCL vs. CUDA vs. ROCm Schulung

Schulungsübersicht

Voraussetzungen

Kommende Kurse

GPU-Programmierung - OpenCL vs. CUDA vs. ROCm

GPU-Programmierung - OpenCL vs. CUDA vs. ROCm

GPU-Programmierung - OpenCL vs. CUDA vs. ROCm

GPU-Programmierung - OpenCL vs. CUDA vs. ROCm

GPU-Programmierung - OpenCL vs. CUDA vs. ROCm

Verwandte Kategorien

Diese Seite in anderen Ländern/Regionen

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

GPU-Programmierung - OpenCL vs. CUDA vs. ROCm Schulung

Schulungsübersicht

Voraussetzungen

Kommende Kurse

GPU-Programmierung - OpenCL vs. CUDA vs. ROCm

GPU-Programmierung - OpenCL vs. CUDA vs. ROCm

GPU-Programmierung - OpenCL vs. CUDA vs. ROCm

GPU-Programmierung - OpenCL vs. CUDA vs. ROCm

GPU-Programmierung - OpenCL vs. CUDA vs. ROCm

Kombinierte Kurse

Entwicklung von AI-Anwendungen mit Huawei Ascend und CANN

Deploying AI Models mit CANN und Ascend AI-Prozessoren

GPU Programming auf Biren AI Accelerators

Cambricon MLU Development with BANGPy and Neuware

Einführung in CANN für AI-Framework-Entwickler

CANN für Edge AI Deployment

Verständnis des AI-Bereichs von Huawei: Von CANN bis MindSpore

Optimierung der Leistung von Neuronalen Netzen mit CANN SDK

CANN SDK für Computer Vision und NLP-Pipelines

Erstellen benutzerdefinierter AI-Operatoren mit CANN TIK und TVM

Migration von CUDA-Anwendungen zu chinesischen GPU-Architekturen

Performance Optimization on Ascend, Biren, and Cambricon

Verwandte Kategorien

GPU

Diese Seite in anderen Ländern/Regionen

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites