ai Einsteiger

AI Audio: Sprache verstehen mit Whisper & TTS

Verwandle Sprache in Text und Text in Sprache. Lerne OpenAI Whisper für Transkription und moderne Text-to-Speech Systeme kennen.

Dauer 3 Stunden

Gruppengrösse Max. 6 Teilnehmer

Altersgruppe Ab 12 Jahren

Termine 1 Sessions

AI Audio: Sprache verstehen mit Whisper & TTS

Was du lernst

Verstehen wie Speech-to-Text funktioniert
Whisper lokal installieren und nutzen
Audio-Dateien automatisch transkribieren
Text-to-Speech Systeme kennenlernen
Eigene Sprachprojekte umsetzen

Skills die du entwickelst

Speech-to-Text (Whisper)

Text-to-Speech

Audio Processing

Python Basics

API Integration

Sprache und KI

Sprach-KI ist überall: Siri, Alexa, automatische Untertitel, Voice-Assistenten. In diesem Workshop lernst du die Technologie dahinter.

Was du lernst

Whisper – Speech-to-Text

OpenAIs Whisper ist eines der besten Spracherkennungssysteme:

99 Sprachen unterstützt
Funktioniert komplett offline/lokal
Kostenlos und Open Source
Transkribiert Videos, Podcasts, Meetings

Text-to-Speech (TTS)

Verwandle Text in natürlich klingende Sprache:

Verschiedene Stimmen und Sprachen
Emotionen und Betonungen steuern
Lokale Modelle (Coqui TTS, Piper)
APIs (ElevenLabs, OpenAI TTS)

Workshop-Ablauf

Teil 1: Theorie & Demo (45 Min)

Wie funktioniert Spracherkennung?
Whisper Architektur einfach erklärt
Demo: Live-Transkription
TTS-Vergleich: Welche Stimmen gibt es?

Teil 2: Whisper Hands-on (60 Min)

Installation: Whisper lokal aufsetzen
Transkription:
- Audio-Dateien transkribieren
- YouTube-Videos untertiteln
- Live-Mikrofon Transkription
Sprachen: Deutsch, Englisch, Schweizerdeutsch (!)

Teil 3: Text-to-Speech (45 Min)

Lokale TTS: Piper TTS installieren
Verschiedene Stimmen ausprobieren
SSML: Sprechweise steuern (Pausen, Betonung)
Projekt: Eigenen Voice Assistant bauen

Teil 4: Projekte & Anwendungen (30 Min)

Podcast-Transkription automatisieren
Automatische Untertitel für Videos
Hörbuch-Generator aus Text
Voice-Steuerung für Projekte

Anwendungsbeispiele

Für Schüler:

Vorlesungen automatisch transkribieren
Eigene Hörbücher erstellen
Sprachen lernen mit TTS
Barrierefreie Inhalte erstellen

Für Projekte:

Sprachgesteuerte Roboter
Smart Home Voice Control
Automatische Meeting-Protokolle
Podcast-Bearbeitung

Technische Details

Software:

OpenAI Whisper (lokal)
Piper TTS / Coqui TTS
Python 3.10+
Audacity für Audio-Bearbeitung

Hardware (wird gestellt):

Laptops
USB-Mikrofone
Kopfhörer

Datenschutz

Wir nutzen lokale Modelle:

Keine Cloud-Dienste nötig
Daten bleiben auf dem Gerät
DSGVO-konform
Perfekt für sensible Inhalte

Für Schulen

Lehrplan-Bezüge

Deutsch: Mündliche Kommunikation analysieren
Fremdsprachen: Aussprache und Hörverständnis
Medien & Informatik: Audio-Produktion

Projekt-Ideen

Oral History: Interviews transkribieren
Podcast-Projekt: TTS für Intros/Outros
Barrierefreiheit: Texte vorlesen lassen
Sprachanalyse: Dialekte untersuchen

Preise

Variante	Preis
Schulklasse (bis 12)	CHF 500.- pauschal
Gruppe (6-12 Pers.)	CHF 100.- pro Person
Individuell	CHF 120.- pro Person

Perfekt kombinierbar mit AI Basics und AI Vision für eine komplette AI-Projektwoche!

Voraussetzungen

Grundlegende PC-Kenntnisse

Kurs buchen

Fülle das Formular aus und wir melden uns bei dir mit verfügbaren Terminen!

Zurück zur Kursübersicht