ai Einsteiger
AI Audio: Sprache verstehen mit Whisper & TTS
Verwandle Sprache in Text und Text in Sprache. Lerne OpenAI Whisper für Transkription und moderne Text-to-Speech Systeme kennen.
Dauer 3 Stunden
Gruppengrösse Max. 6 Teilnehmer
Altersgruppe Ab 12 Jahren
Termine 1 Sessions
Was du lernst
- Verstehen wie Speech-to-Text funktioniert
- Whisper lokal installieren und nutzen
- Audio-Dateien automatisch transkribieren
- Text-to-Speech Systeme kennenlernen
- Eigene Sprachprojekte umsetzen
Skills die du entwickelst
Speech-to-Text (Whisper)
Text-to-Speech
Audio Processing
Python Basics
API Integration
Sprache und KI
Sprach-KI ist überall: Siri, Alexa, automatische Untertitel, Voice-Assistenten. In diesem Workshop lernst du die Technologie dahinter.
Was du lernst
Whisper – Speech-to-Text
OpenAIs Whisper ist eines der besten Spracherkennungssysteme:
- 99 Sprachen unterstützt
- Funktioniert komplett offline/lokal
- Kostenlos und Open Source
- Transkribiert Videos, Podcasts, Meetings
Text-to-Speech (TTS)
Verwandle Text in natürlich klingende Sprache:
- Verschiedene Stimmen und Sprachen
- Emotionen und Betonungen steuern
- Lokale Modelle (Coqui TTS, Piper)
- APIs (ElevenLabs, OpenAI TTS)
Workshop-Ablauf
Teil 1: Theorie & Demo (45 Min)
- Wie funktioniert Spracherkennung?
- Whisper Architektur einfach erklärt
- Demo: Live-Transkription
- TTS-Vergleich: Welche Stimmen gibt es?
Teil 2: Whisper Hands-on (60 Min)
- Installation: Whisper lokal aufsetzen
- Transkription:
- Audio-Dateien transkribieren
- YouTube-Videos untertiteln
- Live-Mikrofon Transkription
- Sprachen: Deutsch, Englisch, Schweizerdeutsch (!)
Teil 3: Text-to-Speech (45 Min)
- Lokale TTS: Piper TTS installieren
- Verschiedene Stimmen ausprobieren
- SSML: Sprechweise steuern (Pausen, Betonung)
- Projekt: Eigenen Voice Assistant bauen
Teil 4: Projekte & Anwendungen (30 Min)
- Podcast-Transkription automatisieren
- Automatische Untertitel für Videos
- Hörbuch-Generator aus Text
- Voice-Steuerung für Projekte
Anwendungsbeispiele
Für Schüler:
- Vorlesungen automatisch transkribieren
- Eigene Hörbücher erstellen
- Sprachen lernen mit TTS
- Barrierefreie Inhalte erstellen
Für Projekte:
- Sprachgesteuerte Roboter
- Smart Home Voice Control
- Automatische Meeting-Protokolle
- Podcast-Bearbeitung
Technische Details
Software:
- OpenAI Whisper (lokal)
- Piper TTS / Coqui TTS
- Python 3.10+
- Audacity für Audio-Bearbeitung
Hardware (wird gestellt):
- Laptops
- USB-Mikrofone
- Kopfhörer
Datenschutz
Wir nutzen lokale Modelle:
- Keine Cloud-Dienste nötig
- Daten bleiben auf dem Gerät
- DSGVO-konform
- Perfekt für sensible Inhalte
Für Schulen
Lehrplan-Bezüge
- Deutsch: Mündliche Kommunikation analysieren
- Fremdsprachen: Aussprache und Hörverständnis
- Medien & Informatik: Audio-Produktion
Projekt-Ideen
- Oral History: Interviews transkribieren
- Podcast-Projekt: TTS für Intros/Outros
- Barrierefreiheit: Texte vorlesen lassen
- Sprachanalyse: Dialekte untersuchen
Preise
| Variante | Preis |
|---|---|
| Schulklasse (bis 12) | CHF 500.- pauschal |
| Gruppe (6-12 Pers.) | CHF 100.- pro Person |
| Individuell | CHF 120.- pro Person |
Perfekt kombinierbar mit AI Basics und AI Vision für eine komplette AI-Projektwoche!
Voraussetzungen
- Grundlegende PC-Kenntnisse
Kurs buchen
Fülle das Formular aus und wir melden uns bei dir mit verfügbaren Terminen!