Skip to main content
Kontakt
ai Einsteiger

AI Audio: Sprache verstehen mit Whisper & TTS

Verwandle Sprache in Text und Text in Sprache. Lerne OpenAI Whisper für Transkription und moderne Text-to-Speech Systeme kennen.

Dauer 3 Stunden
Gruppengrösse Max. 6 Teilnehmer
Altersgruppe Ab 12 Jahren
Termine 1 Sessions
AI Audio: Sprache verstehen mit Whisper & TTS

Was du lernst

  • Verstehen wie Speech-to-Text funktioniert
  • Whisper lokal installieren und nutzen
  • Audio-Dateien automatisch transkribieren
  • Text-to-Speech Systeme kennenlernen
  • Eigene Sprachprojekte umsetzen

Skills die du entwickelst

Speech-to-Text (Whisper)
Text-to-Speech
Audio Processing
Python Basics
API Integration

Sprache und KI

Sprach-KI ist überall: Siri, Alexa, automatische Untertitel, Voice-Assistenten. In diesem Workshop lernst du die Technologie dahinter.

Was du lernst

Whisper – Speech-to-Text

OpenAIs Whisper ist eines der besten Spracherkennungssysteme:

  • 99 Sprachen unterstützt
  • Funktioniert komplett offline/lokal
  • Kostenlos und Open Source
  • Transkribiert Videos, Podcasts, Meetings

Text-to-Speech (TTS)

Verwandle Text in natürlich klingende Sprache:

  • Verschiedene Stimmen und Sprachen
  • Emotionen und Betonungen steuern
  • Lokale Modelle (Coqui TTS, Piper)
  • APIs (ElevenLabs, OpenAI TTS)

Workshop-Ablauf

Teil 1: Theorie & Demo (45 Min)

  • Wie funktioniert Spracherkennung?
  • Whisper Architektur einfach erklärt
  • Demo: Live-Transkription
  • TTS-Vergleich: Welche Stimmen gibt es?

Teil 2: Whisper Hands-on (60 Min)

  • Installation: Whisper lokal aufsetzen
  • Transkription:
    • Audio-Dateien transkribieren
    • YouTube-Videos untertiteln
    • Live-Mikrofon Transkription
  • Sprachen: Deutsch, Englisch, Schweizerdeutsch (!)

Teil 3: Text-to-Speech (45 Min)

  • Lokale TTS: Piper TTS installieren
  • Verschiedene Stimmen ausprobieren
  • SSML: Sprechweise steuern (Pausen, Betonung)
  • Projekt: Eigenen Voice Assistant bauen

Teil 4: Projekte & Anwendungen (30 Min)

  • Podcast-Transkription automatisieren
  • Automatische Untertitel für Videos
  • Hörbuch-Generator aus Text
  • Voice-Steuerung für Projekte

Anwendungsbeispiele

Für Schüler:

  • Vorlesungen automatisch transkribieren
  • Eigene Hörbücher erstellen
  • Sprachen lernen mit TTS
  • Barrierefreie Inhalte erstellen

Für Projekte:

  • Sprachgesteuerte Roboter
  • Smart Home Voice Control
  • Automatische Meeting-Protokolle
  • Podcast-Bearbeitung

Technische Details

Software:

  • OpenAI Whisper (lokal)
  • Piper TTS / Coqui TTS
  • Python 3.10+
  • Audacity für Audio-Bearbeitung

Hardware (wird gestellt):

  • Laptops
  • USB-Mikrofone
  • Kopfhörer

Datenschutz

Wir nutzen lokale Modelle:

  • Keine Cloud-Dienste nötig
  • Daten bleiben auf dem Gerät
  • DSGVO-konform
  • Perfekt für sensible Inhalte

Für Schulen

Lehrplan-Bezüge

  • Deutsch: Mündliche Kommunikation analysieren
  • Fremdsprachen: Aussprache und Hörverständnis
  • Medien & Informatik: Audio-Produktion

Projekt-Ideen

  • Oral History: Interviews transkribieren
  • Podcast-Projekt: TTS für Intros/Outros
  • Barrierefreiheit: Texte vorlesen lassen
  • Sprachanalyse: Dialekte untersuchen

Preise

VariantePreis
Schulklasse (bis 12)CHF 500.- pauschal
Gruppe (6-12 Pers.)CHF 100.- pro Person
IndividuellCHF 120.- pro Person

Perfekt kombinierbar mit AI Basics und AI Vision für eine komplette AI-Projektwoche!

Voraussetzungen

  • Grundlegende PC-Kenntnisse

Kurs buchen

Fülle das Formular aus und wir melden uns bei dir mit verfügbaren Terminen!

* Mit dem Absenden des Formulars stimmst du unserer Datenschutzerklärung zu.

Zurück zur Kursübersicht