Home Assistant Sprachsteuerung im Vergleich (2026)
Home Assistant per Sprache steuern: Assist, Alexa, Google Home und lokale ESP32-Sprachsatelliten im Vergleich. Setup-Anleitungen und Tipps.
Affiliate-Hinweis: Einige Links in diesem Artikel sind Affiliate-Links. Beim Kauf über diese Links erhalten wir eine kleine Provision — für dich ändert sich am Preis nichts.
Licht an per Zuruf, Heizung runter vom Sofa aus, Garagentor öffnen ohne die Hände aus den Taschen zu nehmen — Sprachsteuerung ist das Feature, das ein Smart Home erst richtig smart macht. Und Home Assistant bietet gleich mehrere Wege, genau das umzusetzen.
Aber welche Option ist die richtige? Alexa, Google, das hauseigene Assist oder ein selbstgebauter Sprachsatellit mit ESP32? In diesem Artikel vergleichen wir alle relevanten Möglichkeiten, zeigen dir Schritt für Schritt die Einrichtung und helfen dir, die richtige Lösung für dein Setup zu finden.
Welche Optionen gibt es?
Bevor wir ins Detail gehen, hier der Überblick über die vier Hauptwege zur Sprachsteuerung in Home Assistant:
| Methode | Cloud-frei | Kosten | Einrichtung | Sprachqualität |
|---|---|---|---|---|
| Home Assistant Assist | ✅ Ja | Kostenlos | Mittel | Gut (mit Whisper/Piper) |
| Amazon Alexa | ❌ Nein | Echo-Gerät + ggf. Nabu Casa | Aufwendig | Sehr gut |
| Google Assistant | ❌ Nein | Nest-Gerät + ggf. Nabu Casa | Aufwendig | Sehr gut |
| Lokaler Sprachsatellit | ✅ Ja | ~15–30 € Hardware | Fortgeschritten | Gut |
Home Assistant Assist — der hauseigene Sprachassistent
Assist ist Home Assistants eigener Sprachassistent. Seit 2023 fest eingebaut, komplett lokal und ohne Cloud. Das ist der Weg für alle, die ihre Daten bei sich behalten wollen — und trotzdem nicht auf Sprachsteuerung verzichten möchten.
Was Assist kann
Assist versteht natürliche Sprache und setzt Befehle direkt in Home-Assistant-Aktionen um. „Schalte das Licht im Wohnzimmer an”, „Wie warm ist es draußen?” oder „Stelle die Heizung auf 21 Grad” — das funktioniert zuverlässig, solange die Geräte sauber benannt sind.
Die Verarbeitung läuft über eine Assist-Pipeline mit drei Bausteinen:
- Speech-to-Text (STT): Wandelt gesprochene Sprache in Text um
- Conversation Agent: Versteht den Text und leitet die passende Aktion ab
- Text-to-Speech (TTS): Spricht die Antwort zurück
Assist einrichten — Schritt für Schritt
1. Whisper installieren (Sprache zu Text)
Whisper ist ein Open-Source-Spracherkennungsmodell von OpenAI, das komplett lokal läuft. In Home Assistant installierst du es als App:
- Gehe zu Einstellungen → Apps → App Store
- Suche nach Whisper und installiere es
- In der Konfiguration: Modell auf
tiny-int8setzen (reicht für die meisten Systeme) und Sprache aufde - App starten
# Whisper App-Konfiguration
language: de
model: tiny-int8
beam_size: 5
Für leistungsstärkere Systeme (Proxmox mit dedizierter CPU, NUC o. Ä.) kannst du auch base-int8 oder small-int8 verwenden — bessere Erkennung, aber mehr Rechenleistung nötig.
2. Piper installieren (Text zu Sprache)
Piper ist die TTS-Komponente — sie gibt deinem Smart Home eine Stimme:
- Im App Store nach Piper suchen und installieren
- Deutsche Stimme auswählen:
de_DE-thorsten-mediumklingt natürlich und braucht wenig Ressourcen - App starten
3. Assist-Pipeline konfigurieren
- Gehe zu Einstellungen → Sprachassistenten
- Erstelle eine neue Pipeline oder bearbeite die Standard-Pipeline
- Setze die Sprache auf Deutsch
- Wähle bei Sprache-zu-Text den Whisper-Dienst aus
- Bei Text-zu-Sprache den Piper-Dienst
- Speichern — fertig
Jetzt kannst du über die Home-Assistant-App (Mikrofon-Symbol) oder den Browser per Sprache steuern. Für Sprachsteuerung über den Browser brauchst du allerdings eine HTTPS-Verbindung.
Tipp: Entitäten sauber benennen
Assist versteht Befehle nur so gut wie deine Geräte benannt sind. „Schalte light.0x00158d000abcdef an” versteht niemand — auch Assist nicht. Benenne deine Entitäten mit Klarnamen und weise sie Räumen zu. Dann klappt „Licht im Bad an” auf Anhieb.
Amazon Alexa mit Home Assistant verbinden
Alexa ist der Platzhirsch bei der Sprachsteuerung. Die Spracherkennung ist exzellent, das Ökosystem riesig — aber alles läuft über Amazons Cloud. Wenn dich das nicht stört, bekommst du eine extrem zuverlässige Lösung.
Der einfache Weg: Nabu Casa
Die mit Abstand einfachste Methode ist Home Assistant Cloud (Nabu Casa) für ca. 78 €/Jahr (6,50 $/Monat). Der Dienst erstellt automatisch eine sichere Verbindung zwischen Home Assistant und Alexa — ohne Portfreigaben, ohne Lambda-Funktionen, ohne Kopfschmerzen.
- In Home Assistant: Einstellungen → Home Assistant Cloud → Abonnieren
- Account erstellen und bezahlen
- Unter Alexa die gewünschten Entitäten freigeben
- In der Alexa-App: Mehr → Skills → Home Assistant → Aktivieren → Konto verknüpfen
- „Alexa, suche Geräte” — fertig
Der manuelle Weg: Alexa Smart Home Skill
Wer kein Abo will, kann den Alexa-Skill auch selbst hosten. Das erfordert allerdings einiges an Setup:
Voraussetzungen:
- Home Assistant von außen per HTTPS erreichbar (z. B. über DuckDNS)
- Amazon Developer Account
- AWS-Konto für eine Lambda-Funktion
Kurzfassung der Einrichtung:
- In der Alexa Developer Console einen neuen Smart Home Skill erstellen (Sprache: Deutsch)
- Eine AWS Lambda-Funktion anlegen (Region: EU Ireland), die Anfragen an deine Home-Assistant-URL weiterleitet
- Account Linking konfigurieren mit deiner HA-URL für Authorization und Token-Endpoint
- In Home Assistant die
alexa-Integration in derconfiguration.yamlaktivieren - Entitäten freigeben und Skill in der Alexa-App verknüpfen
Das ist deutlich mehr Aufwand — und du musst die Infrastruktur selbst pflegen. Für die meisten Nutzer ist Nabu Casa die bessere Wahl.
Hardware-Empfehlung
Der Amazon Echo Dot (5. Generation) ist der günstigste Einstieg in die Alexa-Welt. Kompakt, klingt ordentlich und reicht für die Sprachsteuerung völlig aus. Wer besseren Sound will, greift zum Echo (4. Gen) oder Echo Studio.
Google Assistant mit Home Assistant verbinden
Google Assistant ist die zweite große Cloud-Option. Die Spracherkennung ist mindestens auf Alexa-Niveau, die Integration mit Google-Diensten (Kalender, Routinen) ist nativer — aber die Einrichtung mit Home Assistant ist etwas hakelig.
Der einfache Weg: Nabu Casa
Auch hier gilt: Nabu Casa macht das Leben deutlich einfacher.
- In Home Assistant Cloud unter Google Assistant die Entitäten freigeben
- In der Google Home App: Gerät hinzufügen → Kompatibel mit Google → Home Assistant suchen
- Konto verknüpfen — das war’s
Der manuelle Weg: Google Cloud Projekt
Ohne Nabu Casa musst du ein Google Cloud Projekt anlegen:
- In der Google Cloud Console ein neues Projekt erstellen
- Die HomeGraph API aktivieren
- Ein Dienstkonto erstellen und die JSON-Datei herunterladen
- Die JSON-Datei in den Home-Assistant-Config-Ordner legen
- In der
configuration.yamlkonfigurieren:
google_assistant:
project_id: "dein-projekt-id"
service_account: !include SERVICE_ACCOUNT.json
report_state: true
exposed_domains:
- light
- switch
- climate
- cover
- fan
- Home Assistant neu starten und in der Google Home App verknüpfen
Hardware-Empfehlung
Der Google Nest Mini (2. Generation) ist das Pendant zum Echo Dot — klein, günstig und reicht für reine Sprachsteuerung locker. Wer ein Display will, schaut sich den Nest Hub an.
Lokale Sprachsatelliten — die DIY-Lösung
Hier wird es richtig interessant für Bastler: Du kannst mit einem ESP32-S3 und ein paar Komponenten deinen eigenen Sprachsatelliten bauen. Der Satellit nimmt Sprache auf, schickt sie an Home Assistant (lokal!) und spielt die Antwort ab. Keine Cloud, keine Abos, komplette Kontrolle.
Das Wyoming-Protokoll
Die Brücke zwischen ESP32 und Home Assistant heißt Wyoming. Es ist ein simples Protokoll, das Sprachsatelliten mit der Assist-Pipeline verbindet. Die Wyoming-Integration wird automatisch erkannt, sobald Whisper und Piper als Apps laufen.
Fertiglösung: M5Stack Atom Echo
Der einfachste Einstieg ist der M5Stack Atom Echo — ein winziger ESP32-basierter Lautsprecher mit Mikrofon für rund 15 €. Auf Amazon.de schwer zu bekommen, aber über m5stack.com oder berrybase.de erhältlich.
Einrichtung:
- Atom Echo per USB-C an den Computer anschließen
- Im Browser (Chrome/Edge) die ESPHome Web-Flasher öffnen
- Firmware „Voice Assistant” flashen
- WLAN konfigurieren
- In Home Assistant taucht der Satellit automatisch unter Einstellungen → Geräte auf
- Dem gewünschten Raum zuweisen — fertig
Der Sound ist für Sprachausgabe okay, für Musik nicht zu gebrauchen. Aber als Sprachsatellit in jedem Raum? Perfekt.
DIY-Satellit mit ESP32-S3
Wer mehr Kontrolle will, baut sich einen eigenen Satelliten. Dafür brauchst du:
- Waveshare ESP32-S3 AI Speaker Dev Board (~25 €)
- Einen kleinen Lautsprecher (3W, 4Ω)
- USB-C-Kabel und Netzteil
ESPHome-Konfiguration:
esphome:
name: voice-satellite-kueche
esp32:
board: esp32-s3-devkitc-1
framework:
type: esp-idf
wifi:
ssid: "DeinWLAN"
password: "DeinPasswort"
api:
i2s_audio:
id: i2s_shared
microphone:
- platform: i2s_audio
id: mic
i2s_din_pin: GPIO4
adc_type: external
sample_rate: 16000
speaker:
- platform: i2s_audio
id: spk
i2s_dout_pin: GPIO8
dac_type: external
sample_rate: 16000
voice_assistant:
id: va
microphone: mic
speaker: spk
use_wake_word: true
noise_suppression_level: 2
auto_gain: 31dBFS
volume_multiplier: 2.0
Diese Konfiguration über das ESPHome-Dashboard flashen, und der Satellit verbindet sich automatisch mit Home Assistant.
Fertiglösung: ESP32-S3-BOX-3
Wer nicht löten will aber trotzdem lokal bleiben möchte: Die ESP32-S3-BOX-3 von Espressif (~75 €, erhältlich bei berrybase.de) kommt mit Touchscreen, Mikrofonen, Lautsprecher und Gehäuse. Einfach per USB-C flashen und einrichten — ein vollwertiger lokaler Sprachsatellit ohne Bastelei.
Home Assistant Voice Preview Edition
Home Assistant hat mit der Voice Preview Edition (Voice PE) auch eigene Hardware auf den Markt gebracht. Das Gerät basiert auf einem ESP32-S3 mit XMOS-Audioprozessor für bessere Spracherfassung und kostet rund 59 €. Es ist über den Home Assistant Shop erhältlich und speziell für die Assist-Pipeline optimiert.
Der große Vergleich — welche Lösung passt zu dir?
Spracherkennung
Alexa und Google haben hier klar die Nase vorn — sie verstehen auch undeutliche Sprache, Dialekte und komplexe Sätze besser. Whisper (lokal) ist beeindruckend gut, aber bei Hintergrundgeräuschen oder starkem Akzent erreicht es nicht ganz das Cloud-Niveau.
Privatsphäre
Assist mit lokalen Satelliten: 100 % lokal, keine Daten verlassen dein Netzwerk. Bei Alexa und Google geht jeder Sprachbefehl über die Cloud. Wer Datenschutz ernst nimmt, hat hier einen klaren Gewinner.
Funktionsumfang
Alexa und Google können deutlich mehr als nur Smart Home: Musik, Timer, Einkaufslisten, Wissensfragen, Skills/Actions. Assist fokussiert sich auf die Gerätesteuerung in Home Assistant — das macht es gut, aber darüber hinaus ist das Feature-Set begrenzt.
Kosten
| Lösung | Hardware | Laufende Kosten |
|---|---|---|
| Assist (Browser/App) | Keine | Keine |
| Assist + Atom Echo | ~15 € | Keine |
| Assist + DIY-Satellit | ~25–30 € | Keine |
| Alexa + Echo Dot | ~30–60 € | Ggf. Nabu Casa (~78 €/Jahr) |
| Google + Nest Mini | ~30–50 € | Ggf. Nabu Casa (~78 €/Jahr) |
Empfehlung nach Anwendungsfall
-
„Ich will es einfach und es soll funktionieren” → Alexa oder Google mit Nabu Casa. Einmal einrichten, läuft. Die Spracherkennung ist top und du brauchst kein technisches Vorwissen.
-
„Datenschutz ist mir wichtig” → Assist mit lokalem Sprachsatelliten. Kein Byte verlässt dein Netzwerk. Der M5Stack Atom Echo ist der günstigste Einstieg, die ESP32-S3-BOX-3 die komfortablere Option.
-
„Ich will basteln und maximale Kontrolle” → DIY-Satellit mit ESP32-S3 und ESPHome. Du bestimmst Hardware, Mikrofon-Empfindlichkeit, Wake-Word und Gehäuse. Dafür musst du dich mit ESPHome und ein bisschen Elektronik auskennen.
-
„Ich will beides” → Das geht tatsächlich. Du kannst Assist für die lokale Steuerung nutzen und parallel Alexa oder Google für Musik, Timer und alles andere. Home Assistant unterstützt mehrere Sprachassistenten gleichzeitig.
Wake-Words konfigurieren
Egal ob Atom Echo, DIY-Satellit oder ESP32-S3-BOX — du brauchst ein Wake-Word, das den Assistenten aktiviert. Home Assistant unterstützt „Ok Nabu” als Standard-Weckwort. Über die openWakeWord-App lassen sich weitere Wörter wie „Hey Jarvis” oder „Alexa” (ja, wirklich) hinzufügen.
Einrichtung:
- openWakeWord App im App Store installieren
- In der Assist-Pipeline unter Weckwort das gewünschte Wort auswählen
- Am Sprachsatelliten
use_wake_word: truesetzen (bei ESPHome-Geräten)
Die Erkennung läuft komplett lokal — auch hier keine Cloud nötig.
Fazit
Sprachsteuerung in Home Assistant war noch nie so gut wie heute. Ob du auf die bewährte Cloud-Power von Alexa und Google setzt oder den komplett lokalen Weg mit Assist und eigenen Satelliten gehst — es gibt für jeden eine passende Lösung.
Meine Empfehlung für 2026: Starte mit Assist und einem günstigen Sprachsatelliten. Die lokale Lösung ist mittlerweile so ausgereift, dass die meisten Nutzer damit glücklich werden. Und falls du doch mal Alexa für Musik brauchst — die beiden beißen sich nicht.
Die Zukunft der Sprachsteuerung im Smart Home ist lokal, privat und modular. Und Home Assistant steht dabei ganz vorne.
Weiterführende Artikel
- Home Assistant Automationen für Anfänger — Nutze Sprachbefehle als Trigger für deine Automationen
- Home Assistant Dashboard gestalten — Das visuelle Gegenstück zur Sprachsteuerung
- ESPHome mit Home Assistant — Grundlage für selbstgebaute Sprachsatelliten
- MQTT Broker einrichten — Voraussetzung für viele IoT-Geräte, die du per Sprache steuern willst
- Home Assistant auf Proxmox installieren — Genug Leistung für Whisper und Piper brauchst du schon
- Smarte Heizungssteuerung — Per Sprache die Heizung regeln