Home Assistant Voice Satellite: Hardwarewahl und Setup
· 9 Min. Lesezeit

Home Assistant Voice Satellite: Hardwarewahl und Setup

Home Assistant Voice Satellite einrichten: Hardware wählen, Assist-Pipeline vorbereiten und lokale Sprachsteuerung mit ESPHome sauber testen.

Dieser Artikel enthält Affiliate-Links. Kaufst du über diese Links, erhält hausbit.de eine Provision – für dich ändert sich am Preis nichts.

Ein Home Assistant Voice Satellite ist die Lösung, wenn du dein Smart Home per Sprache steuern willst, ohne in jedem Raum Alexa oder Google mithören zu lassen. Der Satellit steht im Raum, erkennt das Aktivierungswort und schickt den Sprachbefehl an deine Home-Assistant-Instanz. Die eigentliche Logik bleibt bei dir: Assist-Pipeline, Entitäten, Automationen und optional lokale Spracherkennung.

Home Assistant Voice Satellite: Was ist das genau?

Ein Voice Satellite ist kein kompletter Sprachassistent wie ein Echo-Lautsprecher. Er ist eher ein Mikrofon-Lautsprecher-Endpunkt für Home Assistant. Er nimmt deinen Befehl auf, gibt eine Antwort aus und überlässt die Verarbeitung der Assist-Pipeline.

Diese Trennung ist wichtig für die Hardwarewahl. Ein kleiner ESP32-Satellit kann gut ein Wake Word erkennen und einfache Antworten abspielen. Er ersetzt aber keinen vollwertigen Smart Speaker für Musik, Multiroom-Audio oder Wissensfragen. Wer diese Funktionen erwartet, wird möglicherweise enttäuscht sein. Wenn du Licht, Szenen, Steckdosen, Rollläden oder Timer lokal steuern willst, passt das Konzept sehr gut.

Falls du noch zwischen Alexa, Google und Assist schwankst, lies zuerst den Vergleich zur Home Assistant Sprachsteuerung. Dieser Artikel geht bewusst eine Ebene tiefer: Welche Hardware lohnt sich für Satelliten, wie bereitest du Home Assistant vor und wo liegen die Grenzen im Alltag?

Welche Hardware passt?

Aktuell gibt es drei sinnvolle Klassen: offizielle Home-Assistant-Hardware, sehr günstige ESP32-Fertigmodule und etwas flexiblere Entwicklerboards. Alle drei können passen, aber nicht für denselben Einsatzzweck.

Die bequemste Variante ist die Home Assistant Voice Preview Edition. Home Assistant nennt ca. 59 € als empfohlene UVP für Europa; Händlerpreise können davon abweichen. Laut Home Assistant bringt sie einen ESP32-S3, 16 MB Flash, 8 MB PSRAM, ein internes Mikrofon-Array, Lautsprecher, 3,5-mm-Ausgang, Drehregler und einen physischen Mikrofon-Mute-Schalter mit. Sie ist damit die sauberste Wahl für Wohnzimmer, Küche oder Arbeitszimmer, wenn du nicht erst Gehäuse, Audio-Hardware und Firmware zusammensuchen willst.

Der Budget-Weg ist der M5Stack Atom Echo für derzeit grob 20 bis 30 €. M5Stack dokumentiert ihn als ESP32-basiertes Modul mit 2,4-GHz-WLAN, integriertem Mikrofon, 0,8-W-Lautsprecher, RGB-LED, Taste und Grove-Anschluss. Home Assistant nutzt genau dieses Gerät in der offiziellen Anleitung für den günstigen Voice Remote. Der kleine Lautsprecher ist allerdings eher Rückmeldung als Raumklang. Für Flur, Werkbank oder Nachttisch reicht das oft, für die Küche mit laufender Dunstabzugshaube eher nicht.

Mehr Bastelspielraum bietet das Waveshare ESP32-S3-AUDIO-Board für derzeit grob 25 bis 30 €. Waveshare beschreibt es als ESP32-S3-Board mit 2,4-GHz-WLAN, Bluetooth 5 LE, Dual-Mikrofon-Array, RGB-Ring, Audio-Codec und Erweiterungsanschlüssen für Display oder Kamera. Das ist interessant, wenn du einen Satelliten mit eigenem Gehäuse, größerem Lautsprecher oder Statusanzeige bauen willst. Es ist aber kein Plug-and-play-Produkt. Plane Zeit für ESPHome, Gehäuse und Stromversorgung ein.

Plane außerdem die unscheinbaren Zubehörteile mit ein. Ein stabiles USB-C-Netzteil wie das UGREEN 20W USB-C-Ladegerät reicht für die kleinen Boards meist aus und verhindert Wackler durch alte Handy-Netzteile. Wenn die Voice Preview Edition in Küche oder Werkstatt steht, ist ein kompakter Aktivlautsprecher wie der Creative Pebble V2 am 3,5-mm-Ausgang sinnvoller als die interne Ausgabe auf voller Lautstärke.

Die richtige Entscheidung nach Raum

Für den ersten Satelliten würde ich nicht mit dem komplexesten Board anfangen. Starte in einem Raum, in dem du oft dieselben Kommandos gibst: Licht an, Szene starten, Timer setzen, Heizung absenken. Dort merkst du schnell, ob deine Assist-Pipeline sauber arbeitet.

Im Wohnzimmer lohnt sich eher die Voice Preview Edition, weil Mikrofone, Mute-Schalter und Bedienung alltagstauglicher sind. Im Flur oder Technikraum reicht ein Atom Echo. Für Bastelräume und eigene Gehäuse ist das Waveshare-Board spannender, weil du Audio und Anzeige besser anpassen kannst.

Entscheidend ist nicht nur das Board, sondern auch der Standort. Stelle den Satelliten nicht direkt neben einen Lautsprecher, eine Kaffeemühle oder den Fernseher. Ein halber Meter Abstand zu lauten Geräten macht mehr aus als der Wechsel auf ein teureres Modul. Bei Räumen mit Hall oder vielen harten Flächen hilft ein Platz auf Kopfhöhe mehr als ein Platz tief im Regal.

Home Assistant vorbereiten

Bevor du Hardware flashst, sollte Home Assistant selbst sauber vorbereitet sein. Du brauchst eine funktionierende Assist-Pipeline. Sie besteht aus Sprache-zu-Text, Conversation Agent und Text-zu-Sprache. Für eine Cloud-arme Installation nutzt Home Assistant typischerweise Wyoming, Whisper und Piper. Die offiziellen Home-Assistant-Dokumente beschreiben diese Kombination als Weg zu einer voll lokalen Voice-Pipeline.

Auf einem Raspberry Pi 4 funktioniert das für einfache Befehle, aber die Latenz kann stören. Ein Mini-PC oder eine Proxmox-VM mit etwas Reserven macht Sprache deutlich angenehmer. Wenn dein Home Assistant ohnehin auf Proxmox läuft, ist das ein guter Zeitpunkt, CPU- und RAM-Reserven zu prüfen. Die Basis dafür findest du im Guide zu Home Assistant auf Proxmox.

Prüfe danach diese Punkte:

  • Die gewünschten Entitäten sind für Assist sichtbar.
  • Räume und Gerätenamen sind eindeutig.
  • Die Pipeline versteht Deutsch.
  • Text-to-Speech gibt kurze, verständliche Antworten aus.
  • Wake-Word-Erkennung ist nur dort aktiv, wo du sie brauchst.

Gerade die Namen entscheiden über Erfolg oder Frust. light.wohnzimmer_decke ist für Home Assistant eindeutig, aber für Sprache zählt der Anzeigename. “Deckenlicht Wohnzimmer” ist besser als “Hue White Ambiance 3”.

Atom Echo als erster ESPHome-Satellit

Der Atom Echo ist der günstigste Einstieg, weil Home Assistant eine geführte Einrichtung anbietet. Du verbindest ihn per USB, installierst die passende Firmware und übernimmst das Gerät anschließend in ESPHome. Wenn du ESPHome noch nie genutzt hast, lies vorher die Grundlagen in ESP32 mit ESPHome in Home Assistant einbinden. Das spart dir später Fehlersuche bei WLAN, API-Schlüssel und Adoption.

Nach der Einrichtung erscheint der Satellit in Home Assistant als ESPHome-Gerät. Dort wählst du die Assist-Pipeline und das Wake Word. Home Assistant dokumentiert für Assist unter anderem “Okay Nabu”, “Hey Jarvis” und “Hey Mycroft” als typische Optionen bei der Voice Preview Edition; bei ESPHome-Hardware hängt die Auswahl von Firmware und Wake-Word-Engine ab.

Teste zuerst ohne laute Umgebung. Sage kurze Befehle wie “Schalte das Licht im Flur ein” oder “Starte Szene Abend”. Wenn das klappt, teste erst dann natürliche Varianten. So erkennst du, ob ein Problem an der Audioaufnahme, an der Spracherkennung oder an schlecht benannten Entitäten liegt.

Voice Preview Edition im Alltag

Die Home Assistant Voice Preview Edition ist die bessere Wahl, wenn der Satellit sichtbar im Raum stehen soll. Der Mute-Schalter ist kein Detail: Laut Home Assistant trennt er die Stromversorgung zum Mikrofon physisch. Für einen immer bereiten Sprachendpunkt ist das ein klares Plus, weil du den Zustand ohne App sehen und schalten kannst.

Auch der 3,5-mm-Ausgang ist nützlich. Die interne Ausgabe reicht für kurze Antworten, aber mit einem kleinen Aktivlautsprecher verstehst du Timer, Rückfragen oder Fehlertexte besser. Erwarte trotzdem keinen Sonos-Ersatz. Der Voice Satellite ist für Sprachsteuerung gebaut, nicht für Musik.

Home Assistant Voice ist stark für Smart-Home-Kommandos, Timer und einfache Rückmeldungen. Allgemeinwissen, lange Dialoge oder perfekte Erkennung bei Hintergrundgeräuschen sind nicht die Stärke. Genau deshalb solltest du den Satelliten auf konkrete Smart-Home-Aufgaben zuschneiden.

Automationen sprachfreundlich bauen

Ein Voice Satellite wird besser, wenn deine Automationen klare Namen haben. Statt zehn Einzelgeräte per Sprache zu schalten, baust du lieber Szenen und Skripte: “Kino starten”, “Gute Nacht”, “Arbeitszimmer an”. Dann muss Assist weniger raten und du bekommst reproduzierbare Ergebnisse.

Ein Beispiel: Für den Abend im Wohnzimmer schaltest du nicht Lampe A, Lampe B, Stehlampe und TV-Steckdose einzeln. Du baust eine Szene und gibst ihr einen natürlichen Namen. Danach reicht ein Sprachbefehl. Wenn du bei Automationen noch Struktur brauchst, hilft der Einstieg in Home Assistant Automationen für Anfänger.

Auch Fehlerantworten solltest du kurz halten. Ein Satellit im Raum ist kein Debug-Terminal. Wenn etwas nicht klappt, willst du eine knappe Rückmeldung und danach im Dashboard nachsehen. Lange TTS-Antworten können im Alltag schnell störend wirken.

Datenschutz und Grenzen realistisch einschätzen

Lokal heißt nicht automatisch perfekt privat. Entscheidend ist deine Pipeline. Wenn du Whisper und Piper lokal betreibst und als Conversation Agent Home Assistant Assist nutzt, bleiben die Sprachdaten im eigenen Netzwerk. Wenn du Home Assistant Cloud oder ein externes KI-Modell verwendest, verlässt mindestens ein Teil der Verarbeitung dein lokales System. Das kann sinnvoll sein, muss aber bewusst entschieden werden.

Setze Satelliten nur in Räumen ein, in denen ein Mikrofon akzeptabel ist. Schlafzimmer, Gästezimmer und Kinderzimmer brauchen mehr Zurückhaltung als Flur oder Küche. Der physische Mute-Schalter der Voice Preview Edition ist hier ein Vorteil. Bei ESP32-Boards ohne echten Mute-Schalter kannst du zumindest per schaltbarer USB-Steckdose oder Automation eine klare Aus-Zeit bauen. Für so eine harte Trennung passt zum Beispiel ein Shelly Plug S Gen 3 mit Matter, wenn du den Satelliten nur zu bestimmten Zeiten versorgen willst.

FAQ

Brauche ich Home Assistant Cloud für Home Assistant Voice Satellites?

Nein. Du kannst mit einer lokalen Pipeline aus Wyoming, Whisper und Piper arbeiten. Cloud-Dienste können schneller oder komfortabler sein, sind aber keine Pflicht für einfache Smart-Home-Kommandos.

Ist der Atom Echo als Home Assistant Voice Satellite gut genug für jeden Raum?

Nein. Er ist klein, günstig und gut für Tests oder ruhige Räume. In lauten Räumen oder bei größerem Abstand ist die Voice Preview Edition oder ein Board mit besserem Mikrofon-Setup sinnvoller.

Kann ich eigene Wake Words nutzen?

Teilweise, aber nicht so bequem wie ein Name in einer App. Home Assistant unterstützt Wake Words über passende Engines wie openWakeWord oder microWakeWord. Je nach Hardware und Firmware ist die Auswahl eingeschränkt.

Funktioniert ein Home Assistant Voice Satellite auch mit Zigbee- und Matter-Geräten?

Ja, solange die Geräte sauber in Home Assistant eingebunden sind und Assist die Entitäten verwenden darf. Der Voice Satellite steuert nicht direkt Zigbee oder Matter, sondern gibt Befehle an Home Assistant.

Ehrliche Empfehlung

Wenn du einfach einen lokalen Sprachendpunkt willst, nimm für den ersten Raum die Home Assistant Voice Preview Edition. Sie kostet mehr, spart aber Bastelzeit und wirkt im Alltag runder. Wenn du nur testen willst, ob Assist für dich funktioniert, reicht ein Atom Echo. Das Waveshare-Board lohnt sich, wenn du bewusst basteln und den Satelliten in ein eigenes Gehäuse oder Display-Projekt integrieren willst.

Der größte Hebel ist am Ende nicht die Hardware, sondern ein sauber benanntes Home-Assistant-Setup. Gute Entitätsnamen, klare Räume und wenige robuste Szenen machen aus einem Voice Satellite ein nützliches Werkzeug. Ohne diese Vorarbeit bleibt selbst die beste Hardware ein Mikrofon, das dich zu oft falsch versteht.

Philipp Just

Gründer & Autor

Schreibt über Home Assistant, ESP32 und alles was das Smart Home smarter macht.