Moderne Video-Türsprechanlagen optimal designen

| Autor / Redakteur: Srinivasan Iyer * / Michael Eckstein

Video-Türklingel: Neuste Audio/Video-Prozessoren und drahtlose Kommunikation ermöglichen das Design moderner Frontline-Sicherheitssysteme mit Cloud-Anbindung.
Video-Türklingel: Neuste Audio/Video-Prozessoren und drahtlose Kommunikation ermöglichen das Design moderner Frontline-Sicherheitssysteme mit Cloud-Anbindung. (Bild: stock.adobe.com)

Von der alten elektrischen Türglocke zum Frontline-Sicherheitssystem mit vollständiger Cloud-Anbindung: Neuste Audio/Video-Prozessoren und drahtlose Kommunikation erhöhen die Gebäudesicherheit.

Home-Automation- und Home-Security-Technologien haben sich von einem luxuriösen Nischenprodukt zu Mainstream-Lösungen entwickelt. Ein Neuzugang auf diesem Markt, der vom Erfolg der Überwachungskameras mit Cloud-Anbindung profitiert, ist die Video-Türsprechanlage. Hausbesitzer und Mieter fragen verstärkt Anlagen nach, die mit vielen Funktionen ausgestattet sind. Auch in der Industrie besteht große Nachfrage nach immer günstigeren und ausgefeilteren Video/Audio-Sicherheits- und Überwachungssystemen. Einige Anlagen verfügen mittlerweile über eine mit Maschinenlernfunktionen ausgestattete Videoverarbeitung. Cloud-Anbindung, drahtlose Kommunikation, Power over Ethernet (PoE), Stützbatterie und hohe Sprachqualität sowie erweiterte Umgebungserfassung mit Bewegungsmelder sind ebenfalls an Bord. Das Integrieren all dieser Features in eine wetterfeste, nur wenige Zentimeter breite Elektronikeinheit ist eine Herausforderung für Entwickler. Sie müssen nicht nur die genannten Funktionen integrieren, sondern zusätzlich Platz für die Performance-Verbesserungen und die zusätzliche Funktionalität der nächsten Generation einplanen.

Während recht einfache Videoverarbeitungs-Technologie in der Lage ist, nicht-statische Objekte zu detektieren, ist eine leistungsfähigere Videoverarbeitung auf fortschrittliche Machine-Learning-Algorithmen (ML) angewiesen. Diese KI-Systeme (Künstliche Intelligenz) werden in der Regel auf der Basis einer Vielzahl von Testfällen eingelernt. Einige lernen unter Verwendung von Informationen aus Kameras mit Cloud-Anbindung fortlaufend dazu. Aus diesem Grund sind häufig Mikrocontroller (MCUs) oder Mikroprozessoren (MPUs) notwendig, um das Edge-Processing zu übernehmen und zu entscheiden, welche Informationen an die Cloud kommuniziert werden sollen. Wie bei anderen elektronischen Designs, kommen auch hier mit jedem zusätzlichen Feature bestimmte Design-Herausforderungen und ein vermehrter Schaltungsaufwand hinzu. Video-Türsprechanlagen bilden hier also keine Ausnahme, zumal bei ihnen in der Regel Grenzen hinsichtlich des Stromverbrauchs, des Platzbedarfs, der Verarbeitungsleistung und der Kosten beachtet werden müssen. Designer sind daher aufgefordert, ihre Innovationen auf Basis einer sinnvollen Kombination aus Hardware, Software und Cloud-Ressourcen zu entwickeln und zu implementieren.

Stromversorgung per Power over Ethernet möglich

Türsprechanlagen werden in der Regel durch Transformatoren mit 8 bis 24 Volt Ausgangsspannung und Leistungen zwischen 5 und 30 VA versorgt. Durch die Verfügbarkeit von PoE lassen sich auch Video-Türsprechanlagen mit höherem Leistungsbedarf unterstützen, denn die neueste IEEE-Norm sieht das Bereitstellen von bis zu 71 W vor. Wenn die Anlage ein Frontend enthalten soll, das sowohl für einen traditionellen Trafo als auch für eine PoE-Versorgung geeignet ist, wird eine innovative Stromversorgungsarchitektur mit einem weiten Eingangsspannungsbereich benötigt, die die Verbindung zum PoE-Controller auch bei geringer Last aufrechterhält. Die Größe, das Energiebudget und die Wärmemanagement-Fähigkeiten einer Video-Türsprechanlage bedingen, dass der integrierbaren Verarbeitungsleistung enge Grenzen gesetzt sind. Angesichts der komplexen Features, zu denen auch die Video- und Audioverarbeitung gehört, muss der Mikrocontroller bzw. Mikroprozessor bei Bedarf eine beträchtliche Rechenleistung bereitstellen, während er sich im Aus-Zustand mit einem Minimum an Leistung zufriedengeben muss. Ein geeignetes Tandem sind zum Beispiel die Audio/Video-Streaming-Controller SimpleLink CC3220 und OV788 von Texas Instruments.

Bei voller Auslastung kann ein Mikrocontroller erhebliche Wärme entwickeln, aber dennoch muss das Gerät insgesamt für einen weiten Temperaturbereich geeignet sein. Die Designer stehen folglich vor der Aufgabe, einen ausgewogenen Kompromiss zwischen Verarbeitungsleistung, Wärmebelastung, Umgebungstemperatur und Wärmemanagement zu finden. Eine weitere Methode, die Fähigkeiten einer Video-Türsprechanlage aufzuwerten, ohne die Verarbeitungsleistung zu erhöhen, ist das Auslagern der Verarbeitung in Cloud-Dienste und das Streamen der Audio- und Videodaten. Dies setzt allerdings eine leistungsfähige Kommunikations-Infrastruktur voraus, die eine kontinuierliche Übertragung in eine Richtung unterstützt.

Schlechte WLAN-Funkabdeckung im Eingangsbereich

Statt auf Ethernet setzen viele Anlagen auf WLAN-Technik. Eine zuverlässige drahtlose Verbindung, die die nötige Bandbreite für qualitativ hochwertige Video- und Audio-Streams bietet, lässt sich aber oft nicht ohne weiteres realisieren. Problematisch sind das begrenzte Energiebudget, wenig Platz für eine Antenne und der oft ungünstige Installationsort der Türsprechanlage. Bei der Installation unter freiem Himmel wird die Türsprechanlage rauen Umgebungsbedingungen ausgesetzt, und es entstehen praktische Probleme für das Streaming mit hohen Bitraten. Für das Design ist daher ein Wi-Fi-fähiger Mikrocontroller mit hoher Eingangsempfindlichkeit des Empfängers und geringem Phasenrauschen nötig. Mindestens 1 MBit/s Bandbreite sollte verfügbar sein, für schlechte Empfangsbedingungen können auch 3 MBit/s erforderlich sein. Eine in die Platine geätzte oder ins Gehäuse integrierte Antenne können für einen besseren Empfangsgewinn sorgen. Auch hocheffiziente Wi-Fi-Chips oder Mikrocontroller mit integrierten Wi-Fi-Frontends können die Übertragungseigenschaften verbessern.

Eine Stützbatterie kann Stromausfälle überbrücken. Dazu muss eine Funktion integriert werden, die bei zu geringer Spannung auf Batterieversorgung umschaltet. Zusätzlich ist ein Batteriemanagement nötig. Erste Wahl sind Lithium-Ionen- oder Nickel-Metallhydrid-Akkus (Li-Ion bzw. NiMH). Beide haben unterschiedliche Probleme: NiMH-Akkus weisen hohe Selbstentladeraten auf. Li-Ion-Akkus sind sehr temperaturempfindlich, außerdem können sie sich beim Laden und Entladen stark erwärmen, wenn keine zusätzlichen Lade/Entlade-Controller für eine Temperaturüberwachung sorgen. Das Wärmemanagement der Akkus wird außerdem durch die Umgebungsbedingungen (insbesondere Temperatur und Feuchte) beeinflusst. Deshalb ist oft der Einbau von Messfunktionen ratsam, die komplexe Algorithmen oder gar maschinelles Lernen nutzen, um die besten Lade- und Entladebedingungen für eine bestimmte Batteriekonfiguration zu ermitteln.

Hohe Rechenleistung für Videofunktionen erforderlich

Bildverarbeitungs-Algorithmen können stationäre und bewegliche Objekte effektiv identifizieren und verfolgen. Allerdings benötigen die Schaltungen und Algorithmen, die dies in Echtzeit umsetzen sollen, in der Regel eine sehr hohe Rechenleistung. Dies ist nicht immer ideal, und so entscheiden sich viele Entwickler von Video-Türsprechanlagen dafür, mehrere Bewegungserkennungs-Technologien im Verbund mit Bildverarbeitungs-Systemen einzusetzen. PIR-Bewegungsmelder und seit einiger Zeit auch Millimeterwellen-(mmWave-)Lösungen sind geeignete Technologien, die gemeinsam mit einem auf Bildverarbeitung basierenden Bewegungssensor eingesetzt werden können. Im passiven Zustand können sie den Stromverbrauch erheblich senken. Die Bewegungserkennung per Bildverarbeitung neigt außerdem dazu, auf größeren Distanzen zu versagen, wenn die Auflösung nicht ausreicht, um einen hohen Verlässlichkeitsgrad zu erzielen. Millimeterwellen- und PIR-Bewegungsmelder dagegen kommen im passiven Modus auf eine Reichweite von mehreren Metern. Millimeterwellen-Sensoren, wie sie in Single-Chip-Radarsystemen für Kraftfahrzeuge eingesetzt werden, erlauben nicht zuletzt eine hochpräzise und schnelle Bewegungs- und Objekterkennung.

Richtungsbestimmung für klare Verständigung

Video-Türsprechanlagen werden oft anhand ihrer Fähigkeit bewertet, klar verständliche Audiosignale von den gewünschten Personen aufzunehmen. Deshalb ist es wichtig, dass die Video-Türsprechanlage die Richtung bestimmen kann, in der sich ein Sprecher oder ein Ereignis von der Tür aus befindet. Wichtig ist dieses Feature unter anderem deshalb, weil an den Eingängen städtischer und auch ländlicher Häuser in der Regel Hintergrundgeräusche und externe Störungen vorkommen. Selbst unter idealen Bedingungen kann eine Video-Türsprechanlage nicht alle möglichen Szenarien berücksichtigen. Die Anwendung von richtungsabhängigen Audioverarbeitungs-Features jedoch kann Hintergrundgeräusche dämpfen und eine Fokussierung auf das gewünschte Ziel bewirken.

Erreichen lassen sich diese Vorgaben mit unterschiedlichen Methoden: Sei es mit Richtmikrofonen oder durch Beamforming-Verfahren mit Antennen- und Mikrofon-Arrays, die für den Fernfeld- anstatt für den Nahfeldempfang konfiguriert sind. Jede Methode bringt gewisse Herausforderungen mit sich und macht in aller Regel zusätzliche Mikrofone und Schaltungen zur Verarbeitung der Echtzeit-Audiosignale erforderlich. Die genauen Schaltungen, die die Signale von mehreren Mikrofonen zusammenführen und die korrekte Verarbeitungs-Dynamik bestimmt, sind keineswegs trivial. Dies gilt besonders im Zusammenhang mit lauten, vielschichtigen Umgebungen in Städten. Hier gelangt ein hohes Maß an Hintergrundgeräuschen durch die Luft direkt zu den Mikrofonen und in das Gehäuse der Türsprechanlage.

Fehlalarme vermeiden – eine große Herausforderung

Eine enorme Herausforderung für jeden Hersteller von Video-Türsprechanlagen sind schließlich auch Fehlauslösungen und Sicherheitsschwachstellen. Viele Tester bemängeln, dass große Lkw, stark reflektierende Objekte sowie Fahrzeuge oder Werbeplakate (häufig solche, auf denen Gesichter abgebildet sind), Fehlalarme auslösen können, die allgemein als lästig empfunden werden. Damit die Zahl solcher Fehlalarme sinkt, sind ausgefeiltere KI- und ML-Lösungen für die Bildverarbeitung, effiziente und dynamische Stromversorgungs-Konzepte sowie möglicherweise auch Betriebsarten erforderlich, die bei der Installation einer Video-Türsprechanlage das Umfeld berücksichtigen. Darüber hinaus kann die Sensorfusion mit verschiedenen Bewegungserkennungs-Algorithmen sowie Audioverarbeitungs-Systemen als Rückfallebene dienen, um potenzielle Fehlalarme zu untersuchen, zu identifizieren und zu verwerfen. Mithilfe einer intelligenten App können sogar die Anwender Gelegenheit erhalten, den Detektierungs-Algorithmen zu Hilfe zu kommen, indem sie bestätigen, ob ein Läuten ein Fehlalarm war oder nicht. So kann sich die Video-Türsprechanlage noch genauer auf ihren Einsatzort kalibrieren.

Texas Instruments Video Doorbell Design

* * Srinivasan Iyer ... ist System Engineer für Building Automation bei Texas Instruments in Bengaluru, Karnataka, Indien

Kommentar zu diesem Artikel abgeben

Schreiben Sie uns hier Ihre Meinung ...
(nicht registrierter User)

Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
Kommentar abschicken
copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 45800222 / Mikrocontroller & Prozessoren)