Mensch-Maschine-Schnittstellen

Akustik-Coprozessor verbessert Spracherkennung

| Redakteur: Holger Heller

Mit seinem ersten, speziell für die Spracherkennung ausgelegten HMI-Coprozessor will Spansion mithilfe der Software-Algorithmen von Nuance vor allem Spracherkennungssysteme im Auto verbessern.

Der Embedded-Flash-Speicherhersteller Spansion fügt Logik-Know-how zu seinem Angebot hinzu und stellt einen Akustik-Coprozessor vor. Der für Mensch-Maschine-Schnittstellen (HMI – Human Machine Interfaces) ausgelegte System-on-Chip-Baustein soll sprachgesteuerte Systeme verbessern und kombiniert die Sprachtechnik VoCon (Software Engine) von Nuance Communications mit Spansions NOR-Flash für Embedded-Anwendungen.

Vor allem Spracherkennungssysteme in den Bereichen Automotive, Spiele und Consumerelektronik sollen durch die Integration von Hard- und Software auf einem Chip profitieren: die Antwortzeiten werden deutlich verkürzt. Auch die Genauigkeit verbessert sich im Vergleich zu bisherigen Lösungen, da der Coprozessor größere Akustikmodelle unterstützt. Der Baustein enthält applikationsspezifische Logik sowie schnellen Speicher, wodurch sprachgesteuerte HMI-Schnittstellen schneller und präziser arbeiten sollen, während gleichzeitig die CPU entlastet wird.

„Elektronische Geräte werden immer intelligenter und interaktiver; umso wichtiger werden folglich die Stimme, aber auch Bilder und Gesten um den steigenden Bedarf der Verbraucher nach schnelleren und intuitiveren Informations- und Kommunikationsmöglichkeiten zu decken“, erklärte Ali Pourkeramati, Senior Vice President Strategic Alliances bei Spansion.

Flash und Logik im 65-nm-Prozess vereint

Heutige Anwenderschnittstellen auf Basis von Standard-Mikrocontroller- und Softwarelösungen können mit den Anforderungen der Zukunft nicht mehr Schritt halten. Spezialisierte Coprozessoren können Sprachanwendungen schneller, intuitiver und genauer machen.

Der Akustik-Coprozessor wird in Spansions 65-nm-Mirror-Bit-Prozesstechnik gefertigt und ermöglicht Instant-On-Response und hohe Rechenleistung in Embedded-Anwendungen. Benchmark-Tests haben ergeben, dass der Baustein die Antwortzeit im Vergleich zu den meisten gängigen Systemen, die einen Standardprozessor nutzen, um die Hälfte verkürzt.

Auch die Datenmenge auf dem Standard-Applikationsprozessor wird um 50% verringert, wodurch dieser für andere Aufgaben frei wird. Der Coprozessor wird über die SPI-Schnittstelle (20 MHz Taktfrequenz) mit dem Hauptprozessor verbunden unterstützt größere akustische Datenmodelle und Mehrsprachigkeit, erkennt die Tonalität und unterscheidet zwischen männlichen und weiblichen Stimmen. Dies verbessert die Genauigkeit und die Erkennung der Sprache an sich.

Spracherkennung bringt mehr Sicherheit im Fahrzeug

Die ersten Implementierungen zielen auf den Automobilmarkt ab. Dort bietet die Spracherkennung mehr Sicherheit im Vergleich zu Geräten, die von Hand bedient werden müssen. Spansions Demo-Plattform mit dem Baustein und Nuances Spracherkennungssoftware wird derzeit von Automobilherstellern evaluiert.

Erste Muster werden im dritten Quartal 2012 zur Verfügung stehen. Zwei Bausteinkapazitäten sind geplant: auf 64-MBit-Basis mit drei bis fünf Akustikmodellen sowie auf 256/512-MBit-Basis mit 12 bis 14 Akustikmodellen.

Kommentar zu diesem Artikel abgeben

Schreiben Sie uns hier Ihre Meinung ...
(nicht registrierter User)

Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
Kommentar abschicken
copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 34259310 / FPGA)