Datenmanagement im Industrial-IoT

| Autor / Redakteur: Christian Lutz * / Michael Eckstein

Schnelles Daten-Handling: Die speziell für Echtzeit-IoT-Anwendungen ausgelegte CrateDB-Datenbank ist in die Azure-Cloud-Umgebung von Microsoft eingebunden.
Schnelles Daten-Handling: Die speziell für Echtzeit-IoT-Anwendungen ausgelegte CrateDB-Datenbank ist in die Azure-Cloud-Umgebung von Microsoft eingebunden. (Bild: Crate.io)

Industrielle IoT-Anwendungen generieren oft Millionen Datensätze und müssen diese in Echtzeit verarbeiten. Herkömmliche Datenbanken sind überfordert, spezialisierte Lösungen gefragt.

Die Einsatzbereiche für Industrial-IoT-Lösungen sind vielfältig – vom Erfassen von Maschinen- und Sensordaten über die Smart-Factory bis zur Steuerung der Energieerzeugung und –verteilung. Dabei fallen enorme Datenmengen an, die mit herkömmlichen Datenbanken nicht oder nur mit großem Aufwand zu bewältigen sind. Gefordert ist daher ein Datenmanagement, das Zeitreihen-Handling mit Millionen von Datensätzen in Echtzeit ermöglicht.

Internet-of-Things-Lösungen für die Industrie, kurz IIoT, gibt es nicht von der Stange. Jede Branche hat ihre eigenen, ganz spezifischen Anforderungen. Und selbst in gleichgelagerten Produktionszweigen hat jedes Unternehmen eine individuelle Ausprägung hinsichtlich der Struktur der Produktion, des Grades der Automatisierung oder der geografischen Verteilung der Fertigungsstätten. Sensoren, Maschinen oder vernetzte Geräte erzeugen kontinuierliche Informationsströme, die in Echtzeit erfasst, analysiert und angereichert werden müssen, um beispielsweise Rückschlüsse auf den aktuellen Zustand zu ziehen und geeignete Maßnahmen für reibungsfreie Prozessabläufe einzuleiten.

Breites Spektrum an Anwendungsdaten

Kern des Datenmanagements im IIoT ist eine Datenbank, die leistungsfähig ist, ein hohes Maß an Flexibilität besitzt und nicht zuletzt auch wirtschaftlich einsetzbar ist. Doch das Installieren einer solchen Datenbank allein reicht nicht. Sie muss auf der Datenebene Informationen mit unterschiedlichsten Formaten aufnehmen können und diese auf der Anwendungsebene für die Visualisierung, Analyse und zur weiteren Verarbeitung bereitstellen. Und das vorzugsweise in einer Cloud-Umgebung mit uneingeschränkter Verfügbarkeit.

Im Fertigungsprozess gilt es beispielsweise, den Bestand an Rohstoffen, Halbzeugen und Zwischenerzeugnissen im Blick zu haben, die Zustandsdaten von Maschinen und Fertigungsautomaten zu überwachen, die Sensordaten aus der Produktion bezüglich Gewicht, Abmessung oder Geschwindigkeit abzugreifen und diese mit Informationen zu Mitarbeitern und Lieferanten zu korrelieren. Diese Aufgabe wird durch die zunehmend verteilte Produktion über oft mehrere Standorte hinweg immer wichtiger, weil Monitoring, Maintenance und Troubleshooting nicht mehr länger an einem Ort erfolgen können und entsprechend ebenfalls verteilt gemanagt werden müssen. Aufgabe ist es hier, Millionen von Streaming-Daten von Hunderten unterschiedlicher Datenpunkte in der Minute zu erfassen, Auffälligkeiten in den Zeitreihen zu ermitteln und zu kommunizieren, entweder an einen Supervisor oder auch für das automatische Generieren von Alarmen.

Die Energiewirtschaft hat sich im letzten Jahrzehnt nachhaltig verändert. Die Energieerzeugung erfolgt bedingt durch die Einführung erneuerbarer Energien zunehmend dezentral. Statt mit einer Handvoll großer Kraftwerke gilt es immer mehr, die Stromproduktion von Hunderttausenden von Erzeugern wie Windrädern, Biogas- oder Solaranlagen zeitnah zu erfassen und mit den Verbrauchern zu korrelieren. Eine Veränderung der Windgeschwindigkeit etwa führt zu erheblichen Schwankungen bei der erzeugten Energiemenge, was entsprechende Schritte zur Folge hat, sei es die Drosselung anderer Energieerzeuger, die Einschaltung von Zwischenspeichern und letztlich auch die Veränderung der Verkaufspreise. Hier kommt es darauf an, die Leistung der verschiedenen Produktionsanlagen in Echtzeit zu ermitteln zu speichern, zu analysieren und an Folgeverfahren weiterzugeben, um wiederum die optimale Reaktion zu garantieren.

Datenvorverarbeitung und Datenanreicherung

Beim Messen und Testen physikalischer Instanzen – von Gebäuden über Maschinen bis zu einzelnen Komponenten – reicht es schon lange nicht mehr aus, mit geeigneten Messinstrumenten lokal die Werte zu erfassen und zu beurteilen. Vielmehr kommt es heute darauf an, die Werte vieler Sensoren in Millisekunden aufzunehmen, im Hinblick auf Veränderungen zu prüfen und beim Erreichen von Grenzwerten Alarm zu schlagen. Komplexe messtechnische Lösungen kommen etwa bei Brückenkonstruktionen zum Einsatz, wo verschiedenste Werte wie die Belastung durch den Verkehr oder die Schwingung der Substanz alle paar Meter mittels Sensoren erfasst werden und durch die Analyse der Zeitreihen sofortige Maßnahmen eingeleitet werden können.

So unterschiedlich die genannten Beispiele auch sind – sie stellen allesamt die gleichen Anforderungen an das Datenmanagement: Dezentrale Erfassung von Millionen Daten pro Minute mit unterschiedlichsten Formaten, Anreicherung der daraus entstehenden Zeitreihen mit weiteren Informationen, Echtzeit-Analyse und Weitergabe zur Visualisierung oder Information an Folgeverfahren. Konventionelle Datenbanken sind diesen Anforderungen allein schon aus Kapazitäts- oder Geschwindigkeitsgründen nicht gewachsen. Während einerseits reine SQL-basierte Angebote zu träge sind, scheitert es bei NoSQL-Datenbanken an der Funktionalität und am Komfort. Beiden ist gemein, dass ihr Einsatz für die Bewältigung komplexer Zeitreihen schlichtweg nicht wirtschaftlich ist.

Neuere Konzepte wie die CrateDB kombinieren deshalb die Vorzüge beider Welten. Sie nutzen die SQL-Funktionalität und bauen dabei auf einer NoSQL-Basis auf. Dieser Schachzug in Verbindung mit der verteilten Datenhaltung, der Shared-Nothing-Architektur und der Bereitstellung als Cloud-Service prädestiniert sie für IIoT-Anwendungen in anspruchsvollsten Umgebungen. Insbesondere zwei Gründe machen diesen Ansatz attraktiv: Die verteilte Shared-Nothing-Architektur bedeutet, dass alle Knoten des Datenbanksystems gleich sind. Die Leistung des Gesamtsystems lässt sich demnach mittels des einfachen Hinzufügens neuer Knoten nahezu beliebig steigern, wobei gleichzeitig die Verfügbarkeit jederzeit garantiert wird. Zudem arbeitet die CrateDB mit In-Memory-Geschwindigkeit, was eine schnelle Reaktion ohne Rückgriff auf langsame Datenspeicher ermöglicht.

Kombination aus SQL- und NoSQL-Techniken

Die Kombination von SQL- und NoSQL-Datenbanktechniken verspricht weitere Vorteile. Zum einen lassen sich auf Basis der SQL-Konformität beim Einsatz der CrateDB bestehende Folgeanwendungen mit SQL-Schnittstellen weiter nutzen. Zum anderen kann ganz pragmatisch das vorhandene Know-how genutzt werden. Die CrateDB kann durch diese Architektur verschiedene Datenbanken im Unternehmen ersetzen, was zu weiterer Effizienz im Hinblick auf die Maintenance führt.

Mit den umfangreichen Schnittstellen, sowohl auf der Datenebene wie auf der Anwendungsebene, erlaubt die CrateDB die Entwicklung komplexer Datenmanagementlösungen analog zu den individuellen Anforderungen im Unternehmen. Die Maschinen- und Sensordaten können etwa mittels des Einsatzes von Streaming-Gateways in verbreiteten Formaten wie MQTT oder JSON oder anderen in die Datenbank eingelesen und angereichert werden, während auf der Anwendungsebene die Daten zum Zwecke der Visualisierung, des Monitorings, der Analyse und der Vorhersage an entsprechende Folgeverfahren in Echtzeit bereitgestellt werden. In vielen Fällen ist dabei der Einsatz als gehosteter Cloud-Service wirtschaftlich attraktiv. Das garantiert die 24x7-Verfügbarkeit und ermöglicht die effiziente Nutzung ohne eigene cloud-native Datenstacks mit Containern, Identity-Management, Backup & Restore, Logging etc. aufsetzen zu müssen.

IIoT ist angetreten, die Basis der bereits installierten, vernetzten Sensoren, Maschinen und Netzgeräte zu nutzen, um die getätigten Investitionen zu schützen und darauf aufbauend neue Konzepte für ein intelligentes Management zu entwickeln. Das kann jedoch nur gelingen, wenn die allerorts und jederzeit verfügbaren Informationen auch produktiv genutzt werden. Das Datenmanagement bildet hierfür die Basis. Auf dieser Grundlage erst sind auch neuere Technologien sinnvoll. Künstliche Intelligenz und Maschinelles Lernen setzen die Verfügbarkeit enormer Datenmengen voraus. Mittels moderner Datenbankarchitekturen ist der Weg dazu geebnet.

* Christian Lutz ist Gründer und CEO von Crate.io in Berlin

Kommentar zu diesem Artikel abgeben

Schreiben Sie uns hier Ihre Meinung ...
(nicht registrierter User)

Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
Kommentar abschicken
copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 45832859 / IoT)