Direkt zum Inhalt
Big Data, Video Data 29. September 2015

Vom Heuhaufen zur Nadel

Die enormen Fortschritte bei der Bildqualität führen in der Videoüberwachung zu einer substantiellen Zunahme des Datenvolumens. Ein intelligentes und effizientes Management sowie Technologien zur Datenreduzierung ohne Qualitätsverlust werden daher zukünftig von entscheidender Bedeutung für handhabbare Videolösungen sein.

Intelligente Videobildanalyse trägt durch Ausblenden unwichtiger Details sowie Abstrahierung zur erheblichen Reduzierung des Datenvolumens bei.
Intelligente Videobildanalyse trägt durch Ausblenden unwichtiger Details sowie Abstrahierung zur erheblichen Reduzierung des Datenvolumens bei.

Jeder Punkt zählt – nicht nur im Sport, sondern auch in der Videoüberwachung. Die Auflösungen von Videoüber-wachungskameras haben sich in den vergangenen Jahren überragend erhöht, und es gibt wenig Anzeichen dafür, dass sich das in Zukunft ändern könnte. Zu sehr setzen die Anwender auf die mit der Auflösung steigende Detailtreue, die zum Beispiel die Identifizierung einer Person erleichtert.

HD-Kameras mit Auflösungen von 1,3 bis zwei Megapixeln verdrängen zunehmend die SD-Kameras, stehen bei speziellen Anwendungen wie zum Beispiel Stadien aber auch schon unter dem Druck von 4K Ultra HD mit der vierfachen Pixelzahl und damit deutlich besserer Detailtreue. Eine weitere Vervierfachung auf dann 33 Megapixel pro Bild werden Kameras nach dem 8K-Standard mit sich bringen.

Datenzuwachs kompensieren

Doch die stetige Verbesserung der Bildqualität hat auch ihre Kehrseite. Bilder müssen übertragen und gespeichert werden, was entsprechend dimensionierte Übertragungskanäle und Speichersysteme erfordert. Zwar können neue Encoding-Technologien und Kompressionsstandards wie H.265 einen kleinen Teil des Datenzuwachses kompensieren, doch bei ständiger Vervierfachung des Datenvolumens sind sie allein keine Lösung. Hinzu kommt, dass auch die Anwendungen wachsen und mit ihnen die Zahl der Kameras. So können in einer Großstadt ohne weiteres 10.000 Kameras für die Überwachung des öffentlichen Raums und der öffentlichen Verkehrsmittel installiert sein.

Heutige Zwei-Megapixel-Kameras arbeiten dank der integrierten Kompressionsalgorithmen mit Bitraten von etwa acht bis zehn Mbps (Megabit pro Sekunde). Bei 10.000 Kameras gilt es also eine Datenflut von mindestens 80 Gigabit pro Sekunde zu bewältigen. Allein um die Bilder eines Tages zu speichern, benötigt man in einer solchen Anwendung eine Kapazität von 864 Terabyte. Oft sollen Aufnahmen jedoch bis zu 30 Tage lang aufbewahrt werden, so dass schon beim Einsatz von HDKameras ein Datenvolumen von rund 26 Petabyte zu bewältigen ist – bei Ultra HD bereits über 100 Petabyte.

Anzeige

Nur relevante Daten aufbewahren

Die reine Speicherung der Daten, die oft die Hälfte der Gesamtkosten einer Videolösung ausmacht, ist jedoch nur die eine Seite der Medaille. Denn gespeichert werden sie ja nur aus einem Grund: um sie nach einem Vorfall später nach dazugehörigen Aufnahmen durchsuchen zu können. Sind Ort und Zeit exakt bekannt, ist das anhand von Zeitstempeln recht problemlos. Will man jedoch anhand der Aufnahmen mehrerer Kameras die Fluchtroute eines Täters nachvollziehen, stößt man bei solchen Datenmengen schnell an Grenzen. Ein weiterer Aspekt ist die Tatsache, dass der größte Teil der gespeicherten Daten niemals benötigt wird. Intelligenz in der Kamera kann dabei helfen, nur relevante Daten aufzubewahren.

Aber nicht nur die gespeicherten Bilder werden hier zum Problem, sondern auch die Live-Bilder in der Leitstelle. In großen Anwendungen ist es unmöglich, sämtliche Kameras rund um die Uhr zu überwachen, ganz davon abgesehen, dass bereits nach etwa 20 Minuten am Monitor die Konzentration eines menschlichen Beobachters drastisch abnimmt und er bis zu 90 Prozent aller relevanten Ereignisse gar nicht mehr wahrnimmt.

Große Anwendungen sind verteilte Anwendungen. Anwender benötigen rund um die Uhr und an unterschiedlichen Orten Zugriff auf die Aufnahmen beliebiger Videokameras – auch dort, wo kein schnelles Glasfasernetz zur Verfügung steht. Im Internet und auch in Mobilfunknetzen steht jedoch selten genügend Bandbreite für den Upload von Live-Bildern in HD-Qualität zur Verfügung – meist unter einem Megabit pro Sekunde statt der benötigten zehn.

Datenvolumen reduzieren

Die große Datenmenge verteilter Videoanwendungen stellt Anwender wie Errichter also vor eine Vielzahl grundlegender Probleme. Es werden daher heute große Anstrengungen unternommen, das immense Datenvolumen zu reduzieren, ohne bei der Qualität relevanter Bildinformationen Abstriche machen zu müssen. Dabei liegt die Betonung auf „relevant“, denn meist interessiert ja nur ein bestimmter Teil eines Bildes, etwa der mit einer Bewegung vor einem statischen Hintergrund. Diese relevanten Bildbereiche müssen in höchster Qualität übertragen und gespeichert werden, während man bei wenig relevanten Bildbereichen teilweise auch erhebliche Qualitätseinbußen ohne weiteres in Kauf nehmen kann.

Dafür hat Bosch eine selektive Komprimierung entwickelt. Bis zu acht Bildbereiche können dabei mit unterschiedlichen Kompressions-Parametern konfiguriert werden, so dass wenig interessante Bildbereiche stärker komprimiert werden können, als die wesentliche Bildinformation. Dadurch ist eine hohe Bildqualität bei gleichzeitig reduzierter Bitrate möglich. HD-Kameras mit dieser Technologie benötigen bis zu 50 Prozent weniger Bandbreite als andere HD-Kameras. Entsprechend verringern sich die Anforderungen sowohl an das Netzwerk als auch an die Speichersysteme.

Die Content Based Imaging Technology (CBIT), die in allen IP-Kameras von Bosch implementiert ist, kombiniert die Informationen des Sensors, der Bildverarbeitung, des Encoders sowie der intelligenten Videoanalyse, um jede Szene in optimaler Bildqualität darzustellen. Zu der CBIT-Ausstattung gehören zwei spezielle Funktionen: die Intelligent Auto Exposure (IAE) und die Intelligent Dynamic Noise Reduction (IDNR). Bei IAE wird durch automatische Anpassung der Kameraeinstellungen an die Lichtverhältnisse das jeweils beste Bild eines Objektes dargestellt, und IDNR reduziert durch die Entfernung von Rausch-Artefakten irrelevante Daten und optimiert das Detail-zu-Bitrate-Verhältnis. IDNR ist in allen IPKameras von Bosch implementiert, IAE in denen mit intelligenter Videoanalyse.

Übertragung über Internet und Mobilfunk

Trotz teilweise drastischer Reduktion der Bitraten durch solche Technologien bleibt dennoch das Problem der Übertragung von Videodaten über Verbindungen mit geringer und schwankender Bandbreite, wie sie für das Internet und Mobilfunknetze typisch sind. Um entfernten oder gar mobilen Nutzern den Zugriff auf Live-Videodaten zu ermöglichen, wurde Dynamic Transcoding entwickelt. Dabei wird die verfügbare Bandbreite laufend gemessen und das Video automatisch so weit komprimiert, dass es in Echtzeit übertragen werden kann. Hierbei wird die Bewegung gegenüber der Live-Qualität priorisiert. Bei Bedarf kann der Nutzer das gerade angezeigte Bild jedoch in voller HD-Qualität und in naher Zukunft sogar in 4K Ultra HD übertragen lassen, um auch die Details sichtbar zu machen.

Mit Hilfe des Dynamic Transcoding lassen sich Full-HD-Bilder (1080p bei 30 fps) bis auf CIF (240p) herunterrechnen, sodass auch Upload-Bandbreiten von 500 kbps (Kilobit pro Sekunde) oder gar weniger für die Übertragung von Live-Bildern genügen. Die Speicherung der HD-Bilder selbst erfolgt dabei im lokalen Netzwerk der Kamera; sie werden nur bei entsprechender Notwendigkeit über das Netz geschickt.

Bandbreite nur dann in Anspruch zu nehmen, wenn es wirklich erforderlich ist, könnte auch eines der Ziele der intelligenten Videoanalyse sein. Intelligente Algorithmen in der Kamera können das Bild analysieren und Bilddaten sowie einen Alarm nur bei bestimmten vorkonfigurierten Ereignissen übertragen. Das spart nicht nur in erheblichem Umfang Bitrate, sondern löst auch das Problem, dass eine Live-Überwachung aller Kamerabilder in größeren Anwendungen unmöglich ist. Zudem werden Algorithmen im Gegensatz zu Menschen nicht müde und unkonzentriert.

Durch Ausblenden unwichtiger Details sowie die Abstrahierung ermöglicht die intelligente Videoanalyse eine erhebliche Reduzierung des Datenvolumens. Kameras von Bosch generieren dafür neben dem eigentlichen Videobild auch Content-Analyse-Informationen in Form von Metadaten. Diese bestehen aus einfachen Textzeichenfolgen mit Beschreibungen spezieller Bilddetails wie Objekte oder Bewegungen. Die Metadaten haben ein wesentlich geringeres Volumen als die Videoaufzeichnungen selbst und lassen sich entsprechend schneller übertragen. In manchen Situationen kann es sogar ausreichend sein, nur Metadaten zu übertragen, etwa wenn es allein um das Vorhandensein eines Fahrzeugs oder um die Anzahl von Personen in einem bestimmten Bereich geht.

Forensik beschleunigen

Wenngleich die Live-Alarmierung bei vielen Anwendungen im Vordergrund steht, ergibt sich bei Alarmen in der Regel auch die Notwendigkeit, Ereignisse später nachzuvollziehen. Die dafür erforderliche Analyse der Aufzeichnungen von Überwachungskameras ist ein zeitraubendes Unterfangen.

Um Vorfälle einigermaßen sicher erkennen zu können, kann bei der Durchsicht des Videomaterials maximal mit vierfacher Geschwindigkeit gearbeitet werden. Vier Stunden Aufzeichnung bedeuten daher mindestens eine Stunde Arbeitszeit; müssen mehrere Kameras ausgewertet werden, summiert sich das entsprechend. In manchen Fällen ist das nur teuer, in anderen dagegen verhindert die langwierige Analyse auch noch die notwendige schnelle Reaktion auf ein kritisches Ereignis. Steht nicht einmal fest, welche Kameras Bilder zum fraglichen Ereignis geliefert haben, sind Aufwand und Verzögerung noch größer.

Auch hier helfen die Metadaten der intelligenten Videoanalyse, soweit sie gemeinsam mit den Aufnahmen gespeichert wurden. Im Gegensatz zu den Bildern selbst lassen sie sich nämlich maschinell durchsuchen. Für eine forensische Suche können die Benutzer zum Beispiel über die Videomanagement-Software auf einfache Weise Suchabfragen definieren, die in wenigen Sekunden die gespeicherten Metadaten durchsuchen und auf das oder die relevanten Videos auch aus multiplen Kameras verweisen. Aus dem Material von vier Stunden Aufzeichnung können so in etwa 20 Sekunden alle relevanten Videosequenzen herausgefiltert werden. Durch Iteration mit jeweils verfeinerten Kriterien lässt sich diese Genauigkeit noch weiter steigern.

Das Management von Videodaten beschränkt sich nicht auf die Übertragung und Speicherung allein. Zunehmend wichtige Aspekte sind auch Datenschutz und Datensicherheit, denen in der analogen Welt eine deutlich geringere Bedeutung zukam. So muss sich ein Betreiber jederzeit darauf verlassen können, dass die Bilder, die er sieht und speichert, auch tatsächlich von der entsprechenden Kamera aufgenommen und nicht manipuliert wurden.

Kontrolle ist gut, Vertrauen ist besser

Jede Kamera muss ein vertrauenswürdiger Kommunikationspartner sein, und nur eine elektronische Signatur innerhalb der Kamera kann diese Authentizität gewährleisten. Zudem müssen Daten während der Übertragung zum Videomanagementsystem und auf den Speichermedien verschlüsselt sein. Bosch hat daher in allen seinen IP-Kameras entsprechende Hardware implementiert, das Signatur und Verschlüsselung mithilfe eines hinterlegten Zertifikats realisiert.

Da nicht jeder Operator auf alle Videodaten zugreifen darf – oder dies zumindest nicht können sollte – sind filigrane Zugriffsrechte eine weitere Anforderung an das Management von Videodaten. Die sichere Verwaltung solcher Rechte kann natürlich nicht nur in der Kamera erfolgen, sondern muss im Videomanagementsystem implementiert werden, möglicherweise auf Basis des Microsoft Active Directory. Man sollte sich auch dessen bewusst sein, dass Videodaten in den meisten Fällen kritische Daten sind, die mit allen gängigen Instrumenten der IT-Sicherheit gegen den Zugriff Unbefugter gesichert werden müssen. Speziell in kritischen Infrastrukturen ist hier auch mit sehr ausgefeilten Attacken von Geheimdiensten und ähnlichen Organisationen zu rechnen – Stichwort Cyberwar.

Datenschutz nicht vergessen

Je mehr Videodaten im öffentlichen Raum und auch in Unternehmen erhoben werden, desto größere Bedeutung erlangt auch der Datenschutz. In den meisten Fällen ist es nicht erforderlich, von der Kamera erfasste Personen eindeutig zu identifizieren. Hier kann es ausreichend sein, Gesichter oder die ganze Person verschwommen darzustellen (Blurring).

Auch die Nutzung von Avataren oder gar nur von Metadaten anstelle von Personen ist denkbar, was zudem noch positive Auswirkungen auf die benötigte Bandbreite hätte, da Avatare und insbesondere Metadaten erheblich weniger Datenvolumen benötigen. Nutzt man solche Techniken, die aus heutiger Sicht noch etwas Zukunftsmusik sind, kann man auch im Videomanagementsystem festlegen, wer nur Metadaten, wer Avatare und wer zur Identifizierung nutzbare Bilder einsehen darf; gegebenenfalls auch nach dem Vier-Augen-Prinzip.

Pieter van de Looveren

Passend zu diesem Artikel