Fachartikel aus PROTECTOR Special Videoüberwachung 2018, S. 52 bis 53

Künstliche Intelligenz Vernetzte Tätersuche

Heutzutage können die meisten Städte Überwachungsanlagen vorweisen, um die Kriminalitätsrate zu senken. Doch mit Technik, welche sich künstliche Intelligenz (KI) zu Nutze macht, kann die Effektivität dieser Systeme noch gesteigert werden und mancherorts dafür sorgen, dass der Ruf einer Stadt wiederhergestellt wird.

Bild: Rike/Pixelio.de
Eine übergreifende Suche in Videobildern einer Stadt könnte schneller zur Verhaftung von Tätern führen. (Bild: Rike/Pixelio.de)

Schaltet man derzeit die Nachrichten ein, ist es nur eine Frage der Zeit, bis Beträge über Kriminalität in großen Städten zu sehen sind. Manche dieser Städte haben einen schlechteren Ruf als andere, doch jeden der dort Lebenden kann die gegebene Situation in seinem täglichen Leben beeinflussen. Es können Bedenken aufkommen, bestimmte Bereiche zu betreten, oder das Haus nach Anbruch der Nacht generell zu verlassen. Eurostat-Statistiken zufolge wurden für das Jahr 2015 exakt 393.067 Straftaten im Bereich eines Raubes begangen.

Umfangreiche Daten, umfangreiche Analyse

Der Gedanke, Verdächtige mithilfe von Überwachungskameras gezielt ausfindig zu machen, klingt wunderbar. Städte werden nicht nur gefühlt sicherer, wenn die Einwohner wissen, dass kriminelle Aktivitäten überwacht, gestoppt und möglicherweise verhindert werden können. Live-Übertragungen identifizieren potenzielle Probleme, wodurch direkt Polizeibeamte zum Ort des Geschehens entsandt werden können. Was aber tun bei Straftaten, die bereits vor einiger Zeit begangen wurden? Die gewaltige Anzahl von Überwachungskameras in modernen Städten generiert eine unüberschaubare Menge an Videodaten. Dies bedeutet für jeden Mitarbeiter in der Leitzentrale, der eine Person ausfindig machen möchte, die Sichtung einer enormen Menge von Aufnahmen. Es müssten nach und nach alle Alarmsituationen abgearbeitet und hierbei andere Referenzen zu Rate gezogen werden. Um die Sache komplizierter zu machen, könnten diese Quellen aus anderen Bezirken der Stadt stammen, welche möglicherweise ein abweichendes System oder Prozedere verwenden.

Endloses Bildmaterial zum Sichten

Die durchschnittliche, optimale Dauer, während der sich ein CCTV-Betreiber konzentrieren kann, beträgt 20 bis 30 Minuten. Stellt man sich nun vor, mehrere Monitore im Auge zu behalten, während es endlos Bildmaterial zu sichten gilt, wird die Aufgabe, eine bestimmte Person „manuell“ ausfindig zu machen, nahezu unmöglich, mindestens aber unfassbar zeitraubend. Von der technischen Seite betrachtet, kann die schiere Menge der Daten, welche zur Handhabe und Übertragung der Kameraaufnahmen benötigt wird, ganze Systeme maßgeblich verlangsamen. Tatsächlich sind einige der datenschwersten Prozesse in durchschnittlichen Leitstellen zur Stadtüberwachung anzutreffen.

Schnellere Erfolge dank Suchfunktionen

Aber wie wäre die Situation, könnte man diesen Prozess beschleunigen? Hier ein mögliches Szenario: Ein Laptop eines Passanten wird in Barcelona entwendet (nebensächlich, aber Barcelona gilt als Stadt mit den meisten Diebstählen). Was wäre nun, könnte der Betroffene zur nächsten Polizeidienststelle gehen und berichten, wo und wann sich der Vorfall zugetragen hat? Mit einem Foto von sich als Referenz könnte er selbst leicht auf den CCTV-Aufnahmen ausfindig gemacht werden. Unter Zuhilfenahme der genannten Zeit und des Ortes sollte das Bildmaterial des Verbrechens schnell zu finden sein. Sobald die Person, mit der das Opfer zum Zeitpunkt der Tat Kontakt hatte, auf der Aufnahme ausfindig gemacht wurde, könnte sein oder ihr Bild genutzt werden, um die Person weiter zu verfolgen. Die Betreiber könnten die Person schlussfolgernd auch in den neuesten Daten ausfindig machen – was zu einer Verhaftung und möglicherweise auch zu einem Wiederauffinden des gestohlenen Laptops führen könnte. Dies ist ein sehr einfaches Beispiel, und es bleiben eine Reihe von offenen Variablen, die über den Erfolg in dieser Situation entscheiden. In jedem Fall würde eine zuverlässige Suchfunktion den Vorgang maßgeblich beschleunigen, und eine Verhaftung des Täters in den Bereich des Möglichen rücken.

Künstliche Intelligenz im Einsatz

Hier kommt die Deep-Learning-Technologie ins Spiel, ebenso die Vorteile, welche sich aus dem Verbinden aller Ressourcen zur Überwachung einer Stadt – beispielsweise über eine KI- Cloud – ergeben. Die Kameras werden im Wesentlichen zu einem Sensor, welche kontinuierlich Bildinformationen aller Bereiche der Stadt zur Verfügung stellen. Die Aufnahmen würden in eine regionale Zentrale geleitet, in welcher Netzwerkvideorecorder (NVR) zur Verarbeitung der Daten genutzt werden könnten. Diese NVR dienen als die „Arbeitstiere“, welche den Löwenanteil der Analyse und Speicherung der Daten zu bewältigen hätten. In Folge dessen könnte das wahre Pozential des ganzen Systems freigesetzt werden, indem alle Bereiche der Stadt über eine KI-Cloud verbunden werden und so auf die Daten von allen Seiten zugegriffen werden könnte.

Beschleunigte Prozesse

Weil die Aktivitäten mit dem großen Datenvolumen auf den Geräten am Rand des Systems (daher Edge-Devices) stattfinden, muss die Verbindung zur Cloud nur Abfragen verarbeiten. Dies beschleunigt den Prozess essentiell. Mit Rechenleistung rund um die Uhr, sieben Tage die Woche können Edge- Devices strukturierte und semi-strukturierte Daten von Schlüsselinformationen der Bild- und Videodateien bereitstellen. Dies reduziert die Arbeit und die benötigte Speicherkapazität des Netzwerks, ebenso wie die Übertragungskosten und eröffnet Ressourcen auf der Cloud-Seite.

Bilder zuordnen und querprüfen

Mehr auf Sicherheit.info

Im zuvor genannten Szenario könnte die Suche also unter Zuhilfenahme aller der Stadt zur Verfügung stehenden Ressourcen durchgeführt werden. Das Bild der Person könnte in kürzester Zeit zugeordnet und auf neuere Übertragungen quergeprüft werden. Diese Technologie existiert bereits, beispielsweise in Hikvisions intelligenten Produkten wie den „DeepinView“-Kameras, „DeepinMind“- NVRs und der KI-Cloud. Diese Produkte bieten ausgereifte Gesichtserkennungstechnologie, welche einen stabilen Baustein einer Smart-City-Lösung darstellen kann. Das Gedankenspiel mag für einen Diebstahl überzogen wirken. Was wäre aber in Anbetracht eines schwerwiegenderen Verbrechens wie Entführung oder gar Mord? Man könnte auch argumentieren, dass die im Beispiel genannte Vorgehensweise Macht an den Einzelnen zurückgibt. Es wird viel über den Schutz der Privatsphäre gesprochen, doch die Person, die zu Beginn gesucht wurde – mit deren Zustimmung – war das Opfer. Dann, sobald klar ersichtlich ist, dass die zweite involvierte Person kriminell handelt, könnte man auch argumentieren, dass einige der Rechte dieser Person, die Privatsphäre betreffend, damit verwirkt sind. Auch wenn die Kontrolle der Prozesse und Privatsphäre in Betracht gezogen werden sollte, könnte diese Technologie essenziell zur Ergreifung Krimineller beitragen. Es könnte ebenso jedem Einzelnen ein Gefühl der Bestärkung vermitteln, und den Ruf der Stadt in Bezug auf Sicherheit bereinigen.

Kontakt- und Firmen-Infos im Branchenverzeichnis