Die erfassten Bereiche sind gut zu erkennen.
Foto: Bundespolizei

Biometrie

Bitte neutral gucken!

Wie alltagstauglich war die Gesichtserkennung am Bahnhof Berlin Südkreuz und welche Ergebnisse kann das Pilotprojekt vorweisen?

Der automatisierte Abgleich von Daten zum Zweck der Fahndung und Strafverfolgung gewinnt in der digital vernetzten Welt zunehmend an Bedeutung. Solche Systeme können die Polizei sinnvoll unterstützen, erfordern aber neben der technischen Zuverlässigkeit auch Konzepte zum Datenschutz und zur Wahrung der Selbstbestimmungsrechte der Bürger. Gerade die automatische Gesichtserkennung ist eine vergleichsweise junge und durchaus umstrittene Technologie, die nun umfassend in einem Pilotprojekt von der Bundespolizei erprobt worden ist.

Das vom Bundesministerium des Innern, für Bau und Heimat, der Bundespolizei, dem Bundeskriminalamt und der Deutschen Bahn AG vom August 2017 bis Ende Juli 2018 durchgeführte Pilotprojekt ist in zwei Abschnitte aufgeteilt worden. In der ersten Testphase nahmen 312 freiwillige Personen, überwiegend Pendler, teil. Von ihnen wurden für eine Referenzdatenbank hochwertige Aufnahmen angefertigt. Die Aufnahmen waren schattenfrei, hatten eine nur geringe Kompression, waren gut ausgeleuchtet und die Blickrichtung der Personen war geradeaus. Für das Projekt wurden drei Kameras vom Typ „AXIS M1125“ der insgesamt 77 am Bahnhof Südkreuz eingesetzten Videoüberwachungskameras an ausgesuchten und deutlich gekennzeichneten Stellen genutzt, um die Personen möglichst unter realen Bedingungen zu erfassen. Die drei verwendeten Gesichtserkennungssysteme wurden zudem technisch in das bestehende Videomanagementsystem am Bahnhof Berlin Südkreuz integriert, die erfassten Bereiche deutlich kenntlich gemacht.

Erste Testphase ermutigend

In der ersten Testphase lieferten die Gesichtserkennungssysteme der drei Anbieter in der Summe positive Ergebnisse. Die durchschnittliche Trefferrate lag bei 68,5 Prozent; die maximale Trefferrate betrug bis zu 86,3 Prozent. Die Falschakzeptanzrate (FAR) der Einzelsysteme lag zwischen 0,12 Prozent und 0,25 Prozent. Betrachtet man die drei Systeme im Verbund, lag die Trefferrate bei mindestens 76,7 Prozent und maximal 94,4 Prozent, mit einer Falschakzeptanzrate bei 0,67 Prozent. Für beide Testphasen gelten vier Kategorien für die gemeldeten Treffer: Richtig positiv (Treffer gemeldet, Person wurde richtig erkannt), richtig negativ (kein Treffer gemeldet, Person nicht in Referenzdatenbank), falsch positiv (Treffer gemeldet, Person nicht in Referenzdatenbank) und falsch negativ (kein Treffer, Person ist jedoch in der Referenzdatenbank). Die FAR bezieht sich auf das Verhältnis der Anzahl falsch erkannter Personen zur Gesamtanzahl der in einem bestimmten Zeitraum detektierten Gesichter, die nicht zur Referenzdatenbank gehören. Die Treffer wurden mittels eines Transponders bei den teilnehmenden Pendlern validiert, der die Position der Person in einem überwachten Bereich meldete. Die Ergebnisse der ersten Testphase wurden im Abschlussbericht des BMI positiv beurteilt. Die Systeme können gerade bei der Gesamtbetrachtung und einer „Oder“-Verknüpfung, bei der ein Treffer eines der Systeme als einer des logischen Gesamtsystems gewertet wird, verwertbare Ergebnisse liefern.

Licht und Schatten

Für die Testphase zwei wurde die Referenzdatenbank mit den qualitativ hochwertigen Bildern gelöscht und durch eine neue Referenzdatenbank ersetzt. Diese bestand nun aus Bildern der freiwilligen Teilnehmer, die aus den Videoströmen der für die Phase eins genutzten drei Kameras extrahiert worden waren. Für jeden Freiwilligen wurden zwei bis fünf solcher Bilder in der Datenbank gespeichert. „Die Gesichtserkennungssysteme sollten hierdurch mit realistischen ‚Fahndungsfotos‘, die im Rahmen polizeilicher Ermittlungsarbeit regelmäßig aus der konventionellen Videoüberwachung gewonnen werden und unterschiedliche Bedingungen berücksichtigen (etwa das Tragen von Accessoires wie Sonnenbrillen, Mützen, Schals, aber auch unterschiedliche Lichtverhältnisse, verschiedene Gesichtspositionen), getestet werden“, erläutert Stephan Mayer, parlamentarischer Staatssekretär des Bundesministeriums des Innern, für Bau und Heimat. Generell liegt die Schwierigkeit für die Systeme in den Umgebungsvariablen. Eine Änderung der Beleuchtungsverhältnisse oder des Betrachtungswinkels schafft eine größere Variation der Bilder des gleichen Gesichts als die Änderung des Bildes aufgrund des Wechsels des Gesichts selbst. Hinzu kommen weitere Faktoren wie Alterungsprozesse, die An- oder Abwesenheit von Brillen und Bärten, Wechsel der Mimik sowie kosmetische Veränderungen, die die äußere Erscheinungsform für die Systeme deutlich beeinflussen können.

Die Ergebnisse der zweiten Testphase zeigten im Schnitt eine Steigerung der Leistungsfähigkeit der Systeme. So lag die maximale Trefferrate eines Systems bei 91,7 Prozent, die durchschnittliche Rate aller Systeme zusammen bei 91,2 Prozent. Ebenso sank bei allen Systemen die FAR deutlich. Dass die Systeme trotz qualitativ schlechtere Bilder als in der ersten Testphase im Schnitt besser Ergebnisse lieferten, lag an der höheren Zahl an Referenzbildern, die für den Abgleich zur Verfügung standen. Das BMI bescheinigt daher den Systemen im Abschlussbericht „dass aus Videoüberwachungsanlagen gewonnene Gesichtsbilder (Fahndungsfotos) grundsätzlich für die Verwendung in Systemen zur biometrischen Gesichtserkennung geeignet sind.“

Alltagstauglich?

Inwieweit die Anwendung solcher Verfahren in der Praxis allerdings zufriedenstellend funktionieren würde, ist nicht gänzlich unumstritten. Der Chaos Computer Club (CCC) geht in einer Stellungnahme zu den Testergebnissen davon aus, dass die FAR im Realbetrieb deutlich höher liegen würde, da in den Testbetrieben nicht alle Gesichter von Menschen analysiert wurden, sondern nur diejenigen, die in der Nähe eines Freiwilligen standen, wenn dessen Transponder registriert wurde. Selbst so kämen nach Meinung des CCC bei der ausgewiesenen FAR von 0,67 Prozent über alle Systeme in Testphase eins noch 600 Bilder zusammen, die manuell geprüft werden müssten. Im Realbetrieb schätzt der CCC diese Zahl wohl als signifikant höher ein. Das bedeutet, dass letztlich auch wieder ein Mensch eine Vielzahl an Bildern in kurzer Zeit manuell am Bildschirm überprüfen müsste. Da die Systeme mit ähnlichen aber nicht gleichen Algorithmen arbeiten, ergibt sich aus der Kombination von zwei oder mehreren eine deutlich höhere Genauigkeit als bei einem einzelnen. Je nach Einstellung ergäben sich für die polizeiliche Arbeit verschiedene Betriebsmodi. So könnte im Normalbetrieb Gesamtsystem einen Treffer melden, wenn zwei oder mehrere „Teil“-Systeme einen Treffer melden (logische Und-Verknüpfung), während bei besonderen Gefahrenlagen auf eine Oder-Verknüpfung umgestellt werden könnte, bei der bereits der Treffer eines Teilsystems ausgegeben würde, womit aber auch die FAR steigen würde.

Auf der Grundlage der Ergebnisse des Pilotprojektes am Bahnhof Berlin Südkreuz glauben Bundespolizei und BMI, dass die biometrische Gesichtserkennung nach dem Stand der Technik ein wichtiges Unterstützungsinstrument für die polizeiliche Fahndung sein kann und damit einen wertvollen Beitrag zur Gewährleistung von Sicherheit auf dem Gebiet der Bahnanlagen der Eisenbahnen des Bundes zu leisten imstande ist. „Die Implementierung von biometrischer Gesichtserkennung würde dort auch einen unmittelbaren Sicherheitsgewinn bedeuten, da gefährdete Verkehrsstationen der DB Station & Service AG ohnehin bereits mit moderner Videotechnik ausgestattet sind oder in den nächsten Jahren weiter ausgestattet werden“, so Mayer. Nach Einschätzung der Bundespolizei könnten durch den Einsatz dieser Technik mehr Fahndungserfolge, etwa im Bereich der Terrorismusbekämpfung und schwerer Straftaten, erzielt werden, als ohne diese Technik. Der Einsatz von Gesichtserkennungstechnik ist dabei nicht auf das Gebiet der Bahnanlagen der Eisenbahnen des Bundes beschränkt; er könnte überall dort erfolgen, wo (polizeiliche) Videoüberwachung im öffentlichen Raum, beispielsweise zum Schutz Kritischer Infrastrukturen, stattfindet. Umfang und Grenzen des Einsatzes der biometrischen Gesichtserkennung sollten dabei durch die jeweilige Gesetzgebung des Bundes und der Länder ausgestaltet werden.

Vielfältige Erfolgsfaktoren

Die Ergebnisse der beiden Testphasen als generellen Erfolg für die biometrische Gesichtserkennung zu bewerten, scheint indes verfrüht, da der Erfolg stark von einer Vielzahl an Faktoren beeinflusst wird. Lichtverhältnisse, Winkel der Kameras und vor allem die Anzahl und Qualität der Referenzfotos tragen maßgeblich zum Erfolg oder Misserfolg eines Einsatzes der Technik bei. Ein Negativbeispiel für einen gescheiterten Einsatz ist etwa in New York zu sehen, wo die Software eines Anbieters nicht die gewünschten Erfolge erzielen konnte. In diesem Pilotprojekt sollte die Gesichtserkennung Pendler auf einer Brücke identifizieren, die mit einer Referenzdatenbank abgeglichen wurden. Trotz einer Vielzahl an Kameras musste die New Yorker Verkehrsbetrieb Metropolitan Transportation Authority (MTA) melden, dass das System nicht in der Lage war, Gesichter zuverlässig zu erfassen und abzugleichen. Ein Grund mag die Geschwindigkeit der Fahrzeuge sein, die ähnlich wie Winkel und Licht ein Faktor für Qualität der aufgenommenen Gesichter sein dürfte. Dies zeigt, dass die Technologie derzeit zwar ungeachtet datenschutzrechtlicher oder politischer Erwägungen zwar durchaus in Teilen erfolgversprechend scheint, ihr konkreter Einsatz aber sehr genau geplant und überlegt werden muss, da eine Vielzahl an Faktoren über Erfolg oder Misserfolg entscheiden, zu denen vor allem auch die Akzeptanz der Bürger zählt.