Artikel

Artikel drucken zurück

Big Brother war gestern

Der maschinenlesbare Mensch ist bereits Realität von Constanze Kurz

Mit der Aufforderung „Bezahlen Sie einfach mit Ihrem guten Namen“ warb in den 1980er Jahren American Express. Die moderne Variante dieses erfolgreichen Slogans lautet: „Bezahlen Sie einfach mit Ihrem Fingerabdruck.“ In der Tat gewöhnen sich die Europäer langsam an biometrische Bezahlsysteme. In Deutschlands Süden bietet zum Beispiel eine Handelskette die Bezahlung durch Vermessung der Minutien an, und ein großer niederländischer Supermarkt betreibt bereits seit zwei Jahren das System „Tip2Pay“, um bargeldlos über den Scan des Kundenfingers abzurechnen.

Ob der Kunde der Sicherheit der Systeme vertraut, ob er die Technik als nutzbringend empfindet, bleibt ihm überlassen. Auch wird ihm bei jedem einzelnen Scan ins Bewusstsein gerufen, dass sein Fingerabdruck eingelesen wird. Doch das gilt nicht für alle biometrischen Eigenschaften, die für die Identifizierung von Menschen verwendet werden können.

Der Biometrie, die körperliche Merkmale der Menschen vermisst, wird in absehbarer Zukunft eine neue Bedeutung zukommen. Die immer billiger werdenden allgegenwärtigen Überwachungs- und Aufzeichnungsapparaturen stellen eine Flut von Bildern, Videos und Tönen bereit, die kein Mensch mehr vollständig ansehen oder anhören könnte. Die Industrie verfolgt daher das Ziel, Systeme zu entwickeln, die die Aufmerksamkeit der menschlichen Bewacher auf die möglicherweise interessanten Kamerabilder, Telefonate oder Einkaufsmuster lenken. Software filtert dazu die aufgezeichneten Ereignisse und spuckt nur diejenigen aus, die zuvor programmierte Abweichungen vom Normverhalten aufweisen.

Bereits im Einsatz sind Systeme, die in Einkaufszentren nach verdächtig schnellen Bewegungen oder ungewöhnlich langem Aufenthalt Ausschau halten oder auf Parkplätzen nach Personen fahnden, die nicht zielstrebig zu einem Fahrzeug gehen, sondern länger verweilen oder atypische Laufmuster aufweisen. Dabei werden die Bilder vieler Kameras kombiniert. Schon heute funktioniert zudem die automatische Personenverfolgung über mehrere Kameraperspektiven hinweg anhand von Kleidung oder Gang so gut, dass die technisch schwierigere und fehleranfällige Gesichtserkennung dafür nicht mehr gebraucht wird. Die Silhouette des Menschen und seine körperlichen Proportionen sind, selbst aus der Distanz aufgenommen, ausreichend. Die erforderliche Technik ist längst nicht mehr brandneu: Die computerisierte Erkennung des menschlichen Gangs wird seit den 1990er Jahren intensiv erforscht.

Algorithmen können nicht nur bekannte Datensätze mit live aufgenommenen Bildern vergleichen, sie suchen auf Wunsch auch nach ungewöhnlichen, nonkonformen Verhaltensmustern und Anomalien. Anders als an den Supermarktkassen, wo man per Fingerabdruck bezahlen kann, merkt der Aufgezeichnete von einer derartigen biometrischen Vermessung, Erkennung und Klassifizierung nichts. Ob sich hinter den Kameras nur ein paar Monitore und ein gelangweilter Wachmann befinden oder ein Computer, der hunderte Kameras parallel nach Auffälligkeiten durchsucht, ist für den Fußgänger, der über die Straße geht, nicht erkennbar.

Die entscheidende technologische Veränderung ist die Vernetzung und die damit einhergehende Umstellung der Kameras auf Internetprotokolle. Dadurch wird es möglich, die Videosignale digital verlustfrei und kostenarm über große Entfernungen zu übertragen und zur Auswertung zusammenzuführen. Zunehmend schalten Handelsketten, Unternehmen und Betreiber von Einkaufszentren die Signale sämtlicher Überwachungskameras zu zentralen Auswertungsknoten zusammen.

Das Epizentrum des Markts für Videoüberwachungsanlagen (Closed Circuit Television, CCTV) ist die City of London. Hier werden die Live-Bilder, egal ob von privaten Betreibern oder staatlichen Sicherheitsbehörden, zu einem Ganzen zusammengeführt. Die ursprünglich vorhandene Trennung in viele kleine Verantwortungs- und Überwachungsbereiche entfällt, der gefürchtete Big Brother entsteht aus der technologiegetriebenen Kombination der vielen einzelnen elektronischen Augen zu einer universellen, flächendeckenden Rekonstruktion der tatsächlichen Ereignisse und menschlichen Verhaltensmuster.

Speicherplatz ist billig. Inzwischen kann man für weniger als fünfzig Euro die Aufzeichnungen einer Videokamera mehr als drei Monate lang archivieren. Damit sind frühere Annahmen, unter denen CCTV gerade noch akzeptabel gewesen sein mögen, hinfällig geworden. Während bis vor wenigen Jahren Aufnahmen nur kurze Zeit aufbewahrt und nicht vollständig ausgewertet werden konnten, steuern wir auf eine Zukunft zu, in der das einmal Aufgezeichnete nie wieder weggeworfen werden muss. Vor kurzem konnte man sich noch einreden, dass der Überwacher hinter den Monitoren sowieso nicht hinschaue. Jetzt wird dessen Aufmerksamkeit durch eine Software gelenkt, die auf alles reagiert, was nicht ins Muster des braven, shoppenden Bürgers passt.

Vergleichbare unbemerkte Messungen menschlicher Parameter lassen sich auf viele Bereiche übertragen. Schon seit dem 19. Jahrhundert ist bekannt, dass die Art, wie ein Operator Morse-Codes telegrafiert – seine sogenannte Faust – hinreichend charakteristisch und zugleich konsistent ist. Wenn jemand auf der Tastatur eines Computers tippt oder eine SMS auf seinem Mobiltelefon eingibt, tut er das auf eine unverkennbare, typische Art und Weise – das ist seit über zehn Jahren gut erforscht und für die Identifizierung verwendbar. Aufgezeichnet wird der Schreibrhythmus, der durch einzigartige Abfolgen und Zeitabstände unterscheidbar ist. Wie in einem Musikstück sind beim menschlichen Tippen Kadenzen zuverlässig messbar.

Auch mit Audiodateien lassen sich Personen anhand von Merkmalen oder Auffälligkeiten ihrer Sprache zweifelsfrei erkennen. Mathematisch gesehen ist die menschliche Sprache eine Sequenz von messbaren Werten, die ein Computer ohne weiteres syntaktisch verarbeiten kann. Softwareprodukte, die gesprochene Worte in geschriebene Sprache umwandeln, sind seit Jahren am Markt und funktionieren heute gut. Das aufwendige manuelle Transkribieren von Tonbandaufzeichnungen oder zeitintensive Exzerpieren und Verschlagworten für die Speicherung und das Wiederauffinden von Textstellen entfällt. Jedes aufgezeichnete Gespräch wird durch Algorithmen mit erprobter und optimierter Technik ohne viel Zeitverzug textuell durchsuchbar, bei geringem Aufwand und wenig Rechenzeit. Die Technik funktioniert so gut, dass sie auf der Videoplattform YouTube mittlerweile zu den Standardfunktionen zählt. Dort lassen sich Videos per Mausklick automatisch mit Untertiteln versehen. Die Sprache eines Videos wird nicht nur in Schrift verwandelt, sondern auch gleich in die gewünschte Sprache übersetzt.

Große Mengen Audiodateien, wie sie etwa in der Telefonie anfallen, können bei der Umwandlung in Text zeitgleich angereichert werden: kategorisiert etwa nach der Art des Gesprächs, eingeordnet in Datenbanken nach identifiziertem Inhalt, erweitert um sekundengenaue Zeitstempel, sortiert nach Alter, Geschlecht, Erregungszustand oder Dialekt. Verhaltensprofile können dadurch perfektioniert werden. Und natürlich ist es auf Knopfdruck möglich, mehrere Sprecher einer Aufzeichnung automatisiert voneinander zu unterscheiden und mit anderen, zuvor gespeicherten Audiodaten zu vergleichen.

All diese Methoden und Techniken der Auswertung von Sprachdaten haben sich – weitgehend unbemerkt von der Öffentlichkeit – weltweit ausgebreitet. Callcenter sind längst dazu übergegangen, ihre Kunden über deren Stimme zu identifizieren und zu klassifizieren. Ob der Anrufer ein wertvoller Kunde ist oder ein Problemfall, der sich oft beschwert, muss nicht erst im Gespräch erkundet werden, eine Maschine kann dies herausfinden, bevor ein Mensch den Anruf entgegennimmt. Die Zustimmung des Anrufenden muss dazu nicht erfragt werden.

Durch das Zusammenwirken dieser neuen Technologien und Algorithmen sowie ihre Vernetzung gerät die Frage, ob jemand etwas zu verbergen hat, mehr und mehr in den Hintergrund. Jetzt geht es verstärkt darum, unter welchen Umständen der Einzelne in den Fokus der Aufmerksamkeit gerät. Sobald das geschieht, lässt sich ein nahezu vollständiges Abbild seines Lebens erstellen. Dann hängt es nur noch von der Gnade oder den Absichten der Auswerter ab, welche Folgen es für den Einzelnen hat, dass seine individuelle Existenz lückenlos transparent gemacht wird. Ob das Ganze dem Zweck dient, einfach nur gezielter zu werben und mehr zu verkaufen oder aber politisch unliebsame Bestrebungen zu unterdrücken – Beschränkungen erfährt der Technologieeinsatz oft genug nur noch in Form von Gesetzen und sozialen Normen.

Es hat sich wiederholt als naiv erwiesen, darauf zu vertrauen, dass die Überwachungstechnik ganz von allein an den ungeheuren Datenmengen oder ihrer komplexen Verarbeitung scheitern werde. Auch wenn einige biometrische Verfahren wie etwa die Gesichtserkennung unzuverlässig und fehleranfällig sind – kombiniert mit der gezielt gelenkten menschlichen Aufmerksamkeit lassen sich die letzten paar Prozent Fehlerrate korrigieren und die angestrebten Ziele doch erreichen.

Der wache Bürger kann noch so sorgfältig auf den Schutz seiner Privatsphäre achten, er kann trotzdem nicht verhindern, dass messbare Verhaltensdaten in jedem Augenblick unsichtbar anfallen. Es nützt nichts, den Angreifer dadurch abwehren zu wollen, dass man sich die Hände vor die Augen hält. Die biometrische Vermessung hat aber noch einen weiteren Haken. Menschliche Körper- und Verhaltensmerkmale sind nicht wie ein Passwort ersetzbar, viele bleiben ein Leben lang konsistent. Sind sie erst einmal digital festgehalten, lassen sie sich der jeweiligen Person auf immer zuordnen.

Die Diplominformatikerin Constanze Kurz forscht und lehrt als wissenschaftliche Mitarbeiterin in der Arbeitsgruppe „Informatik in Bildung und Gesellschaft“ an der Humboldt-Universität zu Berlin. Sie ist Sprecherin des Chaos Computer Clubs (CCC). © Le Monde diplomatique, Berlin

Le Monde diplomatique vom 13.08.2010,