Mal nebenbei bemerkt, auch käufliche Anti-Virenprogramme melden Erkennungsdaten "nach Hause" und holen im Gegenzug neueste Daten zu Schadsoftware und Entfernungsroutinen aus dem Internet. So funktioniert heutzutage die Datenwelt. Genauso wie jede Menge "kostenlose" Software und Dienste, die wir alle täglich nutzen, Daten sammeln. Dies nützt uns sogar, denn wenn wir auf unsere Situation angepasste Ergenisse erhalten, ist das ja nicht schlecht.
Wenn man sich allerdings die Datenschutzrichtlinien durchliest, steht da oft irgendwas von Weitergabe anonymisierter Daten an Dritte. Ganz legal, und der Kunde weiß es sogar. Wenn genug Daten ganz legal weitergegeben werden, kommt ein findiger Erkennungsroutinenprogrammier damit schon ganz schön weit. Insbesondere, wenn er solche Daten aus verschiedenen Quellen analysieren kann - der einzelne Datensatz ist vielleicht nicht komplex genug, aber in der Kombination mit anderen kommt hier ein Stückchen Information hinzu, dort ein Stückchen Information hinzu, usw., bis sich ein präziseres Bild zeichnen lässt.
E-Mail-Adressen und vielleicht sogar Namen hat ja der Hersteller von gekauften Programmen meistens sowieso, durch die Registrierung. Ich vermute allerdings, dass das größte Risiko heutzutage die Unsitte ist, sich mit seiner E-Mail-Adresse irgendwo anzumelden. Manche Dienste verlangen das ja sogar zwingend. Um da anonym zu bleiben, muss man eine nicht aussagefähige E-Mail-Adresse haben - und man müsste bei der Angabe der Namen für die Anmeldung schummeln. Das wiederum verbieten die Nutzungsbedingungen. Honi soit, qui mal y pense.
Aber auch ohne Namen und E-Mail-Adresse lassen sich aus Daten zur Maschine und der darauf installierten Software, der IP-Adresse (Stichwort Geo-Lokalisierung), Computername oder vielleicht auch einfach nur üblicher Uhrzeiten, zu denen man "immer" ins Internet geht, Rückschlüsse ziehen.
Antivirenprogrammen sind besonders gut geeignet dafür, weil man ihnen vertraut und besonders weitgehende Rechte im System überlässt. Aber im Prinzip stehen auch dem einfachen Browser etliche Infos zur Verfügung.
Generell sind Big Data seit Jahrzehnten bekannt. Das erste Mal kam die Öffentlichkeit im Zuge der Supercookies (Kombinationen aus normalen Cookies, Flash-Cookies und was weiß ich sonst noch) darauf, dass die Kombination anonymer Einzeldaten erhebliche persönliche Rückschlüsse zulässt. Dann wurde den Fachleuten schnell klar, dass große Internetkonzerne (deren Dienstleistungen wir alle täglich permanent benutzen) diese und andere Möglichkeiten dazu benutzen, anonyme Daten zumindest teilweise zu ent-anonymisieren und zu strukturieren, um ihre Werbedaten aufzuwerten und ihre Werbekunden mit werthaltigen Informationen für Werbung zu versorgen, und dadurch den Wert und Preis ihrer "Ware" zu steigern. Wie gesagt, das kann für uns sogar nützlich sein. Ich freue mich immer, wenn mir ein Online-Versandhändler Werbung schickt, die genau in meine Interessengebiete fällt. Das interessiert mich wirklich, und ich freue mich, auf dem Laufenden zu bleiben hinsichtlich neuer Produkte in meinen Interessengebieten. Dasselbe gilt für andere auf mich zugeschnittene Werbung.
Ich finde die Aufregung darum im Allgemeinen immer wieder überraschend. Denkt wirklich jemand, all diese "kostenlosen" Dienste, die wir täglich nutzen, leben von Luft und Liebe? Die müssen Geld verdienen (auch "kostenlose" Software, wenn sie von Unternehmen stammt), und daran ist auch nichts Verwerfliches, aber wenn man sich die Börsenwerte oder Vermögenssituation dieser Unternehmen ansieht, muss doch jedem klar sein, dass diese Unternehmen ihren Werbekunden, denn über die finanziert sich ja das meiste, massiven Gegenwert anbieten können müssen, um derart viel Geld verdienen zu können. Die Daten werden erhoben, und auch wenn der Erhebende damit garnichts Schlechtes im Sinne hat, lassen sie sich zu Profilen auswerten.
Allein schon die Auswertung der IP-Adresse mit ein paar Browserdaten (der Browser greift auch Hardware-Informationen über den Rechner, auf dem er läuft, ab - muss er auch, aus technischen Gründen) lässt Rückschlüsse auf den Nutzer zu. Dazu noch einige Hardwaredaten zum Computer, Surfzeiten, der Computername, angeschlossene Peripherie, Grafikkarte und deren Einstellungen, Betriebssystem, Browsertyp und -konfiguration, installierte Add-ons, E-Mail-Adresse als Anmelde-Login, Angabe von Klarnamen bei der Registrierung - man könnte die Aufzählung verfügbarer Daten noch fortsetzen. Da muss nur einmal irgendwo eine Verbindung zum Namen auftauchen, und der Käse ist gegessen. Kleinere Änderungen an der Maschine usw. können dann sogar ausgefiltert werden, der Datensatz wird aktualisiert.
All das ist nicht nur seit Jahrzehnten bekannt, sondern eigentlich kann man sich das doch auch selber zusammenreimen.
Dennoch sollte man sich den Beitrag in Panorama ansehen - hauptsächlich in der Hoffnung, selber Informationen darüber zu gewinnen, welche Daten die Software abgreift und wie, damit man sich so gut es eben geht schützen kann. Bei den Supercookies von damals hieß es, keine Speicherung von Flash-Cookies und Flash-Einstellungen zuzulassen (denn schon die Einstellungen sind ja individuell und lassen Rückschlüsse auf den Computer/Verwender zu, wenn eine andere Flash-Software die Einstellungen abruft und diese dann eventuell nach Hause schickt und vergleicht).
Als neulich das Theater mit Whatsapp war, das Telefonnummern an Facebook weitergeben sollte, hab ich nur den Kopf geschüttelt. Auf den meisten Telefonen hat doch die Facebook-App die Telefonnummer schon, weil sie dazu in ihrer Standardeinstellung das Recht hat. Und wer macht sich schon die Mühe, das in den neueren Versionen von Android zu verbieten?
Aber vielleicht lassen sich solche Tips aus der von Disaina erwähnten Panorama-Sendung ableiten. Und man sollte seinen Computer umbenennen von "Hans Mustermann" in "xxx2351§"
