GeoIp-Fehler – Oder wie Wikipedia Horch und Guck funktioniert

Laut Wikipedia:Administratoren/Notizen lieferten in der Vergangenheit zahlreiche GeoIP Abfragen falsche Ergebnisse. Der „Wohnort“ des Menschen hinter der IP (im fogenden IPs genmannt) lag damit oftmals woanders. Beispielsweise in München statt in Bremen

Dies führte dazu, dass:

  • Die Horch & Guck Fraktion der Wikipedia in aller Regelmäßigkeit diese Abfragen nutzten, um IPs einem gesperrten User aus der falschen Stadt zuzuorden, der dann gefälligst ebenfalls gesperrt gehört. Im Regelfall folgen Administratoren diesen „wertvollen“ Expertisen „erfahrener“ Horch und Guck Experten.
  • In normalen Artikeldiskussionszusammenhängen musste IPs sich offtmals  auch nur anhand dieser GeoIP-Erleuchtungen damit genervt herumschlagen, sie seien jener oder dieser gesperrte Teufel persönlich.

Dieser Fall bedeutet neben dem Folgen für IPs aber auch weiteres. Es gibt eine Horch & Guck Grupp in der Wikipedia

  • die Informationen sammelt über den realen Wohnort von Menschen.
  • die Informarionen sammelt über Autoren die mit IP arbeiten.
  • die vetrauensvoll mit den Administratoren zusammenarbeitet und diesen zuarbeitet. Dies führt zu den bekannten Sperren auf Zuruf, in denen im Konfliktfall ein Administrator sich nicht mehr beide Seiten anschaut

Diese Erkenntnis der falschen Verortung führte dazu,dass die Horch und Guck Fraktion wohl besseres Material brauchte. Es wurde unter anderem vorgeschlagen, dass die Wikipedia doch dafür Geld hinblättern soll, dass eine „gute“ Datenbank für die Verortung von IPs gekauft und implementiert wird, mit der man noch besser und zuverlässiger Informationen über nicht angemeldete User (IPs) erlangen kann.

Gewiss eine bessere GeoIP-Abfarge erhöht die Wahrscheinlichkeit der richtigen Zuordnung zu gesperrten User. Dazu gehören aber auch noch weitere Kenntnisse über den gesperrten User.

Hierzu ein Beispiel aus eigener Erfahrung (auch der Grund für dieses Beitrag). In dieser VM wurde ich vom Melder eindeutig dem User M. zugeordnet. Alles sollte stimmig sein. der „Tonfall, Themenbereiche, sprachlicher Duktus und Argumentationsmuster“. Nach der Erkenntnis der falschen Verortung hat sich der Melder einen neuen User für seine Zuordnungen gesucht. „Tonfall, Themenbereiche, sprachlicher Duktus und Argumentationsmuster“ werden sicherlich immer noch stimmen ;-). Es könnten noch weiter Beispiele aus eigener Erfahrung und Zuordnungen zu anderen Usern aufgezeigt werden. Aber das würde zu weit führen.

Was bedeutet dies für Mutmassungen über IPs, den „Asozialen“ der deutschen Wikipedia?

  • Behauptungen a’la „Tonfall, Themenbereiche, sprachlicher Duktus und Argumentationsmuster“ sind oftmals leeres Geschwätz. Das Gefühl mag einem zwar sagen Hallo! das kennt man doch … führen aber auch dazu, dass User/IPs immer wieder nur durch solche göttlichen Eingebungen gesperrt werden.
  • Es existiert in der Wikipedia ein Anschwärzungsmechanismus. Gesettelte User schwärzen an und der Einfachheit halber wird deren „Fachexpertise“ gefolgt. Ziel des Anschwärzens ist die Durchsetzung des eigene inhaltlichen Standpunkts.
  • Der Glaube an technischen Lösungen hat eine viel zu hohe Bedeutung
  • Die Wikipedia bewegt sich in Richtung „Schnüffelportal“. Es ist nicht Aufgabe der Wikipedia, Infrastuktur einzukaufen, mit der bessere Informationen über Menschen erlangt werden können.
  • Die Wikipedia verliert durch eine solche Schnüffelpraxis viele interessierte Neuuser.

Browser-Fingerprinting – Mythos Anonymität in der Wikipedia

Bei den Benutzern speichert die Wikipedia nicht allein die gute alte IP-Adresse, die Tante „Cookie“ oder die Standard-Logs mit den Bearbeitungen der Benutzer. Die Wikipedia scheint über Bildschirmauflösungen, Betriebssysteme, Browserversionen, Browsereinstellungen und vielem mehr, alles an Informationen aufzusaugen, was sie von Besuchern bekommen kann.

Der wikipedianische Fingerabdruck Quelle wikimedia.org, Datei Fingerprint_picture.svg, Autor User:Wilfredor, Bild verändert

Wunsch und Wirklichkeit

Wikipedia räumt jedem Benutzer ein Recht auf Anonymität ein. Dieses Recht ist disponibel, d. h. jeder Benutzer kann selbst darüber entscheiden, ob er seinen Klarnamen, Angaben, die auf seine Identität schließen lassen, oder sonstige personenbezogene Daten nennen möchte oder nicht. (Wikipedia:Anonymität, 1.11.2013)

Unvollständige und magere Angaben zum Datenschutz

Die Datenschutz-Erklärung der deutschen Wikipedia nennt kennt vor allem die altbekannten Standards an technischen Informationen, die von einem Besucher gespeichert werden: IP Adresse, Cookies oder Bearbeitungslogs. Nicht genannt werden die Daten die durch sogenannte User Agents anfallen können. Erwähnung finden diese erst in den Hinweisen zu den sogenannten Checkusern.

Über User Agents kann „Aufschluss über verwendete Systeme und Browser“ erlangt werden heißt es dort schlicht und einfach. An anderer Stelle erwähnen Administratoren „Bildschirmauflösungen“ oder auch „[…] betriebssysteme, […] browserversionen, […] browsereinstellungen, etc.„.

Doch was steckt hinter diesen User-Agents? Kleine Online Beamte, die an die Tür eines Benutzers klopfen und höflich um eine Spende für die Wikipedia bitten? Wohl kaum. Nachgefragt wird nicht.  Es scheint das sogenannte Browser-Fingerprinting zu sein dessen sich die Wikipedia bedient. Doch was ist Browser Fingerprinting?

Browser-Fingerprinting

Ein Browser Fingerprint erstellt einen digitaler „Fingerabdruck“ Ihrer Systemkonfiguration, die von einer beliebigen Website gesammelt werden können. Einige Informationen werden von ihrem Browser automatisch gesammelt. Weitere können durch JavaScript oder andere Skriptsprachen ausgelesen und an den Server zurück geschickt werden. Merkmale können sein: installierte Schriftarten, das verwendete Betriebssystem, verwendete Browsererweiterungen und mehr. Zusammengesetzt stellen die Merkmale den digitalen Fingerabdruck Ihres Systems dar.

Browser-Fingerprinting ermöglicht so – wie bei Cookies – das Benutzer-Tracking, das verfolgen der Spur eines Internetbenutzers im Netz. Die Fingerabdrücke sind zum allergrößten Teil einzigartig. Zusammen mit der IP-Adresse erhöht sich die Zuordbarkeit zu einer konkreten Person noch einmal. Ein sogenannter Checkuser-Beauftragter in der Wikipedia nannte in diesem Zusammenhang unter Berücksichtigung der Merkmale IP-Range, Betriebssysteme, Browserversionen, Browsereinstellungenn und „etc.“ eine Prozentzahl im Bereich 99,9999998 %.

Links

 Selbsttests und Ergebnisse

Was Browser-Fingerprinting bedeuten kann erschließt sich am Besten in einem Selbsttest. Beispiele  zum Test finden sich z.B. hier.

Ergebnisse sehen dann wie im folgenden Screenshot aus. Die Masse an Informationen ist beeindruckend.

 

Browser FingerPrint

Browser FingerPrint

 

 

 

Speicherung von Anmeldename mit IP durch die Wikipedia auch wenn keine Bearbeitungen vorliegen

Wikipedia so Eigenwerbung „räumt jedem Benutzer ein Recht auf Anonymität ein. Dieses Recht ist disponibel, d. h. jeder Benutzer kann selbst darüber entscheiden, ob er seinen Klarnamen, Angaben, die auf seine Identität schließen lassen, oder sonstige personenbezogene Daten nennen möchte oder nicht.

Darüber hinaus sammelt die Wikipedia eigenständig aber auch fleißig Benutzerdaten. Zum Beispiel Daten darüber, wann ein User sich eingeloggt hat und über das Betrachten von Seiten sonst keine weiterer Aktionen durchführte.

Auf die gleichzeitige Speicherung von IP und Anmeldename auch bei Nichteditieren, also beim reinen Aufrufen von Seiten deutet der Dialog hin, der das Erstellen von Benutzerkonten unterbindet, wenn zuvor ein  gesperrter Benutzer unter dieser IP angemeldet war.

Benutzername und IP auch bei reinem Betrachten von Seiten

Speicherung von Benutzername und IP auch bei reinem Betrachten von Seiten

Zu sehen ist:

  • Es liegt eine gemeinsame IP mit einem gesperrten User vor.
  • Der gesperrte angemeldete User hat die IP Adresse zuvor oder gleichzeitig genutzt.
  • Anmeldename und IP Adresse werden seitens der Wikipedia gespeichert (daher die Warnung)
  • Der angemeldete User hat in der Wikipedia nicht editiert (da gesperrt)

Dies lässt keinen anderen Schluss zu als dass die Wikipedia über das reine Loggen von Bearbeitungen auch schon das Einloggen eines User tabellarisch mit IP-Adresse verzeichnet

 

 

Wikipedia Missbrauchsfilter – Personenbezogene Filterung von Bildschirmauflösungen! – Nutzung aller Benutzerinfos?

Ein Benutzer versuchte in der Wikipedia im November 2012 folgende Wortfolge zu speichern:

[[File:Msc 2007-Sunday, 11.00 - 13.00 Uhr-Zwez008 Larijani 
Steinmeier.jpg|200px|thumb|von links: [[Ali Laridschani]], 
Dolmetscher, Mohammad-Mehdi Akhoundzadeh (am Fenster), 
Kellnerin, [[Frank-Walter Steinmeier]]]]

Der personenbezogene Filter „Thomas7“ schlug dabei zu. Auf Anfrage, ob dies nun ein auf eine personenbezogene Filterung von „IP-Nummern-Bereiche? Einen Regulären Ausdruck? Wortfilter?“ zurückzuführen sei, bekam er die Antwort, dass sein IP-Bereiche und seine Bildschirmauflösung Grund für die Sperrung der Bearbeitung war.

Die deutet darauf hin, dass im Rahmen der sogenannten Missbrauchsfilterungin der Wikipedia eine breite Bandbreite an übermittelten Informationen zum User zur Verfügung stehen. Das Logging eines Webservers gibt vielerlei Informationen preis. Mögliche Informationen sind laut Wikipedia:

  • Wie lauten IP-Adresse und Hostname des Nutzers?
  • Welchen Browser hat er genutzt?
  • Auf welcher Seite stand der Link, mit dem der Nutzer auf die Seite gekommen ist?
  • Welche Suchmaschine und welche Suchwörter hat er genutzt?
  • Wie lange blieb er auf der Website?
  • Wie viele Seiten ruft er dabei auf?
  • Auf welcher Seite hat er die Website verlassen?
  • Welche Ergänzungsmodule hat er installiert?
  • Welches Betriebssystem nutzt er?
  • Welche Internetseiten hat Mitarbeiter Mustermann während der Arbeitszeit besucht? (hier muss in Firmen der Regel der Betriebsrat einbezogen werden)
  • Woher kommt der Nutzer?

Diese Fragen lassen sich vor allem durch die Auswertung der sogenannten Kommunikationsranddaten beantworten.

Missbrauchsfilter – Eine Möglichkeit für Administratoren den Datenschutz in der Wikipedia zu umgehen

Die Einsicht von IP Adressen ist per Gesetz Wikipedistans nur einem eng begrenzten Personenkreis erlaubt: den sogenannten Checkusern. Mittels des sogenannten Missbrauchsfilters kann die IP beliebiger angemeldeter Benutzer eingesehen werden.

Die sogenannte „Checkuser“-Funktion der Wikipedia ist mit nicht unerheblichen Datenschutzeingriffen verbunden. Die von einem Benutzer verwendeten IP-Adressen sollen daher nur für fünf speziell für diesen Zweck gewählte Checkuser-Beauftragte in der Wikipedia einsehbar sein. Dies ist auch noch explizit auf der Datenschutzseite der deutschen Wikipedia garantiert.

Sollten sie. Wenig bekannt ist, dass einigen hundert Administratoren über den sogenannten Missbrauchsfilter ebenfalls die Möglichkeit geboten wird, die IP-Adressen angemeldeter Benutzer einzusehen.

Die Details eines Filtereintrags sind in den Standardeinstellungen nur für Administratoren einsehbar. Sie beinhalten die vorgenommene Aktion, den Benutzernamen und einen Zeitstempel. Darüber hinaus wird in den Details eines Vermerks im Abschnitt „Private Daten“ die  IP-Adresse des Benutzers ebenfalls quasi-öffentlich gemacht.

Ein Beitrag auf der Seite für  Checkuseranträge deutet darauf hin, dass diese Möglichkeit den Datenschutz zu umgehen in der Wikipedia auch tatsächlich benutzt wird. Ein Benutzer schrieb dort:

„Im übrigen ist durch die Difflinks der Mißbrauchsfilter […], der leider seit Neustem nur von Adminitratoren eingesehen werden kann (und was ich leider an dieser Stelle aus Transparentgründen kritisieren muß), eindeutig hervorgegangen, dass Du und [Benutzername gelöscht] identisch seid.“

Missbrauchsfilter Details

Das Missbrauchsfilter Logbuch zeigt eine Liste aller Aktionen, die durch einen Filter aufgefangen wurden. Die für Administratoren einsehbaren Details legen private Daten offen

Neusprech in der Wikipedia – Zensur soll bald Bearbeitungsfilter heißen

Die Wikipedia scheint sich zu schämen. Der sogenannte „Missbrauchsfilter„, benannt nach der MediaWiki Erweiterung Abuse-Filter und der als Instrument der Zensur für Administratoren dient, wird aller Voraussicht nach bald den wesentlich harmloseren Namen Bearbeitungsfilter bekommen.

Wissen für alle Nationen - Quelle Wikimedia Commons

Wissen für alle Nationen – Quelle Wikimedia Commons

Dies scheint zu mindestens der Trend der aktuellen Abstimmung innerhalb der Wikipedia zu sein. Eine übergroße Mehrheit spricht sich für die Umbenennung aus. Ziel der Umbenennung ist es den unbedarften Benutzer nicht mit den Zielen und Einsatzgebieten der Wikipedia-Erweiterung zu konfrontieren und zu erschrecken. Die übergroße Mehrheit der Benutzer mache nur einfache unbedeutende Fehler und solle nicht in die „Ecke mit Trollen und Vandalen gestellt“ werden. Einer der Befürworter der Abstimmung, Harald Krichel alias Seewolf, ehemals tätig im Vorstand von Wikimedia Deutschland e.V. meint dazu: „Hauptsache, dass diskriminierende „Missbrauchs-“ kommt raus„.

Harmlose Bearbeitungen – Aussperrung ganzer Netzbereiche

Screenshot Meldung des Missbrauchsfilters der Wikipedia: Ganze Netzbereiche werden in der Wikipedia auf einzelnen Seiten von der Mitarbeit ausgeschlossen.

Was mit dem Filter möglich ist und wofür er eingesetzt wird wird, erfährt der Durchschnittsbenutzer nicht.

Der Filter ermöglicht es, ganze IP-Bereiche von der Bearbeitung einzelner Seiten oder ganzer Seitengruppen auszuschließen.

Der Screenshot rechts zeigt die Meldung „Deinem Netzbereich wurde wegen anhaltender regelwidriger Bearbeitungen der Schreibzugriff auf diese Seite längerfristig entzogen. “ der Wikipedia nach Eingabe des Satzes „Ich schätze am Diderot-Club die Möglichkeit der freien Meinungsäußerung. “ als nicht angemeldeter Benutzer mit frischer IP auf der Seite des sogenannten Diderot-Clubs, einer Benutzerseite in der deutschen Wikipedia. Auf dieser Seite, die sich die freie Meinungsäußerung aufs Blatt geschrieben hat, werden ganze IP-Bereiche blockiert. Weitere Einsatzgebiete des Filterns betreffen generell alle Benutzerseiten, Wikipedia-Funktionsseiten oder einzelne Artikelseiten.

Anonymität ? – Zuordnung von Netzbereichen und Benutzer

Die Filterung nach Netzbereichen bietet dem geneigtem Administrator eine weitere Möglichkeit. Auch die IP-Adressen angemeldeter Benutzer können dem Netz des Netzwerkbereichsfilters nicht entwischen. Ist einem Administrator der Netzbereich eines Benutzers bekannt, hat er über die Hinweise aus der Filterung die Möglichkeit auch User, die einen neuen, anderen Benutzernamen wählten, dem alten Benutzernamen zuzuordnen. Viele dieser mitgeschnittenen Informationen sind nur Administratoren zugänglich. Die von der Wikipedia explizit garantierte Anonymität wird so teilweise unterlaufen. Informationen über IP-Adressen (hier das Subnetz) angemeldeter Benutzer, die eigentlich nur einer Handvoll spezieller Administratoren zugänglich sein sollten, den sogenannten Checkusern werden so den ca. 300 Administratoren und damit weiteren Kreisen zugänglich.

Transparenz

Von den ca. 120 existierenden Filtern (Stand 6.2.2012) sind ca. 75 Filter privater Natur. Bei den öffentlichen Filtern können auch „normale“ Benutzer die Ergebnisse der Filterung einsehen. Die Einsicht in die Logdateien der sogenannten „privaten“ Filter, die 2/3 aller Filter ausmachen, ist Administratoren vorbehalten.

Angesichts der Tatsache, dass die Umbenennung des Missbrauchsfilters in Bearbeitungsfilter damit begründet wird, dass die Mehrzahl der Filter Fehler wie dem „ungewollten Einfügen von Wikisysntax“ betreffen („Bei vielen der aktivierten Filter geht es jedoch nicht um die Verhinderung von Missbrauch, sondern vielmehr um auf Fehler aufmerksam zu machen und diese zu protokollieren. Ein Beispiel dafür ist Spezial:Missbrauchsfilter/6 [öffentlicher Filter, der Verf.] (ungewolltes Einfügen von Wikisyntax aus der Zeichenleiste)“, ist dies ein merkwürdige intransparenter Umgang mit solcherlei Marginalien.

 

Mailingliste des Wikipedia-Vereins Wikimedia Deutschland e. V. band sogenannte Web-Wanzen ein

Am 7. Oktober 2011stellte sich heraus das in E-Mails des Vereins des Wikimedia Deutschland e. V. sogenannte Web-Wanzen, auch Zählpixel genannt, eingesetzt wurden.

Zählpixel sind kleine Grafiken die eine Logdatei-Aufzeichnung und eine Logdateianalyse ermöglichen, die für statistische Auswertungen verwendet werden können. Zählpixel ermöglichen das Aufzeichnen personenbezogener Daten und sind entsprechend datenschutzrechtlich umstritten. Sie ermögliche Bewegungsprofile, die Ermittlung von Informationen über die IP-Adressen der Empfänger mitsamt der damit möglichen Verortung mithilfe von Geotargeting. Die vom Verein verwendete Software ist laut Beiträgen auf der Mailingliste CiviCRM. Die Software ermöglicht unter anderem das Personalisieren von Nachrichten und die die Überprüfung, wann ein Empfänger eine Nachricht öffnet. Zu finden war der Zählpixel im Quelltext von E-Mails des Vereins:

<img src="https://crm.wikimedia.de/civicrm/extern/open.php?
 q=XXXXX" width='1' height='1' alt='' border='0'>

wobei XXXXX vermutlich eine persönliche Kennziffer darstellt.

Das Einbinden des Zählpixels kann vor dem Versand unterbunden werden. Laut Wikimedia Deutschland geschah dies wohl nicht. Ein Mitarbeiter des Vereins schreibt: „CiviCRM scheint das per Default so zu machen. Es gibt eine standardmäßig aktive Option, die man vor dem Versand abwählen muss, um dieses Verhalten abzustellen. Ich suche gerade nach einer Möglichkeit, das grundsätzlich auszuschalten, habe aber bislang noch keine gefunden.

Man darf gespannt sein, ob die Web-Wanze mittlerweile „debugt“ wurde.