Archive for the ‘netzpolitik’ Category
Datenschutzregelungen sind zu kompliziert – selbst für den Innenminister
Nachdem ich ja neulich schon festgestellt hatte, dass die geltenden Datenschutzbestimmungen für die engagierte Netzgemeinde zu kompliziert sind zeigt sich grade, dass auch der Innenminister die einfachsten Regeln nicht versteht. Das Innenministerium hat heute den Preis im Ideenwettbewerb “Vergessen im Internet” verliehen. Auf der Seite wird lobenswerterweise Piwik verwendet. Entgegen den deutschen Datenschutzbestimmungen wird jedoch ein Cookie mit einer Gütigkeitsdauer von 2 Jahren gesetzt. Und dies entgegen den Ausführungen in der Datenschutzerklärung. Denn eine Personalisierung ohne Registrierung findet nicht statt und bräuchte daher keine Cookies. Wie eine korrekte Datenschutzerklärung bei der Verwendung von Piwik aussieht? Hier.
Gänzlich verwirrend wird es, wenn davon die Rede ist, dass
die gespeicherten IP-Adressen nicht weitergegeben (auch nicht an den Auftraggeber)
werden. Wer ist hier der Auftraggeber. Laut Impressum wird das “Internetangebot […] herausgegeben vom: Bundesministerium des Innern – Projektgruppe Netzpolitik”. Was hat der Nutzer unter Auftraggeber zu verstehen? Eine Anonymisierung der IP-Adressen findet offensichtlich nicht statt. Vielleicht sollte sich Herr Friedrich mal mit einer ehemaligen Justizministerin unterhalten.
Datenschutzregelungen sind zu kompliziert – selbst für die Netzgemeinde
Auf der Suche nach beispielhaften Datenschutzerklärungen könnte man auf die Idee kommen, bei Leuten nachzuschauen, die sich damit auskennen. Man schaut ja auch in den HTML-Code einer Seite, die einem gefällt (ich mache das zumindest so). Was liegt also näher, bei der digitalen gesellschaft, beim D64 oder der re:publica nach einer gesetzeskonformen Datenschutzerklärung zu suchen?

Die Site der re:publica geht recht freigiebig mit den Daten der Nutzer um. Twitter und Google setzen gleich mal 10-Jahres-Cookies. (Quelle: http://re-publica.de/12/impressum/)
Was eine “gesetzeskonforme Datenschutzerklärung” grundsätzlich bieten müsste, erklärt zum Beispiel e-recht24.de. Und tatsächlich scheint die Datenschutzerklärung von D64 eine sehr gute Einsicht zu geben, welche Daten, von welchem Anbieter zu welchem Zweck erhoben werden. Die PlugIns von twitter und facebook werden aufgezählt und selbst Askimet (eine WordPress-Plugin zur Spam-Erkennung) wird erwähnt. Vorbildlich. Wäre da nicht auf der Homepage ein Video von vimeo eingebunden. Dieses PlugIn wiederum verwendet offensichtlich Google Analytics wodurch interessanterweise die letzte Video-Suche auf Google via D64 zu vimeo gelangt und dort wieder mit Google verknüpft wird. Von solchen Datenflüssen und dem Zweck der Speicherung erfahre ich als User nicht und kann also weder still zustimmen noch Einspruch erheben.
Bei der Digitalen Gesellschaft gibt es zwar ein reisserisches Statement über das Engagement des Vereins für den Schutz der privaten Daten, selbst äussert man sich aber eher zurückhaltend. Oder anders: es gibt keine explizite Datenschutzerklärung. Selbst im Impressum findet sich eine solche nicht. Als Tracker kommt Piwik zum Einsatz. Von aussen ist nicht einsehbar, ob das System so konfiguriert ist, dass die IP-Nummern anonymisiert werden. Zusätzlich setzt der Server noch eine PHP-Session-ID und diverse Google-Analytics-Cookies über das twitter-PlugIn. Darunter auch die Information, dass dieser Browser irgendwann mal auf favstar.fm war. Ein Cookie nennt sich “__qca” und kommt von einer Firma namens Quantcast, eindeutig von der dunklen Seite der Macht. Volle fünf Jahre soll dieser Cookie Bestand haben.
Auch die Netzpolitiker der CDU hinken jedem popeligen Netzshop in Sachen Datenschutzerklärung hinterher. Sie haben einfach keine. Allerdings sind sie in Bezug auf Social-PlugIns wenigstens weiter als die Digitale Gesellschaft. Denn sie verwenden wenigstens die Opt-[Korrektur]In[/Korrektur]-Version. Allerdings ist bei einer oberflächlichen Recherche nicht zu ermitteln, warum ein Cookie gesetzt wird, dass zum Beispiel den ursprünglichen Referrer für mindestens ein halbes Jahr an den Server schickt.
Vielleicht hat ja die re:publica eine vernünftige Datenschutzerklärung? Immerhin steht sie dieses Jahr unter dem Motto ACT!ON und es geht unter anderem um die Gefahren für Aktivisten durch Überwachungssoftware. Im Impressum findet sich nichts und eine explizite Datenschutzerklärung findet sich gar nicht. Aber warum auch, immerhin setzen die Veranstalter auf “den gesunden Menschenverstand”. Meint bestimmt, dass man vor dem Aufruf der Seite erstmal nachschaut, welche Daten erhoben und wie diese verwendet werden. Man könnte sich ja vielleicht den Vortrag “Die Gesetze der Daten” anhören. Denn “Der Datenschutz wird uns nicht helfen können” ist doch eine einleuchtende Legitimation für die fehlende Sensibilität der Speerspitze der Netzgemeinde in Sachen Datenschutz für ihre eigenen User.
Alpha Beta #Charta – Großes Theater vom #D64
Fast wäre die Charta vom D64 an mir unbesehen vorbeimäandert. Doch ein tweet von @in_aha schützte das Dokument vor meinem ewigen Übersehen.
Bei soviel digitalen Lobby-Organisationen (A-, B-, CNetz) kann man schon mal den Überblick verlieren. Da ist es gut, wenn einer davon mehr von Kommunikation versteht als die anderen. Und tatsächlich sitzen beim D64 Leute, die sich mit Kommunikation auskennen. Die erste Regel lautet: GROß DENKEN! Das tun sie. Zum Beispiel dadurch, dass sie gleich mal eine Charta veröffentlichen. Man erinnere sich, dass Chartas formuliert wurden, um die Vereinten Nationen zu begründen (1945) und 1977 um den Ostblock in die Knie zu zwingen. Chartas sind “die für das Staats- und Völkerrecht grundlegenden Urkunden“.
Der jetzt veröffentlichte Entwurf, soll nun von den D64-Vereinsmitgliedern diskutiert werden. Die Plattform dafür nennt sich Zentrum. Auch hier zeigen sich wieder die Kommunikationsprofis. Wer sich selbst in die Mitte stellt kann nicht ausgegrenzt oder marginalisiert werden. Von ihm geht alle Bewegung aus. Andere können sich zwar andocken aber D64 ist das Zentralgestirn.
Im ersten Punkt wird dieses Vorgehen noch mal deutlich: “Als D64 fordern wir, das gesamte Spektrum der politischen, technologischen und gesellschaftlichen Veränderung in den Blick zu nehmen.” Dadurch dass der D64 im Zentrum steht hat er den vollkommenen Überblick. Andere stehen am Rand und werden dadurch immer nur Einzelaspekte des digitalen Lebens betrachten. Egal ob sie sich selbst digitale gesellschaft oder Piraten nennen.
Die weiteren Punkte sind gegliedert in 2. Teilhabe, 3. Datenschutz, 4. Netzpolitik, 5. Öffentlichkeit, 6. Gesetzeslage, 7. Primat der Bürgerinnen und Bürger, 8. Arbeit, 9. Wissenschaft und 10. Transnational. Da sich viele aktuellen Themen dieser Strukturierung entziehen, sollen hier die Antworten auf die wichtigsten Fragestellungen untersucht werden
Netzneutralität und Netzzugang
Basis für eine Gesellschaft in Zeiten des Internet ist auch für den D64 ein freier und überall verfügbarer Zugang zum Netz. Der Verein fordert daher auch den flächendeckenden Ausbau und den kostenlosen Netzzugang. Notfalls soll der Staat selbst investieren. Das Internet wird als ein Grundrecht postuliert.
Um welche Art Internet es sich handelt wird an dieser Stelle noch nicht dargelegt. Aber auch später taucht eine Forderung nach Netzneutralität nicht auf. Lediglich im Kontext des Urheberrechtschutzes wird vor unangemessenen Eingriffen gewarnt. Dabei bleibt unklar was angemessene Eingriffe wären. Sind Stoppschilder oder Domainsperren angemessen? Wer misst und was ist Maßstab?
Vorratsdatenspeicherung, Fluggastdaten
Interessanterweise behandelt der Verein die Vorratsdatenspeicherung unter dem Thema Datenschutz und nicht unter Netzpolitik oder Gesetzeslage. Die anlasslose Speicherung wird umfänglich abgelehnt. Man spricht sich für Quickfreeze mit Richtervorbehalt und Informationspflicht und -löschen aus.
Über die Weitergabe von Daten zum Beispiel im Rahmen eines Fluggastdatenabkommens der EU und den USA sagt der D64 nichts.
Privatsphäre, Datenschutz
“Wir glauben nicht an das Ende der Privatsphäre als Wert.” Der D64 ist also kein Anhänger der Postprivatiers oder Spackeria. Das wäre allerdings auch seltsam. Denn der Verein wird inhaltlich stark von der Post-Tochter nugg.ad bestimmt. Diese Firma betreibt Targeting und Retargeting und lebt damit wesentlich vom Wert der privaten Daten der Nutzer. Ein Ende der Privatsphäre würde ihr Herrschaftswissen egalitären.
Datenschutzmaßnahmen hätten die Aufgabe “vor intransparenten, unkontrollierten und überzogenen Datensammlungen […] zu schützen”. Sie hätten aber “auch das Interesse der Nutzer und der Verkäufer im Netz im Blick behalten …”. “Maßstab muss das mutmaßliche Interesse eines durchschnittlichen informierten Nutzers sein.” Wichtig hierbei ist insbesondere die Mutmaßung. Denn nur sie ermöglicht eine Cookie-Richtlinie auf der Basis von Opt-Out-Verfahren. Ein Betreiber kann damit jederzeit glaubhaft mutmaßen, dass insbesondere ‘seine’ durchschnittlich informierten Nutzer ein Interesse an seiner Datensammelwut hätten.
Anonymität im Netz
Zu einer immer wieder geforderten Pflicht, sich als Nutzer im Netz zu identifizieren nimmt die Charta keine Stellung. Das ist insofern erstaunlich als dass diese Forderung die zentrale Schnittstelle aller Ideen zur Einschränkung der Rechte im Netz ist und mitschwingt, wenn vom rechtsfreien Raum gesprochen wird. Hier hätte sich der Verein wegweisend mit seiner “Charta” zeigen können.
[Korrektur] Hier bin ich Opfer der sehr eigenen Struktur des Dokumentes geworden. Stephan Noller (D64-Gründungsmitglied und nugg.ad-Gründer) wies mich im Kommentar darauf hin, dass unter Datenschutz Absatz H deutlich steht, dass “Die Möglichkeit, das Netz unter Pseudonym zu nutzen” erhalten bleiben muss. Aus meiner Sicht ist dies jedoch kein natives Datenschutz- sondern ein übergeordnetes Thema. Vor allem die Bindung an die BILD-Aufreger Verunglimpfung und Beleidigung spiegeln die Relevanz nicht. Letztlich ist in einer Demokratie die Anonymität der Meinungsäusserung ein Grundrecht. [/Korrektur]
Leistungsschutzrecht, ACTA
In der Charta spricht sich D64 unter dem Punkt 6.Gesetzeslage Absatz D explizit für einen Urheberschutz aus, der die Kreativen selbst begünstigt und nicht überkommene Verwertungsmodelle zementiert. An keiner Stelle wird der Begriff des geistigen Eigentum diskutiert. Dabei wäre eine klare Position zu diesem Terminus wegweisend. Denn es zeichnet sich ab, dass in der nächsten Dekade Patentkriege weitaus mehr Einfluss auf die Art und Weise, wie wir das Netz nutzen haben werden als beispielsweise die Medienkompetenz der User.
Fazit
Bei 15 Seiten fällt vor allem auf, dass etliche Themen nicht oder nur #reichlichschwammig™ behandelt werden. Relevante Forderungen sind das Grundrecht auf einen Internetzugang, die Ablehnung der Vorratsdatenspeicherung und eine Überarbeitung des Urheberrechts. Damit bewegt sich der D64 tatsächlich in der Mitte der Netzgemeinde.
Von einer Charta muss man allerdings viel mehr erwarten. Sie sollte in der Lage sein, die netzrelevanten Themen in einen Kontext zu den Rechten in der realen Welt zu stellen. Sie müsste für jeden Leser deutlich machen können, dass es keinen Unterschied zwischen der gesellschaftlichen Partizipation am Wahlkampfstand einer Partei und der Kommentierung des Parteiprogramms im SPD-Blog gibt.
In der aktuellen Version ist die D64-Charta ein hervorragendes Beispiel wie eine Netz-Charta nicht sein sollte. Vielleicht ist sie ja wenigstens für diesen Zweck gut.
Die Funktion von Cookies aus Nutzer- und aus Betreibersicht
tl;dr. Unterscheidet man den Nutzen von Cookies nach ihrer Funktion für User und der Funktion für Anbieter wird deutlich, dass Cookies der Lebenssaft der digitalen Branche sind. Für die User bieten sie aber nur marginale Vorteile. Die Branche wird nicht aufhören immer mehr Daten zu sammeln, bis eine lückenlose Vorratsdatenspeicherung über jeden Nutzer existiert.

Die Firma nugg.ad (Tochter der Deutschen Post DHL) ist einer der größten deutschen Trageting-Dienstleister und lebt davon, dass auf einer Seite Cookies von einer anderen Seite gesetzt und gelesen werden können. Ist diese Funktion ausgeschaltet kann nugg.ad kein Profil erstellen.
Http ist an sich zustandslos. Das meint, dass der Aufrufende (“gib mir folgende Datei”) vom Vorhaltenden (“hier hast du die Datei”) nicht erkannt werden kann. Ohne weiteres weiß er nicht, wer da grade dieses Bild will und in welchem Kontext er sich grade befindet. Und damit fängt das Dilemma an.
Prinzipiell gibt es unterschiedliche Interessen für die (Wieder)Erkennung von Nutzern. Im Folgenden werden zuerst die Interessen der Nutzer dargestellt und danach die der Anbieter. Aus der Gegenüberstellung wird deutlich, dass Cookies im Interesse, ja sogar die Basis vieler Business-Modelle der (meisten) Anbieter sind. Für die Nutzer sind sie jedoch in den meisten Fällen ein lässliches Ärgernis und oft auch die falsche Technik.
Die Nutzerinteressen
Aus Nutzersicht ist eine Request-übergreifende (“der User folgt einem internen Link”) oder eine Session-übergreifende (“der User kommt nochmals auf die Site”) Zuordnung zu unterscheiden. Die Wiedererkennung bietet erstens eine komfortable Anmeldung oder/und die Personalisierung von Inhalten oder Formaten.
Die automatische Anmeldung ist ohne Frage eine hilfreiche Funktion. Es gibt allerdings dafür http-Authentifizierung. Ein bestimmter Bereich verlangt eine Authentifizierung und ohne ein gültiges Login und Passwort sieht man nichts. Alle Browser verfügen über einen eingebauten Mechanismus, sich auf Wunsch diese Anmeldungen zu merken. Und über https gibt es auch die maximal derzeit verfügbare Sicherheit*. Cookies sind für diese Funktion absolut überflüssig.
Personalisierung bedeutet, dass der Nutzer bewusst oder unbewusst das Verhalten, respektive das Aussehen einer Seite oder einer Site verändert.
Beginnen wir mit dem bewussten Verhalten. Sitebetreiber finden es manchmal eine gute Idee: der Nutzer habe doch bestimmt seine eigenen Präferenzen und möchte sich die Seite einrichten nach seinem Gusto. Deutlich zu sehen bei der DRadio-Wissen-Seite oder bei der letzten Version von Xing. Man kann Inhaltsboxen hin und her schieben und sich damit die “Startseite” anpassen. Diese Einstellung wäre natürlich sinnlos, wenn man beim nächsten Aufruf alles wiederholen müsste. (Nun finden lustigerweise wenig ausgewiesene Experten Personalisierung toll. Prominentes Beispiel war hier Bertelsmann mit Bol. Die hatten in New York am Time Square mal 50 Datenbankenexperten sitzen, die sich mit dem Speichern von User-Preferenzen beschäftigen sollten. Bol hat es bekanntermaßen nicht weit geschafft.)
Aber auch das unbewusste Verhalten eines Nutzers kann Einfluss auf das Aussehen und den Inhalt einer Seite haben. Allein durch die aufeinanderfolgenden Klicks oder durch Aktionen in der Vergangenheit könnte ein Nutzer vermitteln, was er eigentlich sucht und was man ihm daher anbieten soll. Dieses Verfahren wird Behavioral Targeting genannt. Prominentestes Beispiel ist Amazon mit der Liste ähnlicher Produkte. Diese Liste wird in Abhängigkeit von meinem bisherigen Verhalten momentan oder meiner Kaufhistorie variiert. Ein großer Teil von Amazons Erfolg geht auf diese Funktion zurück, die man sich damals bei der Firma Net Perceptions gekauft hat.
Innerhalb einer Session würde sowohl die Anpassung an das bewusste als auch an das unbewusste Verhalten mit Hilfe von Session-IDs funktionieren. Diese werden als Parameter über die URL von einer Seite zur nächsten übergeben**. Session-übergreifend funktioniert dieses Verfahren nicht, da nicht gewährleistet werden kann, dass die URL nach wie vor von dem ursprünglichen Browser aufgerufen wurde.
Die Personalisierung – egal ob auf der Basis von bewusstem oder unbewusstem Verhalten – ist jedoch generell problematisch. Heute nutzen die User Sites in verschiedenen Situationen. Auf der Arbeit mit dem Firmen-PC, auf dem Weg nach Hause mit dem Handy, zu Hause mit dem Tablet u.s.w. Eine Personalisierung könnte dann also nur funktionieren, wenn die Cookies mitgenommen würden. Das werden sie momentan*** nicht. Ausserdem sind die Geräte jeweils so unterschiedlich, dass die Webseiten sowieso verschieden aussehen.
Die Anbieterinteressen
Vor der Erfindung der Cookies stand die Frage von Henry Ford, welche Hälfte der Marketingausgaben denn wohl umsonst ist. Denn dass nicht jede Kommunikation bei den Empfängern auf fruchtbaren Boden fällt ist klar. Der Tampon-Spot im StarTrek-Werbeblock könnte vergebene Liebesmüh sein. Das Banner für das iX-Abo auf gofeminin scheint deplatziert.
Henry Ford würde heute feststellen, dass es doch am besten wäre, die Kommunikation für jeden einzelnen Empfänger anzupassen. Denn sicher gibt es für jeden einen bestimmten Schlüsselreiz, der ihn dazu bringt, sofort den Scheck zu unterschreiben. Was wie ein Horroszenario klingt ist nur das fertige Bild, wenn man heutige Puzzlesteine zusammensetzt.
Mit Hilfe von Cookies kann erkannt werden:
- ob ein Nutzer bereits auf der aktuellen Seite war,
- und wenn ja, was er sich angesehen hat,
- dort bereits etwas gekauft hat und wenn ja,
- was er dort gekauft hat,
- ob er irgendeine Werbung dieser Seite gesehen hat und wenn ja,
- welche Werbung dieser Site er gesehen hat und
- ob er diese geklickt hat,
- ob er (auf der Seite auf der diese Werbung ist) bisher überhaupt mal war,
- und wenn ja, welche Werbung er dort schon mal gesehen und
- möglicherweise geklickt hat,
- welche Themen er sich auf verschiedenen Seiten ansieht.
Etliche Szenarien sind nur möglich, wenn verschiedene Teilnehmer Daten austauschen. Dies geschieht schon länger. Deutlich wird, dass immer öfter Konkurrenten über ein Intermediate zusammenarbeiten. Der Vorteil der verbesserten Daten ist tatsächlich höher zu bewerten als die Tatsache, dass ein Wettbewerber Informationen erhält.
Dabei spielt es übrigens keine Rolle, ob die Daten personalisierbar sind. Im Gegenteil: personenbezogene Daten neigen zu Korrosion wenn Nutzer ihre Wohn- oder Mailadressen ändern, heiraten oder das Konto wechseln.
Cookies bieten damit ganz abstrakt die Möglichkeit einer vollständigen Vorratsdatenspeicherung aller Interaktionen eines Nutzers im Web. Und mit dieser Historie lassen sich komplette Persönlichkeitsprofile bilden, Verhaltensmuster in Cluster zusammenfassen. Basierend darauf können Kommunikationsmaßnahmen und -inhalte so gesteuert werden, dass die Response-Rate optimal ist. Also die Wirkung des Marketings nicht weiter verbessert werden kann. Dabei umfassen Kommunikationsmaßnahmen nicht nur Banner und TV-Spots.
Inhalt und Stil eines Zeitungsartikels kann genauso customized werden wie Produktname und vermeintlicher Hersteller. Es könnte ja sein, dass eine kleine Gruppe von Usern durchaus Nivea kaufen würde, wenn man sie nur in eine Steampunk-Packung füllt und sie nach Prinzessin Leia benennt. Der Makerbot im Netto um die Ecke macht es möglich.
Sicher eine lustige Vorstellung. Wenn es jedoch um Krankenversicherung, Job-Angebote, politische Meinungsäusserung und Reisefreiheit geht und damit letztlich um eine durchlässige Gesellschaft, dürfte vielen das Lachen im Halse steckenbleiben.
Und es bleibt festzustellen, dass existierende Daten immer Begehrlichkeiten wecken.
—
Über mich: In der c’t 6/96 erschien mein letzter Artikel für die Zeitschrift mit dem Titel “Faules Backwerk – Auf dem Weg zum gläsernen Web-Surfer” http://www.heise.de/ct/artikel/Faules-Backwerk-284550.html . Seitdem arbeite ich mehr oder weniger permanent als Experte für Web-Analyse. Meistens mit Tools von Drittanbietern, oft aber auch mit selbst entwickelter oder mindestens selbst entworfener Software. Jenseits von Logfile-Analyse gibt es heute keine relevante Lösung, die ohne Cookies auskommt. Eine der wesentlichen Merkmale der Branche ist nach meiner Meinung ein Wettrüsten um die Datenqualität und -granularität. Die Interessen der Nutzer vertritt in diesem Wettkampf niemand.
—
*) Zumindest mehr als derzeit mit Cookies.
**) Session-IDs in der URL haben insbesondere wg. Suchmaschinen und Bookmarks oder URL-Weitergabe einen schlechten Ruf. Das sind aber Probleme die längt gelöst sind.
***) Alle Browserhersteller arbeiten daran, die Cookies über zentrale Services zu synchronisieren.
#ACTA – the end of the net as we know it
Obwohl ACTA eigentlich dazu gedacht war, bestimmte Staaten zu einem Schutz des geistigen Eigentums zu bewegen, sind genau diese Staaten und dabei insbesondere China nicht unter den Unterzeichnern. Es sind insbesondere Staaten dabei, die sowieso schon eine ausgeprägte Rechtslage und Rechtspraxis diesbezüglich umsetzen.
Für Deutschland würden sich zum Beispiel direkt nur wenige Punkte ändern, diese wären aber grundlegend: War es für Rechteinhaber noch bis vor kurzem sehr leicht möglich, an die Identitäten von Filesharern zu kommen, weigern sich inzwischen viele Gerichte wg. solcherlei Bagatellen zu den Providern zu gehen. Nach ACTA müsste Deutschland allerdings ein Gesetz erlassen, dass dem Kläger diese Zuordnung ermöglicht.
Darüber hinaus wäre es einem Kläger im Rahmen eines Zivilprozesses neuerdings möglich, die Werkzeuge zur Vervielfältigung zu beschlagnahmen. Das könnten private Rechner ebenso sein, wie Server bei einem Provider oder sogar facebook- oder Google-Accounts. (Die Three-Strikes-Debatte entspringt übrigens genau hier, denn die Dienste-Anbieter könnten sich so vor einer (vermeintlich) viel komplizierteren Lockdown-Infrastruktur schützen.)
Es wäre zum Beispiel REM möglich, den qrios-Server zu beschlagnahmen, da der Titel dieses Posts eine zu leichte Abwandlung ihres größten Hits sei. Vielleicht würde REM davon keinen Gebrauch machen. Ich müsste allerdings damit rechnen und würde möglicherweise nach Abwägung Abstand davon nehmen.
Wenn unisono von den Regierungsvertretern der Unterzeichner und Deutschlands behauptet wird, es hätte keine Auswirkungen, kann das also so nicht stimmen. Es sei denn, man betrachtet die Tatsache, dass ACTA respektive deren Kommission keine Sanktionen machen kann als genügend. Ob diese Zahnlosigkeit jedoch so bleibt, darf bezweifelt werden. Es ist anzunehmen, dass sich die Unterzeichner nach der Ratifizierung einstimmig auf Sanktionen (z.B. empfindliche Strafzahlungen) einigen. Denn diese Einigung bedarf interessanterweise danach ja nicht mehr der erneuten Ratifizierung durch die jeweiligen Parlamente.
Wenn Deutschland also den Vertrag unterzeichnet und der Bundestag das Werk absegnet werden wir sehr schnell hören “Wir müssen unseren völkerrechtlichen Pflicht nachkommen.“
#ACTA ist nicht MECE-konform
Gestern schickte @Cappellmeister den Link zu der deutschen Version von ACTA rum und nach einigem Lesen wurde mir plötzlich klar, warum ich mich mit der englischen Version so schwer tat. Der ACTA-Vertrag ist nicht MECE.
MECE kommt ursprünglich aus der Unternehmensberatung und hat sich inzwischen beim Design von XML und Datenbanken etabliert, wird aber auch in der Konzeption und (manchmal) Kreation eingesetzt. Im Kern sorgt es dafür, dass eine Struktur ausgewogen und nicht redundant ist.
Rechtsanwälte arbeiten – insbesondere bei Verträgen – natürlicherweise immer MECE. Bei ACTA wurde darauf verzichtet. Die Inkonsistenz wird deutlich in Artikel 27 Absatz 6. Zitat: “Um den hinreichenden Rechtsschutz und die wirksamen Rechtsbehelfe nach Absatz 5(*) zu gewährleisten, erlässt jede Vertragspartei(**) Schutzbestimmungen zumindest gegen folgende Handlungen:”
a) in Übereinstimmung mit ihren jeweiligen Rechtsvorschriften …
Dieser Punkt sagt also, dass man die folgenden Richtlinien so in Verordnungen und Verwaltungsforschriften einfliessen lassen sollte, dass sie mit dem gültigen Gesetz übereinstimmen. Diese Aussage ist an sich schon ein Pleonasmus. Schon in der Einleitung steht ausdrücklich, dass natürlich alles so sein sollte, dass es mit den gültigen Gesetzen und Verfassungen der jeweiligen Staaten im Einklang steht. Na gut, man kann das ja eine Selbstverständlichkeit nicht oft genug betonen.
Aber
b) die Herstellung, die Einfuhr oder den Vertrieb von Vorrichtungen oder Erzeugnissen, einschließlich Computersoftware, oder die Erbringung von Dienstleistungen,
kann man nun so lesen, dass die darunter fallenden Maßnahmen nicht mehr im Einklang mit dem jeweiligen Recht stehen müssen. Denn ansonsten hätte auch b) mit dem Hinweis auf die gültigen Rechtsvorschriften beginnen müssen.
Meiner Erfahrung nach arbeiten Anwälte immer sehr strukturiert und damit auch MECE. Es sei denn, sie wollen explizit Hintertüren in Verträge einbauen.
*) Absatz 5 sagt etwas über den den Lizenznehmern zu gebenden Rechtsschutz aus.
**) Vertragspartner sind Staaten oder ähnliches (z.B. EU).
O2 UK schreibt Telefonnummer in http-Request-Header
@lewispeckover hat offensichtlich entdeckt, dass O2 in UK einen transparenten Proxy* betreibt, der bei jedem Request** die Telefonnummer des Mobiltelefons an den aufzurufenden Server schickt.
If you’re on O2′s UK mobile network (not ADSL), you’ll (probably) see a line beginning with x-up-calling-line-id - followed by your mobile phone number in plain text. Other operators may use different headers, or hopefully none at all - let me know - I’m interested to know if other networks are doing it too.
Zu Testzwecken hat er ein Script geschrieben, das die Header-Informationen auf der Seite listet. Also wer von meinen Lesern zufällig auf der Insel ist und bei O2 einen Mobilvertrag hat kann ja mal draufgehen und nachsehen, ob dort die Telefonnummer steht.
Ich hatte ja auf dem Vortrag erzählt, dass das bei bestimmten mobilen White-Label-Paketen gängige Praxis ist. Dort wird diese Information allerdings nur an bestimmte vertragsrelevante Partner-Sites gesendet und nicht an jeden beliebigen Server.
Insofern vermute ich mal einen Konfigurationsfehler. Es könnte aber auch sein, dass O2 mit größeren Ad-Server-Betreibern Deals hat und die selektive Übermittlung dadurch nicht mehr ohne weiteres möglich wäre.
*) Ein transparenter Proxy routet die Requests und kann diese gegebenenfalls modifizieren. Wird eigentlich von fast allen Mobilfunkbetreibern verwendet um zum Beispiel das Caching zu optimieren.
**) Der Request-Header oder http-Request-Header wird von dem Browser an den WebServer gesendet und enthält alle wichtigen Informationen um eine Resource anzufordern. Die Response hat ebenfalls einen Header und informiert den Browser zum Beispiel über die Größe und das Verfallsdatum der Resource.
[Update] Collin Mulliner hat sich mit dem Thema ausführlicher beschäftigt und einige interessante Fakten zu Tage befördert. Darunter wird als Beispiel übrigens Bild mobil erwähnt, über die ja auch schon mal berichtete. [/Update]
Der #Algorithmus, das unbekannte Wesen
Hier und da poppt seit Jahren eine mehr oder minder starke Furcht vor Algorithmen auf. Egal ob von Meckel, Schirrmacher oder anderen Fuilleton-Natives ist der Tenor immer ähnlich: wir werden alle störben Algorithmen sind dabei den Menschen einzuschränken. Da freut es denjenigen, der sich im Studium mal intensiv mit Technikkritik beschäftigt hat dann doch, dass auch mal eine etwas kenntnisreichere Stimme zu Wort kommt. In der SZ erschien ein Artikel von Kathrin Passig mit dem Titel “Warum wurde mir ausgerechnet das empfohlen?“.
Nun ist Kathrin Passig nicht unbedingt ausgewiesene Algorithmus-Expertin hebt sich aber durch digitale Erfahrung erfrischend von den Mahnern ab. Nur leider hat sie das Thema auch nicht verstanden. Was schade ist, da mspr0 ihr gleich zur Seite springt und ihre (Falsch-)Aussagen kunstvoll in seine These vom Kontrollverlust und der darauf zwangsläufig folgenden Postprivacy einflechtet. Warum Falschaussagen? Weil sie zum Beispiel eine Bestsellerliste einem Algorithmus gegenüberstellt. Dabei ist eine Bestsellerliste genau das: das Ergebnis eines Algorithmus. Den können zwar alle verstehen aber dadurch wird er nicht zum Nicht-Algorithmus.
Für sie ist – wie für die Mahner – ein Algorithmus etwas, das (bei genügend großer Komplexität) ein Mensch nicht mehr verstehen kann. Dazu wird ein (unverlinktes) Zitat bemüht:
Die am Wettbewerb beteiligten Teams [die Programmierer der Algorithmen] gaben in Interviews an, nicht mehr nachvollziehen zu können, wie ihre eigenen Algorithmen zu manchen Ergebnissen gelangen.
Diese Aussage kann man jetzt in mindestens drei Richtungen deuten. Die Programmierer verwenden Code, den sie nicht selbst geschrieben haben (Framework, Compiler) und dies führt zu einem Black-Box-Verhalten, die Programmierer haben Code geschrieben, der sich selbst verändert oder die Programmierer kennen nicht mehr alle Werte, der zu diesem Ergebnis geführt hat.
Der erste Fall kommt recht häufig vor ist aber sicher nicht gemeint, da die konkrete Implementierung egal ist, solange das gewünschte Ergebnis produziert wird. Sollte mein Code trotz eingehender Prüfung nicht mehr das tun, was ich gerne hätte, würde ich überprüfen, ob die beteiligten Frameworks nicht das tun, was ich erwarte und im letzten Schritt, ob der Compiler merkwürdige Seiteneffekte produziert. (Aber normalerweise würde ich erst mal schlafen gehen, weil sich das Problem am nächsten Tag meistens in Luft aufgelöst hat.)
Der zweite Fall ist schon etwas komplizierter. Selbstveränderlichen Code gibt es bereits und wird insbesondere von Virenprogrammierern eingesetzt. Dabei geht es aber nicht um eine Veränderung der prinzipiellen Funktionsweise im Sinne von Evolution sondern lediglich um Mimikri. Ein solcher Code würde im Idealfall tatsächlich dazu führen, dass selbst die Entwickler ihn nicht mehr ohne eingehendes Studium von jedem anderen Code unterscheiden könnten und nicht sagen könnten, was der Code tut. Und dies obwohl sie ihn selbst geschrieben haben.
Es ist mit hoher Wahrscheinlichkeit in dem Zitat der dritte Fall gemeint. Eine Liste von Eingabewerten wird immer wieder durch die Maschine geschickt und kalibriert die vorgegebenen Schwellwerte an Hand von Erfolg und Misserfolg. Dabei kommt in den einzelnen Zwischenschritten viel Stochastik zum Einsatz und ab und zu wird mal der Zufallsgenerator angeworfen, um das ganze System vor der zwangsläufigen Stasis zu beschützen. Die eingesetzen Algorithmen sind in den meisten Fällen mit den mathematischen Fähigkeiten eines Realschülers zu verstehen. Die anscheinende Komplexität entsteht nur aus der Anzahl der Eingabedimensionen und der Anzahl der Iterationen.
Wichtig an diesem Punkt ist besonders der Begriff des Schwellwertes. Denn hierbei handelt es sich nicht um ein einzelnes Bit, dass gesetzt ist oder nicht. (Aber selbst bei solchen Systemen kommen schon komplexe Verhalten zu Stande. Dazu möge man sich die dreißig Jahre alten Arbeiten über zelluläre Automaten von Stephen Wolfram ansehen.)
Schwellwerte werden normalerweise als Fließkomma implementiert. Computer und damit auch Algorithmen sind allerdings recht ungenau im Umgang mit Zahlen wie 1/3 oder Wurzel aus 2. Da es sich um endlose Zahlen handelt muss eine CPU diese Werte runden. Und je nach dem, in welchen Zustand (z.B. in welchem Speicher sich die Werte befinden) kommt eine etwas andere Zahl bei der Operation raus. Genau genommen haben wir es hier mit einer Heisenbergschen Unschärfe zu tun.
Da ein Algorithmus jedoch nichts anderes ist als eine Aneinanderreihung von Operationen ist, werden selbst bei exakt bekannten Eingangswerten die Ergebnisse um so unverhersagbarer je öfter eine solche Rundung stattfindet.
Einer der wichtigsten aktuell im Einsatz befindlichen Algorithmen ist die Page-Rank-Berechnung von Google. Obwohl bisher nicht nach aussen gedrungen ist, wie er exakt aufgebaut ist, basiert darauf die ganze SEO-Branche. Für viele handelt es sich um reines Google-Voodoo. Dabei kann man an Hand unterschiedlicher Ergebnisse eine Art Verhaltensforschung betreiben. Und obwohl ich noch niemanden gehört habe, der meint, es würde sich um ein Lebewesen handeln verhält er sich dennoch anscheinend so. Ich kann ihn untersuchen an Hand möglichst vieler Parameter, die er auch (vielleicht) sieht. Seine vollständige Funktionsweise könnte ich jedoch nur ermitteln, wenn ich ihn immer wieder in den gleichen Zustand versetzen könnte, was ginge. Ich müsste allerdings auch seine Umwelt wieder in den gleichen Zustand versetzen, was nicht ginge.
Nichts desto trotz ist der Page-Algorithmus einfach und Lerry Page versteht ihn sicher nach wie vor und etliche seiner Mitarbeiter auch.
(Quelle animiertes Gif: http://de.academic.ru/dic.nsf/dewiki/279011)
EU-Datenschutzverordnung: Sollbruchstelle Jugendschutz
Die Initiatve der EU-Kommissarin Vivian Reding mit einer Verordnung zum Datenschutz eine europaweite Grundlage zu schaffen liest sich in weiten Teilen wie die Wort gewordenen Träume aller Datenschützer. Opt-In ist für die meisten Datenerhebungen Standard. Der Export der Daten und damit die Plattform-Unabhängigkeit ist vorgeschrieben. Und schliesslich müssen Systeme so gestaltet sein, dass alle personenbezogenen Daten unwiederbringlich gelöscht werden können müssen.
Allerdings findet sich an mehreren Stellen eine Regel, die das Zeug zum Dealbraker hat. Für fast alle Punkte gibt, dass Funktionen Kinder ausschliessen müssen. Mit Kindern sind alle Personen unter 18 Jahren gemeint. Unter Umständen sind die Erhebung und Verarbeitung noch gestattet, wenn das Einverständnis der Eltern vorliegt.
Damit kann eine komplette Branche nur noch dann arbeiten, wenn Clients eine minimale Information über das Alter des Nutzers an den Service sendet. Denn andernfalls muss der Betreiber damit rechnen, dass es sich möglicherweise um ein Kind handelt, dessen Daten er unter keinen Umständen erfassen und verarbeiten darf.
Solange diese Altersübermittlung nicht existiert dürfen eigentlich keine Daten mehr erhoben werden oder zumindest nicht verwertet werden bis eindeutig klar ist (z.B. durch eine Anmeldung mit Altersindiz), dass es sich nicht um ein Kind handelt. Das dürfte somit das vorläufige Ende von Bannerwerbung und Targeting sein, wie wir es kennen.
Begründet wird der besondere Schutz übrigens mit der Naivität der Kinder. Wobei ich manchmal den Eindruck habe, dass da die Politiker von sich ausgehen und annehmen, dass die Kinder noch weniger von der Technik verstehen als sie selbst. Was für ein Fehlschluss.
Daten-Fee oder Datenvieh: Offene Fragen
Während meines Vortrags “Daten-Fee oder Datenvieh” und direkt danach vor Ort und online sind etliche Fragen gestellt worden, die ich hier zusammenfassen und beantworten möchte.
Welchen Wert haben die Daten die durch facebook, Google und andere “Social Plugins” erhoben werden?
Befindet sich auf einer Seite ein aktives Social Plugin, werden Daten über den Aufruf der Seite an die jeweiligen Anbieter (facebook, G+, twitter etc.) gesendet. Dabei spielt prinzipiell erst mal keine Rolle, ob der User (mit diesem Browser) aktuell bei dem jeweiligen Dienst angemeldet ist oder ob er dort überhaupt einen Account besitzt.
Da es sich bei den Anbietern um Black Boxes handelt, ist unklar, welche Verknüpfung direkt oder später zwischen diesen anonymen oder personalisierten Trackingdaten stattfindet. Aus Sicht der Qualität des Services von G+ und facebook ist eine solche Verknüpfung natürlich sinnvoll. Bleibt aber dennoch Spekulation.
Es gilt aber wie bei Targeting und Retargeting die Aussage, dass die Daten mit jedem weiteren Datum wertvoller werden. Und es ist keine Prophetie, wenn man sagt, dass diese Daten früher oder später verkauft werden. Entweder an verschiedene Kunden oder als Asset bei einer Übernahme.
Warum sollten denn die IP-Adressen aus den Logs entfernt werden wenn sie nicht (mehr) für die Auswertung herangezogen werden? (@alvar_f)
Natürlich zunächst mal, weil es geltendes Recht ist. Vor dem Hintergrund eines Zuviels an Gesetzen könnte man vielleicht darüber diskutieren, ob dieses nicht auf die Streichliste gehört. Allerdings deckt es ja auch andere und zukünftige Situationen ab. Denn mit der Verbreitung von IPv6 (MAC-Adresse) und einer zunehmenden Diversifizierung des Browsermarktes (“Fingerprinting”) wird dieser Punkt wieder extrem relevant.
Aber bevor man über ein “Zuviel” von Gesetzen diskutiert sollte man vielleicht mal über Datensparsamkeit nachdenken und die Web-Server-Logs ein wenig ausdünnen.
Führt Opt-In nicht zu einem Wust an Kleingedrucktem, das sowieso niemand durchliest?
Unter dem Titel “Datenschutztheater: Die informierte Zustimmung” hat Kristian Köhntopp im Kern folgende Aussage gemacht: die bisherigen Verfahren, die den Schutz der privaten Daten leisten sollen sind eigentlich reine Datenverwaltungsvorschriften. Es würde nicht um den Schutz der Daten gehen sondern darum, den Erheber der Daten vor Ansprüchen seitens der User zu schützen.
Tatsächlich würde ich ihm ohne Einschränkungen zustimmen. Bisherige Einverständniserklärungen sind ungeeignet den User über die Verwendung (Erhebung und Ziel der Verarbeitung) zu informieren.
Die Forderung muss also daher sein, den Sinn und Zweck der Erhebung in einfacher Sprache zu vermitteln. Wenn das nicht gelingt dürfen die Daten eben nicht erhoben werden.
Opt-In würde die Betreiber automatisch zu Datensparsamkeit zwingen. Denn es ist wesentlich schwerer, den Nutzer zu einem Einverständnis vor der Anmeldung zu überreden als ihm implizites Einverständnis unterzjubeln. Und ich bleibe bei meiner Aussage, dass – abgesehen von Profilern – die meisten Betreiber wesentlich mehr Daten erheben als sie später sinnvoll auswerten (können).
Das Thema Zertifikate und Siegel hat vdsetal weiter recherchiert und kommt zu sehr interessanten Aussagen.
