Trau schau wem — wie sich die Tech‐Giganten beim Datensammeln unterscheiden

Derzeit geht es in der Presse rum: Sprachschnipsel werden von Apple (und den Konkurrenten Google und Amazon) an externe Firmen weitergegeben, um den Sprachassistenten zu verbessern. Dort überprüfen Menschen die Fehler der AI und korrigieren diese gegebenenfalls. Dabei kann auch auf einige Sprecher zurückgeschlossen werden.

Apple wirbt mit Datenschutz. Das dürfte wohl vielen inzwischen aufgefallen sein. Dennoch sind zu recht viele Menschen skeptisch. Leider ist bei vielen ein gesundes Misstrauen aber auch einer resignativen Ansicht gewichen: „Die sind doch eh alle gleich“.

Meiner Meinung nach lässt sich das so pauschal nicht sagen und ich habe hier mal meine Gründe für diese Meinung zusammen gefasst.

Zunächst das beste: Apple hat diese Praxis Siri‐Sprachschnipsel von Menschen in Drittfirmen auswerten zu lassen, mit sofortiger Wirkung weltweit ausgesetzt.

Hier sieht man schon einen ersten Unterschied zu Konkurrent Google, der diese Praxis auch betrieben und schon einen Monat früher ausgesetzt hat. Aber gezwungenermaßen, nur in der EU und nur bis Oktober.

Apple muss seinen Assistenten selbstverständlich auch weiter verbessern um von der Konkurrenz nicht abgehängt zu werden, das Training der AI wird aber erst wieder aufgenommen, wenn Updates von iOS und macOS vorliegen, die vor der Auswertung der Mitschnitte die Erlaubnis der Nutzer einholen.

Was lässt sich aus den veröffentlichten Informationen herauslesen?

Der Leak belegt, dass

  1. die Gesprächsschnipsel nicht mit einer Apple‐ID verknüpft sind
  2. keine Auswertung seitens Apple stattfindet
  3. bei Apple selbst keine Zuordnung von Personen stattfindet
  4. anscheinend nicht (wie bei Google) transkribiert wird
  5. die Weitergabe aller enthaltenen Informationen aufgrund von entsprechenden Verträgen illegal wäre

Der Leak belegt aber auch, dass

  1. externe Mitarbeiter anhand von Informationen in den Gesprächen manchmal auf einzelne Sprecher rückschließen können
  2. die enthaltenen Informationen sehr privater Natur sind
  3. einige der Aufnahmen entstanden sind, weil die AI „Hey Siri“ gehört haben will, obwohl etwas anderes gesagt wurde (und somit gar nicht hätte übertragen werden sollen)
  4. Apple diese Praxis nicht ausreichend transparent gemacht hat
  5. dass Apple nicht auf den Umstand hingewiesen hat, dass Sprachassistenten nicht ohne menschliche Unterstützung trainiert werden können

Apple gibt zwar lägst selbst an, auch im Zusammenhang mit dem Sprachassistenten Siri nicht näher spezifizierte Daten zu sammeln, allerdings war das konkrete Ausmaß wohl den wenigstens bewusst. Dass dies nicht früher bekannt wurde, könnte daran liegen, dass Apple auf diese Möglichkeit in der Vergangenheit (weitgehend) verzichtet hat oder das Training nur selbst (nicht mithilfe von Drittfirmen) durchgeführt hat — das würde auch erklären, warum die Konkurrenz in so kurzer Zeit so viel größere Fortschritte erzielt hat.

Ich werfe Google, Facebook und Co. ja vieles vor, aber dass sie ihren Sprachassistenten durch Training verbessern, gehört nicht zu den Dingen, die ich kritisiere. Das ist in meinen Augen eine technische Notwendigkeit, an der auch Apple nicht vorbeikommt, trotz der immensen Anstrengungen, die der Technik‐Gigant aus Florida in Bezug auf Datenschutz unternimmt.

chip.de: Apple setzt voll auf Datenschutz: Warum man dabei mächtig Ärger riskiert

Im Übrigen ist Apple die einzige Firma der großen vier (Google, Facebook, Amazon, Apple) deren Geschäftsmodell nicht vom Sammeln von Daten, sondern vom Verkauf selbst entwickelter Hardware abhängt. Allein das iPhone hat am Umsatz von 84 Milliarden Dollar einen Anteil von 52 Milliarden. Dazu kommen Macs, iPads, iPods, Kopfhörer, Geräte von Drittherstellern, Gebühren für Abos und Dienste (z.B. iCloud).

Apple kann es sich daher leisten, in Sachen Datenschutz eine Vorreiter‐Rolle einzunehmen, und es ist in meinen Augen geschickt, das zu nutzen, da Google und Facebook mit einem effektiven Datenschutz in der wirtschaftlichen Bedeutungslosigkeit verschwinden würden.

Ebenso wie man einen Sprachassistenten nicht ohne Auswertung der Fehler verbessern kann, kann man keine Werbe‐ oder soziale Netzwerke ohne Datenanalyse lukrativ betreiben.

Apple tut das nicht, Facebooks und Googles Geschäftsmodelle basieren dagegen ausschließlich auf der Sammlung und Analyse von Nutzerdaten (im Fall von Facebook sogar teilweise auf deren Weitergabe z. B. an die Trumpschen Wahlhelfer).

Bei Amazon bin ich mir da nicht so sicher. Das Kerngeschäft von Amazon ist ein anderes, aber die sind in der Vergangenheit durch sehr „hemdsärmelige“ Geschäftspraktiken aufgefallen, was die Aushebelung von Einfuhrregelungen in die EU und europäische Richtlinien, CE‐Zeichen usw angeht. Warum sollten die beim Thema Datenschutz plötzlich Skrupel bekommen?

Ich denke aber es ist wichtig, dass sich nicht das Gefühl breit macht „die sind eh alle gleich“ — denn das stimmt nicht. Es gibt da prinzipielle Unterschiede.

Während Apple Routen‐Anfragen anonymisiert und in kurze Teilstücke zerlegt, um nicht zu wissen zu können, wer von wo nach wo fährt, tut Google nach allem was öffentlich erfahrbar ist anscheinend das genaue Gegenteil in seiner eigenen Karten‐App (und allen anderen Anwendungen) — die Tatsache, dass Google allgegenwärtig ist (Android, Suche, Werbenetzwerk, Youtube, Assistant, NEST‐Heimautomation, Android Car …) spült denen auch genug Daten in die hauseigene AI, um Menschen eindeutig zu identifizieren, die keinen einzigen dieser Dienste nutzen oder jemals einer Datenschutzerklärung oder AGB von Google zugestimmt haben.

Noch mehr gilt das für Facebook, die nicht nur mit like‐Buttons oder „einloggen mit Facebook“ sehr offensiv Menschen verfolgen (auch solche, die nicht im Netzwerk aktiv sind) und die eigenen Nutzer auffordern, Adressdaten und persönliche Informationen über sämtliche Bekannte dem Netzwerk bereit zu stellen (auch aus den anderen Diensten WhatsApp, Instagram usw.), sondern diese Daten dann auch noch weiterverkaufen.

Fazit

Apple wertet Sprachschnipsel aus, um den hauseigenen Sprachassistenten zu verbessern. Für ein absichtliches oder gar systematisches Sammeln und Auswerten der in den Sprachschnipseln enthaltenen Daten durch Apple gibt es keine Hinweise.

Dennoch bleibt ein mulmiges Gefühl bei dem Gedanken, dass wildfremde Menschen — unter denen auch mal ein entlassener Mitarbeiter sein kann, der sich an seiner ehemaligen Firma rächen möchte — auf intimste Aussagen von Apple‐Kunden Zugriff haben.

Das ist wohl der Preis für Siri, Alexa, Google Assistant und Cortana.

In manchenSituationen, vor allem im Auto, ist für mich klar, dass der angemessen ist. Da bin ich meist allein unterwegs, rede kaum und bekomme einen hohen Gegenwert: ich kann die Augen beim Verkehrsgeschehen lassen.

Zu Hause ist das ständige Mithören eher nicht nötig.

Ich habe „Hey Siri“ daheim jedenfalls abgeschaltet und halte statt dessen die Hometaste gedrückt um etwas zu diktieren. Das kann dann zwar auch analysiert werden, sollte aber nur Befehle enthalten wie „Füge Gurken zu meiner Einkaufsliste hinzu“ und keine Mitschnitte von Gesprächen, in denen das iPhone fälschlicherweise ein „Hey Siri“ gehört haben will.

Weiterlesen

7 Kommentare » Schreibe einen Kommentar

  1. Spannender Artikel! Ich stimme dir zu das ein gradueller Unterschied in den Geschäften der großen 4 in Bezug auf Datenschutz besteht. Dennoch denke ich, dass man Apple hier nicht aus der Vernatwortung lassen sollte, durch einfaches feststellen das sie ihren Sprachassistenten verbessern wollen. Auch hier wurden intime Gespräche an dritte Weitergegeben, ohne Einwilligung der Betroffenen. Das Apple das für eine technische Verbesserung tun muss, steht auf einem anderen Blatt

    • Nein, aus der Verantwortung sollte man Apple nicht entlassen und sie haben auch Konsequenzen daraus gezogen. Aber es ist noch viel Luft nach oben und ich bin skeptisch abwartend was die weitere Entwicklung bei Apple angeht, wenn die neuen Dienste auf Geräten von Drittanbietern kommen.
      Was mir wichtig ist: mir scheint, es gibt Unterschiede in den Bemühungen der Firmen beim Datenschutz. Verbraucher können mit den Füßen abstimmen. Sorgen wir dafür, dass Datenschutz zu einem Verkaufsargument wird und es einen Wettbewerb um das datenschutzfreundlichste System gibt. Solange Verbraucher sich für den Schutz ihrer Daten nicht interessieren ist Datenschutz teuer und ohne Nutzen für die Unternehmen.

    • Interessanter Hinweis, der gut zum Artikel passt: Apple möchte nun wohl ebenfalls mehr an Werbung verdienen und hat angeblich einen Weg gefunden, keine Daten sammeln zu müssen.
      Erst mal klingt auch das plausibel. Aber man muss solche Dinge im Auge behalten. Früher oder später kommen Verstöße gegen den Datenschutz ans Licht.
      Das wäre im Fall von Apple ein besonders übler Vertrauensbruch nach all der Werbung.
      Der Artikel ist eine Momentaufnahme. Ich bin auch skeptisch was die neuen Dienste angeht (Videos und Spiele), die auch auf fremden Geräten laufen sollen.
      Wenn der Gewinn nicht von verkaufter Hardware kommt, woher dann?
      Oder will Apple damit Käufer für iPhone und Co ködern?
      Ich bin skeptisch gespannt, wie es weiter geht.
      Vorsicht ist in jedem Fall angebracht.

        • Da haben Menschen ihre Daten freiwillig veröffentlicht. Inwiefern bezieht sich das auf den zitierten Satz, man müsse Dienste von Apple im Auge behalten.
          Davon abgesehen ist es freilich ein Skandal, dass Menschen die dort genannten Daten (Zugangsdaten, Firmengeheimnisse, private Daten von unbeteiligten) frei verfügbar ins Netz stellen.
          Viele kleine Datensammler und -verteiler sind natürlich ebenso gefährlich wie ein großer. Hier auch schön zu sehen, wie sich Tools zur Auswertung nutzen lassen, um „ich-habe-nichts-zu-verbergen“-Informationen zu einem Datenberg von immensem Nutzen zusammenzutragen (Nutzen aus Sicht des Sammlers, für alle anderen ist das ein großer Schaden).
          Ich nenne das „Android‐Mentalität“: mir ist alles scheißegal, so lange es Spaß macht, nützlich ist oder bunt blinkt…

  2. Ich habe kein Verständnis dafür, warum Aktionen zuhause ins Web gefunkt werden müssen.

    Licht an — Licht aus — Garagentor auf könnte man doch wohl unabhängig vom Web trainieren.

Schreibe einen Kommentar

Pflichtfelder sind mit * markiert.