Apple setzt Auswertung von Siri-Aufnahmen durch Menschen aus

Die Erkenntnis, dass Aufnahmen von Sprachassistenten zum Teil von Menschen abgetippt werden, um die Spracherkennung zu verbessern, schockierte viele Nutzer. Apple will künftig ausdrücklich die Erlaubnis dazu einholen. Bis dahin wurde die Praxis gestoppt.

Ein Mann spricht in sein iPhone. Apple setzt weltweit die Praxis aus, Fragmente von Aufnahmen seiner Sprachassistentin Siri nachträglich von Menschen auswerten zu lassen. Foto: Alexander Heinl - dpa-infocom GmbH

Das Wichtigste in Kürze

  • Apple hat als erster Anbieter von Sprachassistenten angekündigt, die Nutzer ausdrücklich um eine Erlaubnis zum nachträglichen Anhören von Mitschnitten durch Mitarbeiter zu fragen.

Die Funktion solle in einem späteren Software-Update umgesetzt werden, teilte der iPhone-Konzern. Bis dahin werde die Praxis weltweit gestoppt und auf den Prüfstand gestellt.

Bei Assistenzsoftware wie Amazons Alexa, dem Google Assistant und Siri wurden Fragmente von Mitschnitten seit Jahren zum Teil auch von Menschen angehört und abgetippt, um die Qualität der Spracherkennung zu verbessern. Es geht dabei zum Beispiel um Fälle, in denen die Sprachassistenten den Befehl nicht verstanden, die falsche Erkennung von Aktivierungswörtern sowie den Umgang mit neuen Sprachen und Dialekten. Die Anbieter betonen, dass die Aufnahmen davor anonymisiert würden. Den Nutzern war die Praxis allerdings weitestgehend nicht bewusst, bis vor einigen Monaten erste Medienberichte dazu auftauchten.

Apple verwies schon länger in einem Sicherheitsdokument darauf, dass auch «eine geringe Anzahl von Transkriptionen» für die Verbesserung des Dienstes eingesetzt werden könne. Nach dem Papier im Bereich für Entwickler musste man allerdings erst suchen - und die Nutzer werden bei der Einrichtung von Siri bisher nicht explizit auf diese Möglichkeit hingewiesen. Jetzt hiess es: «Als Teil eines künftigen Software-Updates werden Nutzer die Möglichkeit haben, sich für die Teilnahme an der Auswertung zu entscheiden.»

In einem Bericht der Zeitung «Guardian» vergangene Woche erzählte der Mitarbeiter eines Apple-Dienstleisters, auf den Aufnahmen seien zum Teil sehr private Details zu hören. So schnappe Siri auch Fragmente von Gesprächen mit medizinischen oder geschäftlichen Inhalten, mögliche kriminelle Aktivitäten oder auch Nutzer beim Sex auf, sagte er.

Die fehlerhaften Aktivierungen, bei denen die Software glaubt, die Weckworte «Hey, Siri» gehört zu haben, sind dabei ein besonderes Problem. Denn dabei können Sätze und Unterhaltungen aufgezeichnet werden, die nicht an die Sprachassistentin gerichtet waren. Beim nachträglichen Anhören sollen die Mitarbeiter herausfinden, welche Worte oder Geräusche die versehentliche Aktivierung auslösten, um die Software entsprechend anzupassen.

Nach früheren Angaben von Apple wurde weniger als ein Prozent der Aufnahmen in meist nur wenige Sekunden langen Fragmenten von Menschen ausgewertet. Laut Angaben in dem Sicherheitspapier für Entwickler können Mitschnitte bis zu zwei Jahre lang für die Verbesserung des Dienstes verwendet werden, nach sechs Monaten werde eine Kopie ohne persönliche Informationen gespeichert.

Erst am Donnerstag war bekannt geworden, dass Google nach einem ähnlichen Bericht über seinen Assistant bereits Anfang Juli das Anhören der Mitschnitte durch Menschen in der EU ausgesetzt hat. Dieser Stopp gilt noch mindestens bis Ende Oktober, wie der Hamburger Datenschützer Johannes Caspar mitteilte. Er leitete wegen der Praxis ein Verwaltungsverfahren gegen den Internet-Konzern ein, um das Anhören der Mitschnitte durch Google-Mitarbeiter oder Dienstleister zu untersagen. Laut Google werden nur rund 0,2 Prozent aller Sprachbefehle an den Assistant auf diese Weise abgetippt.

Apple war 2011 mit Siri auf dem iPhone ein Vorreiter bei Sprachassistenten. Es war aber erst die Idee von Amazon, die Alexa-Software in die vernetzten Echo-Lautsprecher des Konzerns einzubinden, die den Markt in Schwung brachte. Google zog mit dem Assistant auf Smartphones und seinen Home-Lautsprechern nach, Apple folgte mit dem HomePod-Lautsprecher. Inzwischen versuchen Amazon und Google, ihre Assistenzsoftware in immer mehr Geräte verschiedener Hersteller zu bringen, neben Lautsprechern sind das auch Hausgeräte bis hin zur Mikrowelle.

Die Assistenten starten die Aufzeichnung grundsätzlich erst, wenn sie das Aktivierungswort - «Hey, Google», «Alexa» oder «Hey, Siri» - hören. Allerdings müssen die Mikrofone ständig aktiv sein, um das Weckwort nicht zu verpassen. Es gibt die Möglichkeit, die gespeicherten Aufnahmen von den Servern löschen zu lassen. Apple hat zugleich mit seinen häufigen Versprechen, die Privatsphäre der Nutzer konsequent zu schützen, die Ansprüche an sich selbst hochgeschraubt.

Datenschützer haben schon lange Einwände gegen die Sprachassistenten. Zum einen sehen sie ein Problem darin, dass sich in einem Haushalt nur schwer dafür sorgen lässt, dass nur Daten von Nutzern verarbeiten werden, die dem auch ausdrücklich zugestimmt haben - was ist zum Beispiel, wenn man Besuch bekommt? Zum anderen sieht unter anderem Caspar ein Problem darin, dass die Nutzer nicht ausdrücklich darauf hingewiesen wurden, dass die Mitschnitte auch von Menschen angehört werden können und nicht nur automatisiert zum maschinellen Lernen genutzt werden.

Für zusätzliche Skepsis sorgten Pannen, wie etwa ein Zwischenfall in den USA 2018, bei dem Alexa den Mitschnitt einer Unterhaltung eines Paares an eine Person aus deren Kontaktliste verschickte. Amazon sprach von einer unglücklichen Verkettung von Fehlern. Zunächst glaubte die Software fälschlich, das Aktivierungswort «Alexa» erkannt zu haben. Dann hörte sie aus der weiteren Unterhaltung den Befehl «sende eine Nachricht» und auch einen Namen heraus. Alexa habe dann gefragt, ob die Nachricht an einen bestimmten Empfänger verschickt werden solle. Das Paar hörte die Frage auf dem leise eingestellten Lautsprecher nicht - aber irgendein Wort aus ihrer weiteren Unterhaltung wurde als Zustimmung interpretiert.

Ein wiederkehrendes Thema ist auch die Möglichkeit der Nutzung von Aufzeichnungen der Sprachassistenten für die Strafverfolgung. In den USA ist mindestens ein Fall bekannt, in dem Ermittler bei der Aufklärung eines Todesfalls auf Alexa-Mitschnitte zugreifen wollten. Auch in Deutschland gibt es Überlegungen der Innenminister, Ermittlern den Zugriff auf Daten digitaler Sprachassistenten zu ermöglichen.