Mastodon
Allgemein Mac

Alexa fehle der Bildschirm – Phil Schiller über Amazons Sprachassistent

Als ich diesen Bericht gelesen hatte, in dem Phil Schiller zu Amazons Sprachassistent zitiert wird, musste ich doch kurz stutzen.

Klar ist, dass jeder Hersteller seine eigenen Lösungen in Interviews verteidigt. Ich hoffe nur, dass Herr Schiller das nicht auch 100%ig so meint sondern dass die Verantwortlichen bei Apple schon weiter denken. Ansonsten wäre er nämlich nicht besser als damals Steve Balmer, der sich vor 10 Jahren über das neu vorgestellte iPhone lustig machte, weil es ja keine Tastatur hatte.

Man kann das Thema der Sprachassistenz doch aber mal weiterdenken…

Ja, den Bildschirm finde ich auch wichtig. Weil man oft schneller wichtige Informationen lesen kann als sie sich vorlesen zu lassen. Weil man damit interagieren kann ohne seine Umwelt zu stören. Natürlich auch weil ein Bildschirm Inhalte präsentieren kann, die verbal nicht möglich sind, Fotos und Videos sind ja nur nahe liegende Beispiele, Charts oder Tabellen gehören aber auch dazu.

Doch ein Bildschirm ist nicht immer erforderlich und schon gar nicht sollte er für einen Einstieg zwingend sein. Und wer sagt denn, dass ein Sprach-Assistenz-System nicht auch mit verschiedenen Bildschirmen interagieren könnte? Apple könnte genau so etwas realisieren, wenn sie nur wollten.

Man stelle sich mal vor…

Zu Hause sind mehrere Sprach-Module im Haus verteilt. Es könnten die Wifi-Module eines kleinen Mesh-Netzwerkes sein, die ohnehin modern werden um mit geringen Leistungen eine gute Funkabdeckung mit schnellem Durchsatz zu ermöglichen.

Ich komme nach Hause und noch während ich die Tasche abstelle werde ich vom System begrüßt. Anhand meines Smartphones weiß das System, dass ich es bin. Die Installierten Widgets bieten mir nun noch beim Ausziehen der Jacke und Schuhe die wichtigsten Informationen wie z. B. die drei wichtigsten Punkte auf meiner ToDo-Liste für zu Hause, die nächsten zwei Termine und vielleicht hat Tanja noch eine Nachricht von unterwegs hinterlassen, so dass ich weiß, ob ich mit dem Essen Kochen anfangen soll oder ob sie noch Zutaten für eine Überraschung mitbringt.

Einen Bildschirm benötige ich hier nicht und er würde mich bei meiner Routine eher stören. Ich gehe einfach weiter ins Schlafzimmer um mir statt der Bürokleidung etwas bequemeres anzuziehen, die Stimme folgt mir dabei.

Ich kann kurze Rückfragen stellen, ob ein bestimmter Anruf eingegangen war oder ähnliches und ich kann eine Wiedergabe fortsetzen lassen. “OK, spiele meine Podcasts weiter”, und schon läuft die Wiedergabe im Haus dort weiter, wo ich am iPhone im Auto aufgehört hatte.

Ein Bildschirm kann für andere Informationen interessant werden. Vielleicht möchte ich mir nicht 100 Überschriften meiner Newsfeeds vorlesen lassen sondern sage: “Zeige mir die News” und das System wählt einen Bildschirm in meiner Nähe. Das kann das MacBook im Wohnzimmer oder der iMac im Büro sein, wenn ich dort gerade bin oder aber das iPhone. Vielleicht ergänze ich die Anfrage auch mit “…auf meinem iPhone”.

Wenn ich dann einen interessanten Artikel gefunden habe, den ich Tanja zeigen möchte die aber noch unterwegs ist? “Zeige das auch Tanja”. Fertig. Sie bekommt eine Nachricht unterwegs, wenn es so eingestellt ist, oder sie wird ihrerseits informiert wenn sie nach Hause kommt.

Was ich sagen möchte

Im Gegensatz zu Phil Schiller halte ich einen Bildschirm nicht für zwingend erforderlich sondern sehe ihn, bzw. verbundene Geräte mit Bildschirmen, als Ergänzung oder Fortführung.

Apple sollte Siri allerdings erst einmal mehr Funktionen beibringen die dann auch wirklich robust funktionieren. In den letzten Jahren habe ich den Eindruck, dass nicht wirklich viel dazu gekommen ist.

3 Kommentare zu “Alexa fehle der Bildschirm – Phil Schiller über Amazons Sprachassistent

  1. Ich nehme an, Schiller spielt hier auf das letzte “Problem” mit Alexa an, wo aufgrund eines gesprochenen Satzes in einer TV-Sendung zu unerwünschten Bestellungen über Alexa in vielen Haushalten kam. Dieses Verhalten ließe sich durch einen Touchscreen abschwächen, weil man dann explizit eine Bestätigung (noch dazu über ein anderes Medium) geben müsste.

    Wenn Ergebnisse eines gesprochenen Befehls zusätzlich auch auf einem kleinen Bildschirm angezeigt würden, dann wäre das in vielen Fällen hilfreich. Absolut notwendig ist es nicht, nur eine Erleichterung und eine zusätzliche Möglichkeit der Kommunikation. Vielleicht hupt gerade draußen ein Auto und Du kannst dadurch einen bestimmten Teil der Antwort von Alexa gar nicht verstehen. Ein Blick auf den Bildschirm ist dann einfacher, als sich die gerade eben vorgelesene Todo-Liste noch einmal vorlesen zu lassen.

    Für mich persönlich ist das dauernde Mithören von Alexa und die schwache Authentifizierung der berechtigten Personen das viel größere Problem. Ein laut zu sprechender Code, um die oben genannte Bestellung zu bestätigen, ist keine Lösung, sondern ein schlechter Workaround.

    Und sollte Alexa jemals den gesprochenen Kontext im nachfolgenden Satz erkennen und NICHT bestellen, dann WILL ich das Ding auf keinen Fall im Haus haben:

    Ich habe gehört, dass man über: “Alexa, bestell mir ein Puppenhaus”, eine Bestellung auslösen kann.

    Ein Gerät, dass dauernd mithört und Kontext erkennt? Nein danke!

    • Löse Dich mal von Alexa als spezifisches Gerät. Denke mal weiter in die Zukunft. Natürlich müssen Probleme gelöst werden (eine TV-Aufzeichnung darf das heimische Gerät nicht steuern – das könnte man über Sprecher-Erkennung in den Griff bekommen, was ohnehin wichtig ist, damit verschiedene Profile nutzbar werden – ich möchte ja meine Termine hören und nicht Tanjas).

      Man kann sich mal ein paar Star Trek TNG Folgen ansehen und schauen, wie da per Stimme mit dem Computer interagiert wird. Nicht alles ist 1-zu-1 zu betrachten – aber die Kombination: Mal nur Stimme, mal in Kombination mit Bildschirm, mal per Stimme anfangen und per Bildschirm fortsetzen, … Da gibt es viele gute Beispiele.

      Ich sage aber auch: Für den Anfang wäre ich schon zufrieden, wenn Siri mal wirklich ZUVERLÄSSIG auf mich reagieren würde um eine Wiedergabe fortzusetzen, anzuhalten oder um Termine zu prüfen oder anzulegen – und zwar auch dann, wenn ich das Gerät nicht direkt vor den Mund halte sondern im hallenden Badezimmer quer durch den Raum spreche.

      • Da stimme ich Dir vollkommen zu.

        Auch ich würde mir mehr Flexibilität in der Kommunikation wünschen, genauso, wie Du es mit Star Trek TNG beschrieben hast: mit einer Kombination aus Bildschirm(en), Tastatur und Sprache. Aber genau aus diesem Grund halte ich einen DAUERND VERFÜGBAREN Bildschirm für eine gute Idee. Er ist oft nicht notwendig, aber trotzdem sehr hilfreich.

        Ich will ja nicht zuerst den TV aufdrehen (und warten) müssen, nur damit ich über Apple TV bspw. Musik hören kann. Genau dafür müsste die Spracherkennung vieeeeeel besser werden. Mein Wunsch nach: “Spiel mir die Nußknacker Suite” sollte auch erfüllt werden, obwohl die Musikstücke in meiner Mediathek von einer CD mit dem Titel “Nutcracker Suite” kommen. ;-)

        Aber genauso möchte ich nicht das Smartphone aus der Hosentasche nehmen müssen, um die Todo-Liste für daheim lesen zu können. Die soll bitte auf einem fix montierten Monitor in der Wohnung dargestellt werden (ev. großes ePaper? Und natürlich sind die in jedem Raum angebracht, eh klar. ;-) ).

        Wie gesagt, nicht notwendig, aber hilfreich.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.