Conversation Design

Darf ich vorstellen: Mein erstes “virtuelles Ich” hat das Licht der Digitalwelt erblickt!

Erfahre hier was die Gedanken hinter dem Chatbot sind, was er leisten kann und wie die Praxis der Gestaltung aussieht. (UPDATE: IBM hat mein Watson-Projekt gelöscht.)

1.  Warum der Chatbot

Leidenschaft als Kommunikationslinguist
Schon letztes Jahr nach dem Release meiner Website hatte ich die Idee, einen Chatbot zu integrieren. Im Jan/Feb war die Zeit dann reif, das Vorhaben in die Tat umzusetzen. Der Drang danach hatte seinen Ursprung in meinem Interesse für Kommunikationsprozesse. Als studierter Kommunikationslinguist mit User Experience-Expertise ist die Gestaltung von Chatbots besonders reizvoll: Hier fließen analytisch-theoretische Herleitung, strategische nutzerzentrierte Diskurs-Gestaltung und kreatives Texten synergetisch zusammen und schaffen etwas, was als menschenähnlicher Dialogpartner wahrgenommen werden kann – das bedeutet für mich, die Kommunikation der Zukunft zu gestalten! Komplexe Dialogflows modellieren, alternative Formulierungen antizipieren, Persönlichkeit via Sprache zu übermitteln und das Ganze dann auch noch unmittelbar nutzbar zu machen, sind aus meiner Perspektive faszinierende Vorgehensweisen.

Website-Upgrade & (CUI-)Portfolio
Grundsätzlich soll mein Chatbot einen alternativen, nämlich konversationellen, Zugang zu den Inhalten meiner Website zu bieten. Idealerweise werden Infos dadurch noch schneller zugänglich. Persönliche Einblicke in mein Leben, meine Interessen usw., die exklusiv über den Chat erfahrbar sind, bieten darüber hinaus einen informativen Mehrwert. Insofern kann mein “virtuelles Ich” als ein wesentliches Upgrade meiner Website angesehen werden.
Ähnlich wie die Website selbst einen ersten Eindruck meiner Fertigkeiten (im Bereich UX-Konzept & UX-Writing) vermitteln kann, so gibt es dafür in Bezug auf Conversational User Interfaces wohl kaum einen besseren Weg, als eben einen eigenen Chatbot zu kreieren und diesen kontinuierlich weiterzuentwickeln. Damit habe ich gleichzeitig mein Portfolio im CUI-Bereich eröffnet.

Sticky Chat-Icon (rot) auf der gesamten Website
Begrüßung durch den Chatbot

Trend-Thema
Während das grundsätzlich nicht neue Thema längere Zeit wenig präsent war, gab es in den letzten zwei Jahren einen regelrechten Hype um Chatbots und Sprachassistenten: sie sind mittlerweile sichtbar in der gesellschaftlichen Realität angekommen und verdrängen allmählich sogar das ehemalige Trend-Thema Webdesign (vgl. Diagramme unten). Schon jetzt hört unser Auto, die Uhr am Handgelenk oder das Hotelzimmer auf unser Wort. Die Verkaufszahlen von amazon’s Alexa bzw. Downloads der zugehörigen Apps (“Skills”) steigen weiter beachtlich, IBM stattet ganze Krankenhäuser mit intelligenten Assistenzsystemen aus, erste Start-Ups fußen ihr Businessmodell auf spezialisierte Chatbots z.B. für den Kundeservice oder HR und allmählich suchen auch die ersten Digital-Agenturen zaghaft nach CUI-Designern, um sich für diesen Wandel zu wappnen. Die Verheißung ist groß: es geht um intelligenten, intuitiv zu bedienenden, omnipräsenten Service.
Für mich ist ein Chatbot-Projekt also kein Sprung ins Ungewisse, sondern absolut im Einklang mit dem digitalen Zeitgeist. Allerdings gilt für Deutschland, wie so oft bei Tech-Trends: es hinkt z.B. hinter den USA hinterher. Ein offener Stellenmarkt für CUI-Designer ist bisher kaum vorhanden und nachhaltige Investitionen werden anscheinend oft noch gescheut. Ähnlich wie beim UX Writing fühle ich mich hier beim Thema Chatbot deshalb als Teil einer Pionier-Bewegung.

Verfügbarkeit & Reifegrad der Plattformen
Zur insgesamt wachsenden Popularität trägt auch der höhere Reifegrad der virtuellen Assistenten bei. Fortschritte in Sachen Natural Language Processing (NLP), Machine Learning und Artificial Intelligence (AI) erlauben nun weit mehr als nur simples Multiple-Choice als Frage-Antwort-Spiel. Zahlreiche Anbieter stellen die entsprechenden Plattformen bereit, mit denen man über einfach zu bedienende Pflege-Interfaces auch ohne Programmierkenntnisse  solche Chatbots erstellen kann (für eine Übersicht z.B. chatbotsjournal.com, consumersadvocate.com oder maritutech.com.) Bis zu einem gewissen Grad sind die meisten sogar kostenlos und einige bieten mit Templates und Content-Katalogen auch einen schnelleren Einstieg an. Diejenigen mit der größten IT-Power sind z.B. IBM’s Watson Assistant und Google’s Dialogflow, deren Service auch sehr ähnlich aufgebaut sind.

2. Überblick: Was der Bot kann und was (noch) nicht

DAS LEISTET MEIN VIRTUELLES ICH BEREITS

  • Themen-Bereiche: UX Writing, CUI-Design
    (+ erste persönliche Infos)
  • Hochgradig konventionalisierte Dialogmuster
    (z.B. Begrüßung, Verabschiedung, Lob & Kritik kommunizieren)
  • Kontextuell determinierter Dialogflow
    (Thematischen Kontext für Verständnis von mehrdeutigen Aussagen nutzen)
  • Individualisierte, nutzerabhängige Antworten
    (Alternative Formulierungen in Abhängigkeit von spezifischen Nutzereingaben)
  • Anschlussfragen
    (zur Klärung von Nutzerabsichten oder Informationsstrukturierung)
  • Small Talk / Chit-Chat
    (Freierer Austausch über persönliche Infos/Interessen)
  • Repair-Handeling
    (Umgang mit Verständnisproblemen)
  • Aufsplitten einer Antwort in mehrere Teile
    (Manuell via JSON-Modifikation; keine Standard-Lösung)
  • Text-Links

DAS WÜRDE ICH IHM NOCH BEIBRINGEN

  • Weitere Themenfelder
    (Lebenslauf, usw. Ziel: Inhalte der Website abdecken)
  • Mehr persönliche Informationen
    (Mit chat-exklusiven Infos Mehrwert steigern)
  • Dialogtiefe ausweiten
    (Austauschmöglichkeit zu bestimmten Themen erweitern)
  • Gesteigerte Empathie
    (z.B. auf Indikatoren für emotionale Zustände reagieren)
  • Kontextuelle Dialog-Individualisierung
    (Nutzer-Reaktionen stärker für weiteren Dialogverlauf nutzen)
  • Multimedialität
    (Integration von Bildern, Icons usw., nach Möglichkeit)

DAS KANN WATSON STANDARDMÄßIG NICHT

  • Mit ihm spontan über Gott & die Welt philosophieren
    (Watson funktioniert nur in Abhängigkeit von Infos, die für ihn individuell erstellt wurden.
    Ein Netzwerk aus ca. 1 Billionen Wikipedia-Wörtern greift dann allerdings bei der Interpretation der manuell definierten Intents, Entities usw.)
  • Neue Inhalte automatisch generieren
    (Watson kann nicht selbstständig Textbausteine zusammenfügen oder fehlende Intents o.ä. ergänzen)
  • Nutzerdatenbank mit individuell abrufbaren Nutzerprofilen
    (Historie beschränkt auf den jeweils aktuellen Chat)
  • Proaktivität
    (Aktiv dem Nutzer zuvorkommen, statt nur auf seine Eingaben zu reagieren, ist nur eingeschränkt möglich)
  • Mehrsprachigkeit
3. Dialog-Ausschnitte im Detail: mein virtuelles Ich in Aktion
Exkurs - Chatbotgestaltung mit Watson Assistant & dessen sprachwissenschaftliche / kommunikationstheoretische Basis

Über vier Aspekte lässt sich der Chatbot von IBM individuell gestalten. Diese entsprechen wiederum zentrale Grundlagen der menschlichen Kommunikation.

  1. “Intents” / Funktion einer Sprachhandlung
    Die Absichten des Nutzers bilden die Ankerpunkte für den Dialog. Im Sinne der Sprechakttheorie der linguistischen Pragmatik handelt es sich dabei um Illukotionen: der Zweck bzw. Funktion einer Sprachhandlung, die über verschiedenartige Äußerungen zum Ausdruck gebracht werden kann. Der direktive Akt “LICHT ANSCHALTEN”, der z.B. an einen Sprachassistenten gerichtet wird, kann in den Äußerungsformen “Mach das Licht an!”, “Licht, bitte.” bis hin zu “Ziemlich dunkel hier.” kommuniziert werden. In der korrekten Zuordnung von Nutzer-Äußerung zum Intent liegt auch bereits eine wesentliche Kommunikationsleistung der Dialogsysteme, die über Natural Language Processing (NLP), Machine Learning und nicht zuletzt über den CUI-Designer durch Bereitstellung von Beispielformulierungen gelingen kann. KI (engl. AI) würde m.E. dann ins Spiel kommen, wenn das System “Ziemlich dunkel hier.” nicht durch ein verfügbares Beispiel, sondern durch Wissen um die Funktionsweise von Implikationen erkennt.
  2. “Entities” / Referenzpotentiale
    Entitäten dienen dazu, Intents näher zu bestimmen. Sprachwissenschaftlich gesehen handelt es sich dabei um extensionale Bezugnahme im Sinne von Referenzpotentialen: eine Menge an Dingen in der Welt, auf denen sich ein bestimmtes Lexem beziehen kann. Anstelle des eher generischen “Licht an!” könnte eine Nutzer-Äußerung sein “Blaues Licht, bitte”. Das System sollte diese konkrete Referenz zuordnen und das Referenzobjekt, blaues Licht, zur Verfügung stellen. Oft  lassen sich diese Entitäten in Relation zueinander setzen: z.B. das Hyperonym “Lichtfarbe” hat u.a. “blau”, “weiß”, “violett” als Hyponyme. Somit könnte sich der Nutzer alternativ auch violettes Licht vom Sprachassistenten wünschen.
  3. “Context Variables” / Common Ground
    Wie die Namensgebung bereits vermuten lässt, können mittels Variablen Nutzereingaben gespeichert und damit ein gesprächsinterner Kontext geschaffen werden. In der Diskurstheorie kommt dies dem Konzept von (implizitem) Common Ground nahe – ein situativ hergestellter, gemeinsamer Wissensraum der Gesprächsteilnehmer, der z.B. Inferenzen auf bereits Gesagtes erlaubt und zu Kohärenz im Gesprächsverlauf beiträgt. (Durch große Unterschiede im Weltwissen zwischen Mensch und Maschine ist ist eine rein kontextbedingte geteilte Wissensbasis allerdings fehleranfällig und ein vollständiger Common Ground unwahrscheinlich.) Unser Licht-Enthusiast könnte also mithilfe von Kontext-Variablen vom System auch verstanden werden, wenn er/sie nur “Ausschalten.” oder “Doch lieber blau.” äußert.
  4. “Dialogflow” / thematische Progession
    Hierüber sind die wechselseitigen Bezugnahmen, Adjazenz-Paare wie z.B. Frage-Antwort oder Frage-Gegenfrage, gestaltet. Vordefinierte Nutzereingaben in Form von Intents, Entities und/oder Variablen fungieren dabei als Bedingungen für bestimmte Systemausgaben, die i.d.R. vom CUI-Designer ausformuliert werden. Die einzelnen Interaktionssequenzen können dann als Knoten in hierarchische Beziehungen (Baumstrukturen) zueinander gesetzt werden, wodurch aus einem Hauptthema Nebenthemen abgeleitet werden. Dem allgemeinen Thema “Licht” sind dann z.B. verschiedene Details wie Lichtfarben, Lichtintensitäten bis hin zum Stromverbrauch untergeordnet.
Exkurs - Ende
4. Das Innenleben meines Bots: Beispiel-Zustände von Watson Assistant
Je mehr Beispielsätze, desto besser erkennt Watson die Nutzerabsicht.
Bestimmte Wörter/Formulierungen referenzieren auf spezifische Konzepte in der Welt.
Baumstruktur mit Willkommens-Nachricht als obersten Knoten
Bedingungen für Bot-Antwort und Speichern von Variablen.
Ausformulierung der Chatbot-Antworten.
Für komplexere Themen sollten zu Beginn mögliche Verläufe geplant werden. So würden z.B. "Happy Paths" und alternative Sequenzen unterschieden.
Je mehr Beispielsätze, desto besser erkennt Watson die Nutzerabsicht.
Bestimmte Wörter/Formulierungen referenzieren auf spezifische Konzepte in der Welt.
Baumstruktur mit Willkommens-Nachricht als obersten Knoten
Bedingungen für Bot-Antwort und Speichern von Variablen.
Ausformulierung der Chatbot-Antworten.
Für komplexere Themen sollten zu Beginn mögliche Verläufe geplant werden. So würden z.B. "Happy Paths" und alternative Sequenzen unterschieden.

UPDATE
Mein Watson-Assistant Projekt wurde (ohne Vorwarnung) gelöscht, nachdem ich kein Upgrade von einer Testversion auf ein bezahlte Version durchgeführt habe. Für private Anwendungen ist Watson nur unter Vorbehalt zu nutzen.
Es empfiehlt sich z.B. Dialogflow von Google, bei dem die kostenlose Version zwar mit Restriktionen, aber dauerhaft nutzbar ist! Vielleicht wage ich einen Neustart, bestenfalls mit einem noch spannenderen Use Case.

Leave a Reply

Your email address will not be published. Required fields are marked *

Post comment