Sie versuchen ein Unternehmen telefonisch zu erreichen und landen in der Warteschlange. Das ist nichts ungewöhnliches. Viele Unternehmen setzen auf interaktive Sprachdialogsysteme (Interactive Voice Response, IVR), um den telefonischen Kundenservice zu optimieren. Der Anrufer kommuniziert im ersten Schritt über das IVR-System, um an den gewünschten Gesprächspartner weitergeleitet zu werden. Doch trotz aller technologischen Fortschritte in der Spracherkennung stößt die Technik manchmal an ihre Grenzen. Wie diese Hürden aussehen und was Unternehmen tun können, um diese Herausforderungen zu überwinden, lesen Sie in diesem Beitrag.
Was ist ein IVR-System?
Ein IVR-System (interaktive Sprachausgabe) ist ein automatisiertes Sprachdialogsystem, das mit dem Anrufer über Sprachmenüs kommuniziert. Die Rückmeldung des Anrufers erfolgt über zwei Wege, entweder über Sprache oder über die Eingabetasten am Telefon.
Herzlich willkommen bei Pfalzcloud. Wie können wir Ihnen helfen? Möchten Sie mit dem Vertrieb sprechen, wählen Sie die 1 auf Ihrer Tastatur. Möchten Sie mit dem Service verbunden werden, wählen Sie die 2.
Das System segmentiert Anrufer je nach Anfrage und hilft dabei diese schnell und effizient an die richtige Abteilung weiterzuleiten. Die Rückmeldung des Anrufers kann auch über Sprache erfolgen.
Herzlich willkommen bei Pfalzcloud. Wie können wir Ihnen helfen? Möchten Sie mit dem Vertrieb sprechen, sagen Sie „Vertrieb“. Möchten Sie mit dem Service verbunden werden, sagen Sie „Service“. Sie werden danach direkt weitergeleitet.
IVR kann aber auch als Self-Service-Angebot fungieren. Dazu haben wir hier bereits einige Artikel verfasst: Self-Service-Angebote im Kundenservice. Es kann dem Anrufer auch ohne Agenten Informationen bereitstellen und auf Ressourcen 24/7 zurückgreifen; unabhängig von Öffnungszeiten oder der Anwesenheit von Agenten (z. B. Sonderevents über IVR an Anrufer kommunizieren oder Pin-Eingabe im IVR-System für Premium-Kunden).
Hürden der Spracherkennung im IVR
Über die Effizient und Vorteile eines IVR-System soll es aber gar nicht gehen. Es soll um die Hürden gehen, mit denen Anrufern besonders über die Spracheingabe in das IVR-System konfrontiert werden. Werfen wir einen Blick darauf, was die Spracherkennung manchmal so schwer macht. Und das hat erst einmal nichts mit dem System selbst zu tun.
Hintergrundgeräusche
Die Spracherkennung wird oft durch Faktoren behindert, die außerhalb der Kontrolle des Kunden oder des Systems liegen. Denken wir an ein Szenario, bei dem der Kunde während der Autofahrt anruft: Das Verdeck ist geöffnet, der Wind pfeift, und der Wagen fährt gerade durch einen Tunnel. Solche Umstände machen es nahezu unmöglich, klare Sprachdaten zu übertragen, was die automatische Verarbeitung erheblich erschwert.
Hintergrundgeräusche sind eine unterschätztes Erschwernis für die Übertragung von Sprachdaten. Wir bei Pfalzcloud haben viele Kunden aus der Industrie, Maschinen- und Anlagenbau sowie der Produktion. Wir wissen um die Hürden, wo Seriennummern von Maschinen oder Produkten über das Telefon via Spracherkennung (also via IVR-System) kommuniziert werden müssen. Der Anrufer steht in einer lauten Produktionshalle, an einer Maschine und möchte telefonisch eine Seriennummern durchgeben. Hintergrundgeräusche gepaart ewig lange Seriennummern an ein IVR zu übermitteln, klappt nicht immer. In einer typischen Produktionshalle geprägt von laufenden Maschinen, klappernden Teilen und allgemein hoher Geräuschkulisse, wird die korrekte Spracherkennung schnell zur Herausforderung.
Komplizierter Callflow
Wenn die Spracherkennung scheitert, müssen Kunden dieselben Informationen oft mehrfach wiederholen. Dies ist nicht nur zeitaufwendig, sondern auch frustrierend. Und es sind nicht nur Hintergrundgeräusche, die die Bedienung des IVR-Systems erschwerten. Auch der Callflow, also die Menüstruktur, durch die sich ein Anrufer „arbeiten“ muss, können zu Frustration führen. Um da zu punkten gibt es Callflow-Designer. Sie helfen Unternehmen, ihre Anrufverteilung zu optimieren.
Verwirrendes Routing
Auch das unüberlegte Routing im Unternehmen kann einen Anrufer den letzten Nerv kosten. Gute IVR-Systeme bringen einen Anrufer schnell zu passenden Ansprechpartner, das geht z. B. über das Skill-based Routing effizient und direkt. Zu viele Informationen in einer IVR-Ansage kann der Anrufer schwer „überblicken“, also akustisch nicht so gut verstehen, wie wenn man etwas aufgeschrieben sieht. Anrufer vergessen auch gerne, dass das IVR-System natürlich nichts „versteht“, sondern die Spracheingabe nur „erkennt“ und sich auf vorab festgelegte Eingabe-Wörter beschränkt. Wird ein Sprachdialog aufgesetzt, müssen viele Annahmen getroffen werden, die sich natürlich über Zeit in einem Unternehmen auch ändern können. Daher ist es wichtig, die Ansagetexte regelmäßig zu überprüfen.
Kommen mehrere Hürden zusammen, verdoppelt das den Frust am Telefon.
Keine 100-prozentige Spracherkennung durch u. a.
- Umwelt- und Hintergrundgeräusche u. a. menschliche Stimmen, Produktionslärm, Wind
- Ähnlichkeit in der Aussprache verschiedener Begriffe durch den Anrufer
- Dialekt, Akzente, unklare Aussprache des Anrufers (IVR „versteht“ nicht, sondern „erkennt“ nur)
- Signalstörung im Telefonnetz, Tunnel etc.
Weitere Hürden im IVR:
- Komplizierter, unüberlegter Callflow
- Veraltete oder unverständliche Ansagetexte
- kein direktes Routing „sich durchfragen“ müssen
IVR optimieren
Ein IVR-System ist immer da, um den Anrufer zu helfen. Es soll keinen Anrufer mit Informationen überfrachten, noch so kompliziert sein, dass man „stundenlang“ Auswahlen treffen muss, um weitergeleitet zu werden. Gleichzeitig soll das System auf dem neusten technischen Stand sein und bestenfalls KI als Unterstützung nutzen, damit Anrufer auch unter lauten Bedingungen verstanden werden.
Problemen bei der Spracherkennung des IVR-Systems können Unternehmen mit folgenden Möglichkeiten begegnen.
Hybridlösung für Eingabe
Die Kombination aus Spracherkennung und manueller Eingabeoptionen (z. B. per Tastatur) könnte die Flexibilität erhöhen. Kunden, deren Spracheingaben nicht korrekt erkannt werden, könnten alternativ Informationen eintippen. Das unterstützt u. a. zudem die Barrierefreiheit Ihres Kundenservices!
Geräuschfilter und KI
Künstlichen Intelligenz ermöglicht es, Hintergrundgeräusche herauszufiltern und die Erkennungsgenauigkeit zu verbessern. Spezialisierte Algorithmen könnten so trainiert werden, auch in lauten Umgebungen präzise Ergebnisse zu liefern.
CRM integrieren
Systeme könnten auf die individuellen Gegebenheiten des Kunden abgestimmt werden, etwa durch die Verwendung von gespeicherten Daten (z. B. Seriennummern aus vorherigen Anrufen), um den Aufwand für den Kunden zu minimieren. Daten werden aus dem CRM herangezogen. Kunden müssen dann nicht mehr alle Informationen doppelt und dreifach „einsprechen“ in das IVR-System. Die KI kann den Kontext des Anrufs erkennen, weil die KI auf Daten aus dem CRM und vorherigen Anrufen zurückgreifen kann. Der Anrufer wird gezielt an die Abteilung weitergeleitet, die seine Anfragen am besten bearbeiten kann.
Bildbasierte Alternativen
Ein QR-Code, den Kunden scannen können, um Seriennummern oder andere Informationen direkt zu übertragen, könnte Spracherkennung in kritischen Fällen ersetzen.
Azure AI Speech für bessere Spracherkennung
Unternehmen, die ein IVR-System nutzen, um Anrufe im Unternehmen besser zu verteilen, sollten sich der Limitationen bewusst sein und Strategien entwickeln, um es widerstandsfähiger gegenüber externen Störungen zu machen. Denn nur durch eine nahtlose und zuverlässige Erkennung können Frustration vermieden und Kundenzufriedenheit gewährleistet werden. Microsoft Azure AI Speech (oder auch Azure KI Speech) ist ein Microsoft-Dienst, der genau diesen Hürden begegnet. Dazu im nächste Beitrag mehr.
Foto von Jason Leung auf Unsplash
Tags:

