Die Spracherkennung innerhalb von IVR-Systemen kann eine Herausforderungen sein. In meinem letzten Beitrag habe ich Ihnen vorgestellt, dass u. a. Hintergrund- und Umweltgeräusche die Erkennung der Sprache für das interaktive Sprachdialogsystem stark beeinflussen können. In diesem Beitrag möchte ich Ihnen Microsoft Azure AI Speech und AI Speech Analytics vorstellen, das nicht nur die Spracherkennung im IVR-System verbessert, sondern darüber hinaus wertvolle Erkenntnisse aus Kundengesprächen gewinnt und Prozesse optimiert.
Wenn Sie mit unserem Vertrieb verbunden werden möchten, wählen Sie die 1. Möchten Sie mit unserem Service sprechen wählen Sie die 2.
Was ist eine interaktive Sprachausgabe?
Jeder Anrufer wird so eine Ansage in der Warteschlange kennen. Wir müssen, bevor wir durchgestellt werden, eine Auswahl treffen, damit wir mit der für unsere Anfrage passendsten Person verbunden werden. Anrufer in einer Warteschlange werden gefragt, wo sie hinwollen. Das „fragt“ uns das IVR-System, kurz für Interactive Voice Response oder interaktive Sprachausgabe. Das IVR verbindet uns mit der richtigen Information, dem richtige Ansprechpartner oder richtigen Service. Dieses automatische Routing, also automatische Anrufverteilung ist für manche Anrufer ein frustrierendes Erlebnis.
Frust für Anrufer im IVR-System
- Endlose Auswahloptionen
- Schlechte Benutzerführung
- Komplizierte Menüführung
- Zu viele Entscheidungspunkte
- Spracheingabe und Spracherkennung
Die Spracherkennung ist häufig ein frustrierendes Hindernis. Und das liegt oft nicht am System oder an der Technologie, sondern an den Gegebenheiten, die um die Spracherkennung herum Einfluss nehmen. Ich hatte es im letzten Beitrag erläutert: Hintergrundgeräusche in Produktionshallen und Festigungen, sowie Umweltgeräusche bei der Spracheingabe stören die Erkennung und machen es letztlich unmöglich für das System, die richtige Anrufverteilung vorzunehmen.
Microsoft Azure AI Speech
Der Dienst Azure AI Speech kombiniert Funktionen aus den Bereichen Sprach-, Text- und Datenanalyse, um die Herausforderungen bei der Spracherkennung zu meistern. Azure AI bezeichnet alle KI-Dienste und -Tools, die auf der Azure-Plattform verfügbar sind.
Azure AI Speech ist ein spezialisierter Teil von Azure Cognitive Services, der sich auf Sprachverarbeitung konzentriert.
- Sprach-zu-Text (Speech-to-Text): Konvertiert gesprochene Sprache in Text.
- Text-zu-Sprache (Text-to-Speech): Konvertiert geschriebenen Text in natürliche, synthetische Sprache.
- Sprachübersetzung (Speech Translation): Übersetzt Sprache in Echtzeit in andere Sprachen.
Azure AI Speech Analytics ist eine spezialisierte Anwendung von Azure AI Speech, die sich auf die Analyse und Auswertung von Sprachdaten konzentriert.
- Analyse von Gesprächsmustern, Tonalität und Emotionen in Anrufen
- Identifizierung von Schlüsselwörtern, Trends und Problemen in Kundeninteraktionen.
- Überwachung der Qualität von Kundengesprächen.
Microsoft Azure AI Speech kann für Unternehmen, die ein IVR-System einsetzen verschiedene Hilfestellungen geben, um die Spracherkennung zu verbessern, sowie weitere Verbesserungen im Kundenservice zu liefern. Welche Verbesserungen Azure AI Speech liefert, habe ich Ihnen hier zusammengestellt.
Transkription von Anrufen in Echtzeit oder aus Aufzeichnungen
Azure AI Speech kann Audioaufzeichnungen in Echtzeit transkribieren und hochpräzise, formatierte Texte erstellen. Diese Spracherkennungsfunktion (Sprache-in-Text) erfolgt also in dem Moment, wo der Anrufer spricht. Dies ist besonders bei Anrufen hilfreich, wenn Seriennummern, Vorgangsnummern oder andere wichtige Details selbst unter (starker) Geräuschkulisse erkannt werden müssen. Die Transkription eines Anrufs bzw. eines Gesprächs kann auch aus Aufzeichnungen („schnelle Transkription“) erfolgen, die dann schneller als Echtzeitaudio erstellt wird.
Reduktion von Störgeräuschen und Aussetzern
Mithilfe fortschrittlicher KI-Algorithmen können Hintergrundgeräusche gefiltert und die Spracherkennung auch in lauten Umgebungen wie einer Produktionshalle, Fertigung oder Anrufe mit Umweltgeräuschen optimiert werden. Unverständliche Seriennummern oder wichtige Details werden so exakt festgehalten.
Erweiterte Analyse und Insights
Azure AI Speech Analytics ermöglicht die Identifikation wichtiger Themen, Stimmungen und personenbezogener Informationen (PII = Personally Identifiable Information). Sie können PII aus der Unterhaltung extrahieren und redigieren. Dadurch kann das System nicht nur Daten erfassen, sondern auch kontextbezogene Informationen extrahieren. Das stellt auch die Einhaltung der Datenschutzrichtlinien sicher.
Anpassung an Unternehmensanforderungen
Azure AI Speech ermöglicht eine flexible Anpassung der Modelle an branchenspezifische Anforderungen. Unternehmen können so maßgeschneiderte Lösungen entwickeln, die perfekt zu ihren Prozessen passen. Mit dem Speech-Dienst von Azure können mit neuronalen Stimmen Interaktionen mit Chatbots oder dem IVR-System natürlicher gestaltet werden.
Integration Azure AI Language
Azure OpenAI und Azure AI Language können nahtlos integriert werden. Dieser Dienst verarbeitet natürliche Sprache (Natural Language Processing, NLP), um Texte zu verstehen und zu analysieren, u. a. Stimmungsanalyse, Zusammenfassung, Spracherkennung.
Häufige Anwendungsfälle in der Praxis
Der Speech-Dienst von Azure bietet folgende Features, die für die Optimierung der Anrufqualität eingesetzt werden können.
- Anrufaufzeichnungen transkribieren: Ein produzierendes Unternehmen, das die Seriennummer seines Produktes über das IVR-System angibt, könnte trotz einer lauten Umgebung präzise erfasst werden.
- Anpassung von Transkripten: Gesprächsprotokolle werden so formatiert, dass sie direkt in CRM-Systeme integriert werden können.
- Themenanalyse: Das System identifiziert automatisch Themen wie technische Probleme oder Kundenbeschwerden, wodurch Unternehmen schneller reagieren können.
- Stimmungsanalyse: Nach jedem Anruf kann ermittelt werden, wie zufrieden der Kunde mit dem Gespräch war.
- Erstellung von Zusammenfassungen: Statt eines vollständigen Gesprächsverlaufs erhält das Support-Team eine prägnante Zusammenfassung der wichtigsten Inhalte.
Ein Beispiel aus der Praxis
Ein Hersteller von Backöfen setzt Microsoft Azure AI Speech ein, um den Kundenservice zu verbessern. Wenn ein Bäcker in seiner lauten Arbeitsumgebung anruft, transkribiert der Azure Speech-Dienst die Seriennummer seines Geräts und identifiziert das Anliegen automatisch. Diese Daten werden automatisch an das CRM-System wie Salesforce oder SAP übergeben, sodass der Support schnell reagieren kann.
Warum Microsoft Azure AI Speech?
Durch die Verwendung eines vollständig verwalteten und orchestrierten Dienstes wie Azure AI profitieren Unternehmen von einer skalierbaren, flexiblen und zuverlässigen Lösung. Die Integration zusätzlicher Dienste erlaubt es, den gesamten Prozess des Kundenservice – von der Eingabe bis zur Analyse – zu automatisieren und zu optimieren.
Foto von Julian Berengar Sölter auf Unsplash
Tags:


