6 Probleme, mit denen KI bei der Spracherkennung konfrontiert ist

Alle großen Unternehmen investieren in die Spracherkennung und die Welt stellt sich langsam und stetig auf die neue Technologie der künstlichen Intelligenz (KI) ein. Warum dauert es so lange, warum ist es noch nicht Teil unseres täglichen Lebens? Hier sind die 6 Gründe warum.

Sie gehen in ein Geschäft, um nach einer bestimmten Farbe und Marke eines Produkts zu suchen. Sie fragen einen Mitarbeiter, ob das gewünschte Produkt verfügbar ist. Der Mitarbeiter geht ins Lager, überprüft sein Inventar auf das Produkt und kommt eine Weile später zurück, um Ihnen mitzuteilen, dass Ihr Produkt nicht mehr verfügbar ist.

Stellen Sie sich nun vor, Sie betreten dasselbe Geschäft und teilen einem winzigen Gerät das Produkt mit, das Sie kaufen möchten. Innerhalb einer Sekunde informiert Sie eine Stimme über die genaue Verfügbarkeit Ihres Produkts und gibt Ihnen, falls nicht verfügbar, Details zu den Verkaufsstellen, in denen das Produkt verfügbar ist.

Das KI-Gerät scannt dazu intern alle digitalen Inventarsysteme. Warum wurde die Kunst der Spracherkennung und der persönlichen Assistenten mit zahlreichen Vorteilen in Bezug auf Kostenlogistik und vor allem Komfort noch nicht perfektioniert?

Da die Wissenschaft große Fortschritte bei der Erkennung von Schallwellen macht, werfen wir einen Blick auf einige der Hauptprobleme, mit denen Forscher beim Dekodieren von Sprache in Text konfrontiert sind.

Lärm

Sprachaufzeichnungsgeräte erkennen Schallwellen, die durch Sprache erzeugt werden. Hintergrundgeräusche in Räumen erschweren es den Systemen, die spezifischen Schallwellen von der Host-Stimme zu verstehen und zu unterscheiden. Dies verwischt den von den Geräten aufgenommenen Ton, verwirrt und schränkt seine Verarbeitungsfähigkeit ein.

Echo

Echos sind im Grunde genommen Schallwellen, die über verschiedene Oberflächen wie Wände, Tische oder andere Möbel reflektiert werden. Dies führt zu einer unorganisierten Rückkehr der Schallwellen zu den Rezeptoren, wodurch die Klarheit verringert wird.

Akzente

Eine Vielzahl von Akzenten in jeder Sprache ist ein weiterer Faktor, der zu Schwierigkeiten bei der Spracherkennung führt. Wenn dasselbe Wort auf verschiedene Arten ausgesprochen werden kann, variieren die Silben und die Phonetik desselben Wortes tendenziell, was die Verarbeitung für die Maschine erschwert.

Ähnliche Sounds

Ähnlich klingende Wörter und Phrasen können eine ordnungsgemäße Codierung und Decodierung der Sprachnachricht verhindern. Zum Beispiel sind „Lass uns einen schönen Strand zerstören“ und „Lass uns Sprache erkennen“ phonetisch sehr ähnlich und können das Gerät leicht verwirren.

Maschinenfehler

Die Genauigkeitsstufen der Spracherkennung weisen hohe Fehlerraten auf. Maschinen sind immer noch etwa 8 bis 12% der Fehler ausgesetzt, was mehr als doppelt so viel ist, wie Menschen in ihrer täglichen Sprache machen. Fehler bei der Codierung der gesammelten Daten sind für die Leistung von entscheidender Bedeutung, da dies der erste Schritt ist, auf den die Sprachaufzeichnungsgeräte reagieren müssen.

Unorganisierte Sprache

Das Zusammenführen von Wörtern in unseren täglichen Gesprächen bedeutet, dass viele Wörter und Phrasen miteinander verschmelzen. Dies ist nicht für die Erkennung von Maschinen und Sprache zu Text geeignet, da es schwieriger ist, bestimmte Wörter oder Ausdrücke zu erkennen, die die daraus resultierenden Reaktionen und Aktionen des Geräts beeinflussen.

Unabhängig davon, wie fortschrittlich diese Maschinen sind, werden die oben genannten Faktoren weiterhin die Entwicklung von KI-Assistenten behindern, die sich vorwärts bewegen. Angesichts der Geschwindigkeit, mit der sich Wissenschaft und Technologie entwickelt haben, konzentrieren sich alle großen Unternehmen darauf, die optimalen Spracherkennungsgeräte zu entwickeln. Früher oder später werden ihre Falten ausgebügelt, und wir werden alle einen sprachgesteuerten Roboter haben, der unsere Häuser betreibt sowie unser Leben.

Erfahren Sie mehr über RAF 100 Event und What is STEM

Folgen Sie uns auf LinkedIn, um auf unsere exklusiven Inhalte zuzugreifen! # raf100event #WhatIsSTEM