Intelligente Assistenten-Siri, Google Now, Cortana und dergleichen-haben von Kuriositäten und Taschenspielertricks vor wenigen Jahren zu wichtigen Tools, die viele Menschen in ihrem täglichen Leben verschwunden. Letzte Woche ließ ich durch die intelligente Assistenten-Konferenz in New York, von Opus Research vorgestellt, und wurde von dem Fortschritt der Software machen in einer Vielzahl von Branchen, darunter Finanz-, Versicherungs- und Medizinunternehmen gebäudespezifische Agenten beeindruckt.
Opus Research Gründer Dan Miller erklärte, wie viele der Kerntechnologien, wie Spracherkennung, gibt es schon seit mehr als 20 Jahren gewesen, aber hat vor kurzem einige große Verbesserungen gesehen. Aber anstatt zu sehen dies als eine Revolution, sagte er: "Wir sind auf einem evolutionären Weg", mit vielen Produkten auf einem Kontinuum mit unterschiedlichen Fähigkeiten. Er wies darauf hin, dass es Hunderte von Unternehmen intelligente Assistenten, die für eine einfache textbasierte Gespräch im Klartext mit einer festen Datensatzes verwendet werden kann, und für Dinge wie Navigation einer Website oder einer FAQ. Am anderen Ende des Spektrums gibt es wohl nur ein paar Dutzend "dynamischen, Mensch-Gefühl Apps", die mehr Konversation und Kontext bewusst sind.
Miller wies auf Anwendungen, die Auszeichnungen auf der Konferenz gewonnen. Amtrak Julie vor Jahren begann als einem interaktiven Sprachantwort-Telefon-Service-Agent, aber jetzt hat sich zu einem Mittel, das auf der Website arbeitet, um Reisende über Amtrak.com zu führen, auf der Grundlage eines Mittels aus nächster IT entwickelt. Telefonica Mexico hat ein Agent namens Nico, die einen Avatar hat und bietet auch Unterstützung über Twitter und Facebook, basierend auf Plattform AgentBot ist. ING Netherlands hat Inge, eine Anwendung, die Ihnen Ihre Bank Kontostand oder Geld per Sprache mit sprachlicher biometrische Technologie von Nuance, um Ihre Identität zu authentifizieren können.
Anerkennungen beinhalten Anwendungen im Gesundheitswesen, wie eine App, die Sie wählen Sie ein Gesundheits-Plan hilft. Andere Anwendungen Ich habe gehört, der auf der Messe gehören Dominos Pizza, die eine App namens Dom, die Sie verwenden, um Sprach Pizza zu bestellen ermöglicht hat; und BMW, die einen virtuellen Agenten als Teil seiner Up2drive Auto-Finanzierung Arm.
Nuance Brett Beraneck sprach darüber, wie die Fortschritte in der tiefen Lernens neuronale Netze haben Dinge wie Sprachverstehen sowie die Spracherkennung verbessert, und wie diese kommt jetzt zusammen, um viel mehr Interesse auf dem Gebiet zu ermöglichen. Nuance Nina Assistent war ein frühes Beispiel, und seitdem hat es eine Menge von speziellen Anwendungen gewachsen, von Sprachdialogsystemen bei Versicherungen Einkaufsmöglichkeiten apps. Jede dieser Anwendungen hat eine andere Persönlichkeit, je nachdem, was sie versucht, um Ihnen zu tun.
Eine große neue Feature diskutiert er war Sprachbiometrie, in denen Sie Ihre Stimme ersetzt ein Passwort. Er sprach darüber, wie Unternehmen wie ING in Europa sind Entwicklungsmittel, die nicht nur Spracherkennung und Verarbeitung natürlicher Sprache verwendet, wurden aber auch an, Stimme verwenden, um den Anrufer zu erkennen. Er sagte, dies sei sicherer und natürlicher, als eine traditionelle Passwort.
Während die jüngsten Studien haben Angst, dass Sprachaufzeichnungen könnten solche Systeme zu täuschen, Nuance darauf hingewiesen, dass die heutige Technologie bietet Funktionen bei Abholung Anomalien aufgezeichnete Stimme ausgerichtet und wies auf andere Studien, die eine andere Sicht nahm. Außerdem sagte er, können Entwickler verschiedene Ebenen der Sprachbiometrie für verschiedene Funktionen, wie zum Beispiel mit einfachen Anerkennung auf einen Kontostand zu überprüfen, aber fragen Sie eine zufällige Folge von Wörtern für bedeutende Geldüberweisungen zurück zu sprechen, zu verwenden.
Sprachbiometrie scheint sicher zu sein, gewinnt ein wenig Traktion. In der vergangenen Woche Gartner Symposium, eine Tagung über "cool Kundenfälle" im Finanzdienstleistungen enthalten eine Citibank App, die diese Funktion verwendet.
MyWave hat einen Assistenten namens Frank, der dazu bestimmt ist, die von mehreren Unternehmen aktiviert sein, damit Sie mit ihnen in einer Konversation Weise zu interagieren, anstatt jedes Unternehmen entwickeln ihre eigenen. Die ersten Anwendungen sind eine New Zealand Bank und eine App namens Saveawatt konzipiert, um Ihren Stromanbieter auswählen.
CEO Geraldine McBride erklärt, dass das Unternehmen versucht, Assistenten, die die Lücke zwischen Kunden und Service-Anwendungen zu überbrücken, mit dem, was sie als "Kunden-Managed Beziehungen" oder CMR, ein Spin auf traditionelle CRM-Anwendungen zu erstellen. Ein großer Unterschied, sagte sie, ist, dass der Kunde ist verantwortlich für alle seine Daten, anstatt das Geschäft.
Eine weitere relativ neue Firma, Expect Labs hat ein Produkt namens MindMeld, die als Backend zu einer Reihe von Unternehmen, die eine Sprachschnittstelle, um traditionelle Schnittstellen zu ersetzen und zu handhaben Fragen und Antworten bieten möchte funktioniert. Dies könnte für eine Vielzahl von Anwendungen, wie zB TV-Sendungen von nur fragen Sie den Namen und mit den Systemabfrage mehreren Systemen verwendet werden. (Amazon Feuer TV hat einige dieser Funktionen, ist aber nicht mit Ihrem Kabel-Set-Top-Box integriert, während einer der Investoren in Expect Labs Kabelnetzbetreiber Liberty Global.)
CEO Tim Tuttle erklärte, dass MindMeld neigt dazu, die Spracherkennung bereits in den meisten Geräten zur Verfügung zu verwenden und stattdessen konzentriert sich auf Sprachverstehen und den Aufbau einer Wissens Diagramm der verfügbaren Informationen. Er sagte, das Unternehmen wird versuchen, das System zu skalieren, um mehr Informationen aus mehreren Quellen umfassen, und die Hierarchien der verschiedenen Kategorien von Informationen, die ein Bestandteil der meisten solcher Systeme sind abzubauen. Wirklich zu verstehen, Fragen, bedeutet, sich der Absicht in einer Vielzahl von Kategorien zu verstehen, sagte er.
Eine Sache habe ich von einer Anzahl von Teilnehmern zu hören waren Statistiken darauf hindeutet, dass etwa 10 Prozent aller Web-Suchen werden nun über Geheimdienstler geschehen. (AI-Pionier Andrew Ng sagte, dies sei wahr für die Sprachsuche zu Baidu im letzten Jahr und mehrere Personen sagte, dies sei nun wahr Google auch, aber ich habe keine Bestätigung erster Hand zu hören.)
Wir freuen uns, das Opus Research Miller gab es noch viel Arbeit zu tun. Die Grundgenauigkeit der Systeme haben genug Platz für Verbesserungen, insbesondere beim Übergang von was Sie, was Sie zu dem, was als Ergebnis zu tun bedeutet, sagte. Er erwähnte einen Vortrag von Xerox PARC CEO Stephen Hoover auf der Konferenz, der sagte, dass die Systeme heute sind jetzt bis zu 90 Prozent genau zu verstehen, was wir meinen, aber das 10 Prozent ist immer noch ein Problem, weil es ist, was die meisten Menschen erinnern, beim Umgang mit ein System. Und Miller sagte, gibt es Raum für eine bessere Personalisierung, denn wenn das System weiß, wer es ist, um zu sprechen, kann es zu besseren Ergebnissen führen. Zum Beispiel, bemerkte er, dass Facebook weiß, wer mit dem System, weil Sie eingeloggt ist; und sagte, dass nahtlos, dies zu tun mit mehr Mittel werden an Bedeutung gewinnen.
Es ist sicherlich eine faszinierende Kategorie, und ich erwarte, dass wir alle verbringen viel mehr Zeit im Gespräch, um unsere Telefone und Computer, und die Interaktion mit Agenten, die nicht ganz menschlich. Ich finde das eine der faszinierendsten Entwicklungen bei der Berechnung in diesen Tagen.

No comments:
Post a Comment