Spraakherkenningstechnologie: nuttig of pijnlijk?

Schrijver: Judy Howell
Datum Van Creatie: 28 Juli- 2021
Updatedatum: 1 Juli- 2024
Anonim
Smart House {funny commersial}
Video: Smart House {funny commersial}

Inhoud


Afhaal:

Interactie met gesprekselektronica wordt steeds gebruikelijker - en noodzakelijk. Maar tot nu toe zijn de resultaten beslist gemengd.

Heb je ooit een bedrijf gebeld om wat hulp te krijgen of je factuur te betalen, alleen om te worden begroet door een aangename opgenomen stem die een gesprek met je wil hebben - maar de helft van wat je zegt niet begrijpt? Of misschien heb je een iPhone, en terwijl Siri eerst een goede bondgenoot leek, ben je je gaan realiseren dat ze soms (OK, laten we eerlijk zijn, vaak) het gewoon niet begrijpt? Spraakherkenningstechnologie (VRT), ook bekend als speech-to-, komt in een gemeenschappelijke valkuil: het heeft het potentieel om ongelooflijk cool te zijn (en jongen, wortel schieten we ervoor), maar vaker, het is een tandenknarsende oefening in frustratie.

Ooit een idee dat thuishoorde in het domein van science fiction, is stemherkenning gegroeid vanaf de kinderschoenen in de jaren 1950, toen Bell Laboratories Audrey-systeem werd ontworpen om cijfers te herkennen die met één stem werden gesproken, tot het moderne netwerk van conversatie-elektronica waarmee we nu communiceren op een dagelijkse basis - met gemengde resultaten.

Druk op 0 om met een mens te spreken

Veel van de huidige bedrijven gebruiken nu systemen die interactieve spraakrespons (IVR) worden genoemd om klantenservice-oproepen af ​​te handelen. Het meest voorkomende gebruik is voor spraakgestuurde menu's, maar sommige bedrijven gebruiken IVR-systemen die toegang hebben tot klantaccountinformatie en kleine vragen kunnen beantwoorden. Menu IVR-software heeft meestal een beperkte vocabulaire, die mogelijk beperkt is tot "ja", "nee" en cijfers. Meer gecompliceerde systemen kunnen bedrijfsspecifieke woorden en zinnen herkennen.

Deze systemen worden steeds populairder - althans voor bedrijven - om een ​​eenvoudige reden: ze zijn kosteneffectief. Volgens een rapport van de Wall Street Journal uit 2010 kost een typisch klantgesprek dat een agent bereikt tussen $ 3 en $ 9, terwijl een gesprek dat via een geautomatiseerd systeem wordt afgehandeld slechts vijf tot zeven cent kost. En natuurlijk worden computerprogramma's niet moe, worden ze niet ziek of raken ze niet gefrustreerd bij klanten (hoewel klanten zeker gefrustreerd raken!).

Gelukkig betekent dit niet altijd dat IVR banen van mensen weghaalt - of in ieder geval dat alle mensen uit callcenters verdwijnen. Met deze spraakgestuurde helpers kunnen medewerkers van de menselijke klant productiever zijn door oproepen te leiden en eenvoudige vragen te beantwoorden.

Natuurlijk voor de menselijke gebruikers die met deze technologieën omgaan, is het niet altijd soepel zeilen. Technologie helpt bij het verbeteren van veelvoorkomende problemen in IVR-technologie, zoals problemen met accenten, maar het ontslaan van geautomatiseerde systemen is nog steeds een gemeenschappelijk thema online. Bekijk deze comedy-skit over een lift uitgerust met spraakherkenning, die de frustratie benadrukt die storingen in IVR-systemen kunnen veroorzaken.

Persoonlijke telefoon-apps: Siri, Google Now

De meeste mensen zijn bekend met spraakherkenning voor smartphones. Terwijl de meerderheid van de nieuwste telefoonmodellen met VR wordt geleverd, nam hun populariteit - en bekendheid - toe toen Apple Siri introduceerde, de mild sarcastische, spraakgestuurde 'persoonlijke assistent' voor de iPhone 4S in 2011. Google creëerde al snel een directe concurrent: Google Nu voor het Android Jelly Bean OS. Beide systemen hebben vrouwelijke stemmen en geavanceerde herkenningsfuncties waarmee gebruikers met hun telefoons kunnen "praten" in een informele taal.

Maar hoewel deze systemen aanzienlijk geavanceerder en functioneler zijn dan hun voorgangers, laten ze ook zien dat de technologie nog een lange weg te gaan heeft. Grappen over het falen van Siris zijn een populaire internetmeme geworden. Eén man klaagde zelfs Apple aan voor valse reclame over de mogelijkheden van Siris.

Misschien is dat de reden dat, hoewel Apple Siri heeft gemaakt om geavanceerd en informatief te zijn, de VR-software ook een beetje aan de pittige kant is. Als je bijvoorbeeld een van de meest beruchte intelligentietechnologielijnen uit de filmgeschiedenis uit de film '2001: A Space Odyssey' spreekt - 'open de deuren van de pod bay' - reageert Siri met de antwoordlijn uit de film, ' Het spijt me (uw naam), ik ben bang dat ik dat niet kan doen, 'of, meer sarcastisch,' wij inlichtingenagenten zullen dat blijkbaar nooit waarmaken. '

Je bij naam noemen is slechts een van de functies die Siri gemakkelijker te houden van liefde maakt, en een beetje menselijker. De VR-assistent kan spraakopdrachten volgen om te bellen, dicteren en ss uitvoeren, op internet zoeken naar informatie, winkels in de buurt zoeken, een routebeschrijving geven en meer, allemaal zonder iets aan te raken. Antwoorden worden tegelijkertijd door de telefoon uitgesproken en op het scherm weergegeven.

Google Now, het VR-gedeelte van het Android Jelly Bean-platform, lijkt sterk op Siri. Het systeem biedt dezelfde uitgebreide herkenningsmogelijkheden door informele spraak te vertalen in commando's waarmee gebruikers kunnen bellen, zoeken, berekeningen uitvoeren en conversies uitvoeren, woorddefinities pakken, alarmen instellen, liedjes spelen en kaarten en routebeschrijvingen krijgen.

Met persoonlijke stemassistenten zoals Siri en Google Now zijn de voordelen duidelijk. Alles van bellen en bellen tot zoeken en entertainment gaat sneller en eenvoudiger. Zeg gewoon wat je wilt en (meestal) grijpt de VR-app het voor je. De hands-off technologie van VR is vooral handig tijdens het rijden. En hoewel veel mensen Siris-fouten hebben ontkend, en schrijvers hebben aangevoerd dat de mogelijkheid van Google Nows om in wezen levens te leiden voor gebruikers beide een beetje beledigend is, vinden de meeste mensen nog steeds dat deze futuristische technologieën behoorlijk cool zijn.

Natuurlijk zijn apps voor persoonlijke telefoons zoals Siri en Google Now verre van perfect - hoewel ze laten zien waar deze technologie in de toekomst naartoe zou kunnen gaan. Dat betekent dat zelfs wanneer Siri een verkeerd antwoord opdeed, haar waarschijnlijk zouden lachen en vergeven, wetende dat de volgende versie veel beter zal zijn.

Waar VR platvalt

Als je ooit een IVR bent tegengekomen toen je een bedrijf riep, heb je misschien bepaalde barrières voor communicatie opgemerkt. Sommige programma's gebruiken een stem met spraak-naar-spraak die woorden verkeerd spreekt en dingen moeilijk te begrijpen maakt. Anderen hebben gevoeligheidsproblemen die ertoe leiden dat de software niet in staat is om te verwerken wat u zegt als u te luid, te zacht bent of niet zorgvuldig spreekt.

Bovendien voelen veel mensen zich nog steeds niet op hun gemak bij het praten met een machine. Als je een paar zoekopdrachten op IVR uitvoert, zul je lijsten tegenkomen die mensen hebben samengesteld om IVR-systemen te omzeilen en een 'echte persoon' te bereiken. Deze oplossingen variëren van "blijf op 0 drukken voor een operator" tot "vloeken op de machine totdat deze een mens ophaalt." Als gevolg hiervan is een groot deel van de recente ontwikkeling in IVR-systemen er omheen gegaan om ze voor mensen aangenamer te maken; waardoor de stemmen sympathieker en minder robotachtig zijn, waardoor het systeem gemakkelijker te navigeren is en bellers weten hoe lang het hele proces van begin tot einde zal duren. Dat suggereert dat de betere technologie hier slechts het halve werk is; de andere helft krijgt gebruikers aan boord om met een machine te praten.

Wat de toekomst in petto heeft

Ondanks deze uitdagingen wordt de technologie voor spraakherkenning steeds beter. Applicaties zoals Siri en Google Now - gebreken en dergelijke - zijn nog steeds buitengewoon indrukwekkend in hun prestaties, en verschillende bedrijven breiden VR-mogelijkheden uit naar andere applicaties.

Nuance, de makers van Dragon NaturallySpeaking speech-to-software, heeft bijvoorbeeld al spraakbesturing voor televisies en auto's ontwikkeld, en versies van deze technologie zijn opgenomen in sommige Samsung-tv's en de SYNC-entertainmentsystemen die in bepaalde Ford-voertuigen worden gebruikt.

En terwijl Google en Apple nieuwe toepassingen blijven vinden voor hun spraakherkenningstechnologieën, is het waarschijnlijk dat ze in toenemende mate praten met allerlei soorten dagelijkse machines, van onze televisies tot onze broodroosters. En nogmaals, het lijkt erop dat science fiction gelijk had. Nou, ik hoop maar dat die slimme schrijvers over één ding ongelijk hadden. Als deze machines het overnemen, kun je de volgende keer dat je Siri vraagt ​​'de deuren van de pod bay te openen' in veel problemen zitten.