Hangfelismerő technológia: Hasznos vagy fájdalmas?

Szerző: Judy Howell
A Teremtés Dátuma: 28 Július 2021
Frissítés Dátuma: 11 Lehet 2024
Anonim
Hangfelismerő technológia: Hasznos vagy fájdalmas? - Technológia
Hangfelismerő technológia: Hasznos vagy fájdalmas? - Technológia

Tartalom


Elvitel:

A beszélgető elektronikával való interakció egyre gyakoribb - és szükséges. De eddig az eredmények határozottan vegyesek.

Hívtál már egy társaságot segítségért vagy a számla kifizetéséhez, csak hogy egy kellemes rögzített hang üdvözölje, aki beszélgetni akar veled - de nem tudja megérteni, amit mond? Vagy talán van egy iPhoneod, és bár Siri először jó szövetségesnek tűnt, rájöttél, hogy néha (rendben, őszinte legyek, gyakran) csak nem kapja meg? A beszéd-felismerő technológia (VRT), más néven beszéd-beszéd néven is ismert, csapdába esik: valószínűleg hihetetlenül hűvös (és fiú, mi gyökerezzük rá), de gyakoribb, mint egy fogmosó gyakorlat. frusztráltan.

Egyszerûen a tudományos fantasztikus világ körébe tartozó ötlet, a hangfelismerés az 1950-es évek elején kezdõdik, amikor a Bell Laboratories Audrey rendszert úgy tervezték, hogy felismerje az egyetlen hangon beszélt számjegyeket, a modern beszélgetõ elektronika hálózatához, amellyel most kapcsolatba lépünk. naponta - vegyes eredményekkel.

Ha beszélni szeretne egy emberrel, kérjük, nyomja meg a 0 gombot

A mai vállalkozások nagy része ma az interaktív hangos válasz (IVR) rendszerrel kezeli az ügyfélszolgálati hívásokat. A leggyakoribb a hanggal navigált menük használata, de egyes vállalatok IVR rendszereket használnak, amelyek hozzáférhetnek az ügyfélszámlához és válaszolnak kisebb kérdésekre. A Menü IVR szoftvernek általában korlátozott szókincse van, amely korlátozható "igen", "nem" és számokra. A bonyolultabb rendszerek felismerik a vállalat-specifikus szavakat és kifejezéseket.

Ezek a rendszerek - legalábbis a vállalkozások számára - egyre népszerűbbé válnak egyszerű okból: költséghatékonyak. A Wall Street Journal 2010. évi jelentése szerint egy tipikus ügyfélhívás, amely megkapja az ügynököt, 3 és 9 dollár között mozog, míg az automatizált rendszeren keresztül kezelt hívás csak öt-hét centet fizet. És természetesen, a számítógépes programok nem fáradnak el, betegbe nem lépnek, és nem fognak csalódni az ügyfelekkel (bár az ügyfelek minden bizonnyal csalódnak velük!).

Szerencsére ez nem mindig azt jelenti, hogy az IVR elvonja a munkahelyeket az emberektől - vagy legalábbis azt, hogy minden ember eltűnik a telefonos ügyfélközpontokból. Ezek a hanggal aktiválható segítők lehetővé teszik az emberi ügyfélszolgálat képviselőinek hatékonyabb működését hívások irányításával és egyszerű kérdések megválaszolásával.

Természetesen az emberi felhasználók számára, akik ezekkel a technológiákkal működnek együtt, a technológia nem mindig zavartalan. A technológia elősegíti az IVR technológiában felmerülő általános problémák, például az ékezetes problémák megoldását, ám az automatizált rendszerek kicsomagolása továbbra is gyakori téma az interneten. Nézze meg ezt a vígjátékot egy hangfelismeréssel felszerelt lifttel kapcsolatban, amely kiemeli a frusztrációt, amelyet az IVR rendszerek hibás működése okozhat.

Személyes telefonos alkalmazások: Siri, Google Now

A legtöbb ember ismeri az okostelefonok hangfelismerését. Miközben a legújabb telefonmodellek nagy része a VR-vel érkezik, népszerűsége és hírhedtsége megduzzadt, amikor az Apple 2011-ben bemutatta a Siri-t, az iPhone 4S enyhén szarkasztikus, hanggal aktiválható „személyes asszisztense”. A Google hamarosan közvetlen versenytársat hozott létre: a Google Most az Android Jelly Bean operációs rendszerre. Mindkét rendszer női hangokkal és kifinomult felismerési funkciókkal rendelkezik, amelyek lehetővé teszik a felhasználók számára, hogy alkalmi nyelven "beszéljen" a telefonjukkal.

De bár ezek a rendszerek sokkal kifinomultabb és funkcionálisabbak, mint elődeik, megmutatják, hogy a technológiának még hosszú utat kell megtenni. A Siris kudarcáról szóló viccek népszerű internetes mémévé váltak. Az egyik ember az Apple ellen is beperelte a Siris képességeivel kapcsolatos hamis reklámozást.

Lehet, hogy miért, miközben az Apple fejlesztette és informatívá tette a Siri-t, a VR szoftver szintén egy kissé pimasz oldalán van. Például, ha a mozitörténet egyik leghírhedtebb intelligencia-technológiai vonalát mondja az 1968-as "2001: A Space Odyssey" című filmből - "nyissa ki a pod öböl ajtajait" - Siri vagy a film válaszadó vonalával reagál " Sajnálom (neved), attól tartok, hogy ezt nem tudom megtenni, "vagy annál szarkasztikusabb," mi hírszerző ügynökök nyilvánvalóan soha nem éljük le ezt. "

A név szerinti hívás csak egyike azon funkcióknak, amelyek megkönnyítik a Siri szeretését és egy kicsit emberiesbbé válását. A VR asszisztens hangutasításokat követhet hívások kezdeményezéséhez, diktálásokhoz és s-ek fogadásához, információkereséshez interneten, közeli üzletek keresésében, vezetési útmutatások megadásában és még sok másban, anélkül, hogy bármit meg kellene érintnie. A válaszokat egyszerre a telefon mondja ki, és megjelenik a képernyőn.

A Google Now, az Android Jelly Bean platform VR része nagyon hasonlít a Siri-hez. A rendszer ugyanazokat a széles körű felismerési képességeket kínálja, amikor az alkalmi beszédeket olyan parancsokká fordítja, amelyek lehetővé teszik a felhasználók számára, hogy hívásokat kezdeményezzenek, s kereséseket végezzenek, számításokat és konverziókat készítsenek, megragadja a szódefiníciókat, állítson be riasztásokat, játsszon dalokat, és térképeket és irányokat kapjon.

Személyes hangsegédjeivel, mint például a Siri és a Google Now, az előnyök nyilvánvalóak. A hívástól kezdve a kereséstől és a szórakoztatástól kezdve minden gyorsabb és könnyebb. Csak mondja el, amit akar, és (általában) a VR alkalmazás megragadja az Ön számára. A VR ki- és bekapcsolási technológiája vezetés közben különösen hasznos. És bár sokan elutasították a Siris hibáit, és az írók azt állították, hogy a Google Nows azon képessége, hogy alapvetően a felhasználók életét vezessen, kissé kísérteties, kissé sértő, a legtöbb ember továbbra is úgy érzi, hogy ezek a futurisztikus technológiák nagyon menőek.

Természetesen a személyes telefonos alkalmazások, például a Siri és a Google Now, messze nem tökéletesek - bár megmutatják, hogy a jövőben milyen irányba vezetheti ezt a technológiát. Ez azt jelenti, hogy még akkor is, amikor Siri rossz választ ad, valószínűleg nevetett és megbocsátott neki, tudva, hogy a következő verzió sokkal jobb lesz.

Ahol a VR esik

Ha valaha is találkozott egy IVR-vel, amikor vállalkozást hívott, akkor valószínűleg észrevette a kommunikáció bizonyos akadályait. Egyes programok olyan robotot használnak a beszédhez, amely helytelenül mondja ki a szavakat, és megnehezíti a dolgok megértését. Másoknak érzékenységi problémái vannak, amelyek miatt a szoftver nem képes feldolgozni azt, amit mond, ha túl hangos, túl puha vagy nem figyelmesen szórakozik.

Ezen túlmenően sok ember még mindig nem érzi magát kényelmesen egy gépen beszélgetni. Ha néhány keresést hajt végre az IVR-n, akkor találkozási listákat készít az emberek arról, hogy hogyan lehet megkerülni az IVR-rendszereket és elérni egy "valódi személyt". Ez a megoldás a "folyamatosan nyomja meg a 0-ot az operátor számára" és "esküszjön a gépre mindaddig, amíg az ember nem fog kinyúlni". Ennek eredményeként az IVR rendszerekben a közelmúltban kifejlesztett események nagy része annak köszönhető, hogy az emberek számára ízletesebbé váljanak; a hangok szimpatikusabbá és kevésbé robotikussá teszik, megkönnyítik a rendszer navigálását, és tudatják a hívókat, hogy mennyi ideig tart az egész az elejétől a végéig. Ez azt sugallja, hogy a jobb technológia itt csak a harc fele; a másik fél arra készteti a felhasználókat, hogy beszéljenek egy gépen.

Mit tartogat a jövő

E kihívások ellenére a hangfelismerő technológia folyamatosan fejlődik. Az olyan alkalmazások, mint a Siri és a Google Now - a hibák és az összes - továbbra is rendkívül lenyűgöző teljesítményű, és számos vállalat kibővíti a VR képességeit más alkalmazásokra.

Például a Nuance, a Dragon NaturallySpeaking beszédeszoftver alkotói már kifejlesztették a hangvezérlőket a televíziókhoz és az autókhoz, és ennek a technológiának a verziói beépültek néhány Samsung televízióba és a SYNC szórakoztató rendszerekbe, amelyeket bizonyos Ford járművekben használnak.

És mivel a Google és az Apple továbbra is új felhasználási lehetőségeket talál fel hangfelismerő technológiáikra, valószínű, hogy egyre inkább mindenféle mindennapi géppel beszélgetnek, a televízióktól a kenyérpirítóinkig. És ismét úgy tűnik, hogy a tudományos fantasztikusnak igaza volt. Nos, csak azt kell remélni, hogy az okos írók tévedtek egy dologban. Ha ezeket a gépeket átveszik, akkor sok bajban lehet, amikor legközelebb megkérdezi Siri-t, hogy "nyissa ki a hüvelyek ajtaját".