Kuidas Tehisintellekt Töötab: Kõnetuvastus - Alternatiivne Vaade

Sisukord:

Kuidas Tehisintellekt Töötab: Kõnetuvastus - Alternatiivne Vaade
Kuidas Tehisintellekt Töötab: Kõnetuvastus - Alternatiivne Vaade

Video: Kuidas Tehisintellekt Töötab: Kõnetuvastus - Alternatiivne Vaade

Video: Kuidas Tehisintellekt Töötab: Kõnetuvastus - Alternatiivne Vaade
Video: planeTALK | Jörg BUXBAUM 1/2 "The minister of future skies" (Subtiitritega) 2024, September
Anonim

Igaüks meist seisab igapäevaelus silmitsi sellise salapärase nähtusega nagu tehisintellekt - just tema lubab hääleabilistel ja otsingumootoritel inimkõnet ära tunda ja kasutajate soove aimata. Täna räägime täpselt, kuidas see tehnoloogia on korraldatud ja millised väljavaated ootavad seda arenguruumi lähitulevikus.

Tehisintellekt on väga lai mõiste, mille raames on juba olemas palju algoritme, mis on väljatöötamisel ja on loodud mitmesuguste praktiliste ülesannete täitmiseks. Kuid milleks tänapäevased tehisintellekti programmid tegelikult võimelised on ja millistest põhimõtetest nad oma töö käigus juhinduvad? Täna räägime masinmõtte ühest põhijoonest, millega igaüks meist igapäevaselt regulaarselt kokku puutub - hääleabiassistentide võimest ära tunda inimkõnet.

Hääletuvastus

Hääle mõõtmiseks kasutab programm mitmeid heliparameetreid: helilaine sagedus ja pikkus teatud ajahetkel. Näiteks, kui vestlete populaarse hääleassistent Alexaga, jagab tarkvara teie hääle 25 millisekundi slaidideks ja teisendab seejärel kõik segmendid digitaalallkirjadeks. Pärast seda võrreldakse allkirjaplokke programmihelide sisemise kataloogiga, kuni vastete arv on piisavalt suur, et AI saaks tõlkida numbrid talle arusaadavas tähestikulises päringus.

Image
Image

Vaadake Siri või Google Assistant'i kasutamise ajal oma telefoni ekraani ja näete, et sõnade rääkimisel muutub sõnavara. See juhtub tänu sellele, et iga järgmise "sammuga" võrdleb tarkvara ka saadud tulemust sisemise andmebaasiga ja ehitab sõnu sõltuvalt vastest. Amazoni Alexa jaoskonna vanemteaduri Rohit Prasadi sõnul "õpib keelemudel teksti kujul palju miljardeid sõnu". Olulist rolli mängib ka sõnajärjekord: seda saab märgata tavalise Google'i otsingumootori abil, mis mõnikord annab identsete päringute jaoks erinevaid andmeid, milles ainult paar sõna on ümber korraldatud.

Reklaamvideo:

Kõnetuvastuse perspektiivid

Alan Black Carnegie keeletehnoloogia instituudist väidab, et kõigi suurettevõtete spetsialistide jaoks on kõige huvitavam leida oma süsteemi piir. "Kui saade ütleb:" Ma ei saa seda teha ", muutub olukord tõeliselt huvitavaks," naljatab ta. Kuid see on tõepoolest nii: ettearvamatute kasutajate taotlustele vastamine on isegi üks peamisi ülesandeid, mida Alexa auhinna nimel konkureerivad üliõpilasringid - ja see on koguni 2,5 miljonit dollarit - uurivad. Nende ülesanne on luua vestlusbot, mis on mõeldud suhtlemiseks inimestega, kes esitavad järjekindlaid ja sisukaid küsimusi. Sel juhul värskendatakse teavet iga 20 minuti järel. Kõlab isegi keskmise programmeerija jaoks üsna lihtsana,kuid praktikas seostub programmi suhtlemine päris inimestega alati dialoogi teemast kõrvalekaldumiste, spontaansete fraaside ja muude rikkumistega. Programm, mis õpib nendega koostööd tegema kui ka päris inimest, on tohutu läbimurre kogu AI-tööstusele.

Vassili Makarov

Soovitatav: