Miten Tekoäly Toimii: Puheentunnistus - Vaihtoehtoinen Näkymä

Sisällysluettelo:

Miten Tekoäly Toimii: Puheentunnistus - Vaihtoehtoinen Näkymä
Miten Tekoäly Toimii: Puheentunnistus - Vaihtoehtoinen Näkymä

Video: Miten Tekoäly Toimii: Puheentunnistus - Vaihtoehtoinen Näkymä

Video: Miten Tekoäly Toimii: Puheentunnistus - Vaihtoehtoinen Näkymä
Video: Tekoäly terveydenhuollossa - Konkreettisia esimerkkejä ja tulevaisuuden näkymät 2024, Syyskuu
Anonim

Jokainen meistä on jokapäiväisessä elämässään kohtaamassa sellaisen salaperäisen ilmiön kuin keinotekoinen äly - juuri hän antaa puheapulaisten ja hakukoneiden tunnistaa ihmisten puheen ja arvata käyttäjien toiveet. Tänään puhumme tarkalleen kuinka tämä tekniikka on järjestetty ja mitkä näkymät odottavat tätä kehitysaluetta lähitulevaisuudessa.

Keinotekoinen äly on erittäin laaja termi, jonka puitteissa on jo olemassa monia algoritmeja, joita kehitetään edelleen ja jotka on suunniteltu suorittamaan monenlaisia käytännön tehtäviä. Mutta mihin nykyaikaiset tekoälyohjelmat tosiasiallisesti kykenevät, ja mitä periaatteita ne ohjaavat työssään? Tänään puhumme yhdestä koneen mielen keskeisistä piirteistä, joita jokainen meistä kohtaa säännöllisesti jokapäiväisessä elämässä - ääniapisten kyvystä tunnistaa ihmisen puhe.

Äänentunnistus

Äänen mittaamiseksi ohjelma käyttää useita ääniparametreja: ääniaallon taajuus ja pituus tietyssä ajankohdassa. Esimerkiksi, kun keskustelet suositun ääniassistentin Alexan kanssa, ohjelmisto jakaa äänesi 25 millisekunnin dioiksi ja muuntaa sitten jokaisen segmentin digitaaliseksi allekirjoitukseksi. Sen jälkeen allekirjoituslohkoja verrataan ohjelman äänien sisäiseen luetteloon, kunnes vastaavuuksien määrä on riittävän suuri, jotta AI voi "kääntää" numerot ymmärtäänsä aakkoselliseen kyselyyn.

Image
Image

Katso puhelimesi näyttöä käyttäessäsi Siriä tai Google Assistantia ja huomaat, että sanasto muuttuu, kun puhut sanoja. Tämä johtuu siitä, että jokaisen seuraavan "vaiheen" kanssa ohjelmisto vertaa myös saatua tulosta sisäiseen tietokantaan ja rakentaa sanoja otteluista riippuen. Amazonin Alexa-divisioonan päätutkijan Rohit Prasadin mukaan "kielimalli oppii useita miljardeja sanoja tekstin muodossa". Sanajärjestyksellä on myös tärkeä rooli: tämä voidaan havaita tavallisen Google-hakukoneen avulla, joka antaa joskus erilaisia tietoja identtisille kyselyille, joissa vain pari sanaa järjestetään uudelleen.

Mainosvideo:

Puheentunnistuksen näkökulmat

Alan Black Carnegie-kielitekniikan instituutista väittää, että kaikille suurten yritysten ammattilaisille mielenkiintoisinta on löytää oman järjestelmän rajat. "Kun ohjelmassa sanotaan:" En voi tehdä tätä ", tilanteesta tulee todella mielenkiintoinen", hän vitsailee. Tämä on kuitenkin totta: ennakoimattomien käyttäjien pyyntöihin vastaaminen on jopa yksi päätehtävistä, joita Alexa-palkinnosta kilpailevat opiskelijapiirit - ja tämä on jopa 2,5 miljoonaa dollaria - tutkivat. Heidän tehtävänsä on luoda chatbot, joka on suunniteltu kommunikoimaan ihmisten kanssa, jotka kysyvät johdonmukaisia ja merkityksellisiä kysymyksiä. Tietoja päivitetään tässä tapauksessa 20 minuutin välein. Kuulostaa melko helppolta tehtävältä myös tavalliselle ohjelmoijalle,mutta käytännössä ohjelman kommunikointi oikeiden ihmisten kanssa liittyy aina poikkeamisiin vuoropuhelun aiheesta, spontaaneihin lauseisiin ja muihin rikkomuksiin. Ohjelma, joka oppii työskentelemään heidän kanssaan sekä todellisena ihmisenä, on valtava läpimurto koko AI-teollisuudelle.

Vasily Makarov