Keinotekoinen älykkyys On Oppinut Tunnistamaan Puheen Oikein Melun Keskuudessa - Vaihtoehtoinen Näkymä

Keinotekoinen älykkyys On Oppinut Tunnistamaan Puheen Oikein Melun Keskuudessa - Vaihtoehtoinen Näkymä
Keinotekoinen älykkyys On Oppinut Tunnistamaan Puheen Oikein Melun Keskuudessa - Vaihtoehtoinen Näkymä

Video: Keinotekoinen älykkyys On Oppinut Tunnistamaan Puheen Oikein Melun Keskuudessa - Vaihtoehtoinen Näkymä

Video: Keinotekoinen älykkyys On Oppinut Tunnistamaan Puheen Oikein Melun Keskuudessa - Vaihtoehtoinen Näkymä
Video: 7 MERKKIÄ ETTÄ OLET ÄLYKÄS! 2024, Saattaa
Anonim

Virtuaaliassistentit ja äänentunnistusjärjestelmät ovat oppineet “tunnistamaan” ihmisen sanoman ja seuraamaan hänen käskyjään. Mutta saman Siri- ja Cortanan oikean toiminnan kannalta vieraat kohinat voivat olla suuri ongelma. Mitsubishi Electricin asiantuntijat voivat auttaa selviämään tästä teknisestä virheestä, joka esitteli uuden tekniikan yhden henkilön puheen erottamiseksi yleisestä melusta.

Japanilaisen yrityksen tekniikka on nimeltään Deep Clustering, jonka toiminta perustuu koneoppimisen periaatteisiin. Ensinnäkin tekoäly oppi erottamaan itsenäisesti yhden henkilön puheen erilaisten äänien ja melujen yleisestä virrasta. Neuraaliverkko erottaa tulevan äänidatan eri elementteihin ja analysoi kumpikin erikseen, minkä jälkeen se voi jo käsitellä ihmisen ääntä. Samanlainen työ havaitaan, kun kaksi tai useampi keskustelukumppani on “kytketty”.

Japanilaisen yrityksen tekniikan esittelyn aikana järjestelmä pystyi erottamaan onnistuneesti kahden saman lauseen eri kielillä puhuvien ihmisten puheen yhdeksi mikrofoniksi. Kaikki käsittely suoritettiin reaaliajassa, ja viive ei ylittänyt kolme sekuntia. Tunnistustarkkuus oli 90 prosenttia, ja kun kolme ihmistä alkoi puhua mikrofoniin, osumien prosenttiosuus laski 80: seen, mikä on myös hyvä tulos. Projektin kirjoittajien Anthony Vetron ja Yohei Okaton mukaan

”Toisin kuin puheen ja taustamelujen erottamisessa, yhden henkilön puheen erottaminen samanaikaisesti puhuvien ihmisten” ääniäänistä”on erittäin vaikea tehtävä, koska eri ihmisten äänillä on paljon ominaispiirteitä. Useimmissa järjestelmissä äänen erotteluongelma ratkaistaan asentamalla kaksi tai useampi mikrofoni, mutta kun käytetään vain yhtä mikrofonia, vain keinotekoinen äly pystyy selviytymään äänen erottelutehtävästä. Tätä tekniikkaa voidaan käyttää aina, kun vaaditaan puheviestin tunnistuksen korkea tarkkuus. Esimerkiksi autojen, hissien, kotitalouksien ja muiden elektronisten laitteiden ääniohjausjärjestelmissä."

VLADIMIR KUZNETSOV