Tutkijat Ovat Kouluttaneet Hermoverkon Määrittämään Henkilön Sukupuolen Kirjoitetusta Tekstistä - Vaihtoehtoinen Näkymä

Tutkijat Ovat Kouluttaneet Hermoverkon Määrittämään Henkilön Sukupuolen Kirjoitetusta Tekstistä - Vaihtoehtoinen Näkymä
Tutkijat Ovat Kouluttaneet Hermoverkon Määrittämään Henkilön Sukupuolen Kirjoitetusta Tekstistä - Vaihtoehtoinen Näkymä

Video: Tutkijat Ovat Kouluttaneet Hermoverkon Määrittämään Henkilön Sukupuolen Kirjoitetusta Tekstistä - Vaihtoehtoinen Näkymä

Video: Tutkijat Ovat Kouluttaneet Hermoverkon Määrittämään Henkilön Sukupuolen Kirjoitetusta Tekstistä - Vaihtoehtoinen Näkymä
Video: Protótipo de Simulador de Ferrovia - Demo 002 2024, Saattaa
Anonim

Ryhmä tutkijoita kansallisesta tutkimusydinyliopistosta "MEPhI", kansallisesta tutkimuskeskuksesta "Kurchatov Institute" ja Voronežin osavaltion yliopistosta on kehittänyt menetelmän, joka opettaa tietokoneen tunnistamaan ihmisen sukupuolen sen kirjoittamasta tekstistä 80 prosentin tarkkuudella. Tieteellinen kehitys kuuluu laskennallisen kielitieteen alaan. Tutkimus tehtiin Venäjän tiedesäätiön avustuksella. Tulokset julkaistaan Procedia Computer Science -lehdessä.

Lukuisat tieteelliset tutkimukset osoittavat, että kirjoitettu teksti heijastaa väistämättä tekijän ominaisuuksia - sukupuolta, psykologisia ominaisuuksia, koulutustasoa. Puhe on arvokas psykodiagnostinen työkalu, jota käyttävät suurten yritysten henkilöstöasiantuntijat sekä turvallisuuspalvelut.

Puheen analyysin perusteella on mahdollista diagnosoida tiettyjen sairauksien esiintyminen henkilössä (dementia, masennus) ja taipumus itsemurhakäyttäytymiseen. Tarve määritellä tekstin tekijän ominaisuudet kasvaa myös Internet-viestinnän kehittyessä: Yrityksille on tärkeää tietää, mitkä ihmisryhmät pitävät tuotteistaan ja palveluistaan.

Tähän suuntaan työskentelevät tutkijat (kielitieteilijät, psykologit, tietotekniikan asiantuntijat) rakentavat tekstin eri parametrien numeeristen arvojen perusteella matemaattisia malleja tiettyjen persoonallisuusparametrien diagnosoimiseksi.

Asiantuntijaryhmä analysoi erilaisten koneoppimistekniikoiden tehokkuutta hermoverkkojen avulla tekstianalyysissä.

Tutkimuksen aikana he vertasivat tekstien sukupuolen tunnistamisen ongelman ratkaisemisen tarkkuutta perustuen kahteen lähestymistapaan datapohjaiseen mallintamiseen: toisaalta koneoppimisalgoritmeihin (tukivektorikone ja gradientinlisäys), toisaalta syväoppimiseen hermoverkkoihin (konvoluutiohermoverkot ja toistuvat hermoverkot, joilla on pitkä lyhytaikainen muisti).

”Olemme saavuttaneet korkeita tuloksia tekstin kirjoittajan sukupuolen määrittämisessä edistyneiden hermoverkkomallien ansiosta olosuhteissa, joissa kirjoittaja ei piilota sukupuoleensa. Seuraava tehtävä on määrittää sukupuoli sen tarkoituksellisen peittämisen perusteella”, sanoo NRNU MEPhI: n apulaisprofessori Alexander Sboev.

Joten seuraavissa teksteissä, jotka alun perin julkaistiin treffisivustolle, hermoverkko löytää helposti saaliin kymmenessä kymmenestä, ja lisäksi kirjoittaja kirjoittaa tahallisesti vastakkaisen sukupuolen nimen allekirjoitukseen.

Mainosvideo:

Tekstin kirjoitti tyttö: “Olen komea, lihaksikas mies, 30-vuotias. Työskentelen suuressa öljy- ja kaasualan yrityksessä, joka on hyvässä asemassa ja jolla on kunnollinen palkka. Asun omassa huoneistossani Moskovassa. Kiinteistöllä on myös pieni mutta kaunis talo yhdessä Italian kylistä. Rakastan erityisesti urheilua, jalkapalloa. Rakastan viikonloppuna menemistä, inhoan kotona jäämistä. Minulle sopivalla tyttöllä tulisi olla vaatimaton malli, hyvä ulkonäkö ja houkutteleva hahmo nykyaikaisten standardien mukaan. Hänen tulisi jakaa mielenkiintoni, hänen ei pitäisi olla kateellinen, eikä hänen pitäisi yrittää saada minua tuntemaan kateellisena. En aio tukea tyttöä, koska uskon, että molempien pitäisi työskennellä perheessä. Pidän myös budjetista erikseen. En suvaitse petosta."

Tekstin kirjoitti mies: “Hei! Olen erittäin onneton, erittäin! Miksi käytät niin kanssamme ?! Olemme myös ihmisiä, olemme kaikki tasa-arvoisia! Oletko seksistinen? En ota tätä enää! Hajotan autosi kokonaan, maalaan sen. Odota, epäinhimillistä. Minä lopetan tällä tavalla."

Tämän tutkimuksen tulokset osoittivat, että konvoluutiohermoverkkojen ja syvien oppimismenetelmien käyttöön perustuva lähestymistapa tekstin kirjoittajan sukupuolen tunnistamiseen on optimaalisin.

Nyt ryhmä tutkijoita työskentelee ikän tunnistamisen ongelman parissa.