Tiedät Heti, Että Tämä On Pornoa. Ymmärtääkö Tietokone? - Vaihtoehtoinen Näkymä

Sisällysluettelo:

Tiedät Heti, Että Tämä On Pornoa. Ymmärtääkö Tietokone? - Vaihtoehtoinen Näkymä
Tiedät Heti, Että Tämä On Pornoa. Ymmärtääkö Tietokone? - Vaihtoehtoinen Näkymä

Video: Tiedät Heti, Että Tämä On Pornoa. Ymmärtääkö Tietokone? - Vaihtoehtoinen Näkymä

Video: Tiedät Heti, Että Tämä On Pornoa. Ymmärtääkö Tietokone? - Vaihtoehtoinen Näkymä
Video: SCP-093 Punaisenmeren Object (Kaikki testit ja uusiomateriaalien Lokit) 2024, Saattaa
Anonim

Tumblr ilmoitti viime kuun alussa kieltävänsä pornoa. Kun uusi sisältökäytäntö tuli voimaan, noin kaksi viikkoa myöhemmin - 17. joulukuuta - kävi ilmi, että ongelmia tulee olemaan. Saatuaan käyttöön keinotekoisen älykkyysjärjestelmän, jonka piti kieltää kaikki pornografia sivustolla, se merkitsi virheellisesti viattomia viestejä sivuston 455,4 miljoonaan blogiin 168,2 miljardin viestin joukosta: maljakot, noidat, kalat ja kaikki tämä jazz.

Pornografia tekoälylle

Vaikka on epäselvää, mitä automaattista suodatinta Tumblr käytti tai loi oman - yritys ei vastannut aihepiireihin -, on selvää, että sosiaalinen verkosto on juuttunut oman politiikan ja tekniikan väliin. Esimerkiksi sivuston epäjohdonmukainen asenne "nänniä näyttävissä naisissa" ja esimerkiksi taiteellisessa alastomuudessa on johtanut asiayhteyteen liittyviin päätöksiin, jotka osoittavat, että jopa Tumblr ei tiedä mitä kieltää sen alusta. Kuinka usein toimiva yritys voi päättää, mitä se pitää säädytöntä?

Ensinnäkin vaarallisen sisällön estäminen on vaikeaa, koska on vaikea määritellä, mikä se on alusta alkaen. Säädyllisyyden määritelmä on yli sata vuotta vanha karhunloukku, jo vuonna 1896 Yhdysvallat antoi ensin säädöksiä sääteleviä lakeja. Vuonna 1964, asiassa Jacobellis v. Ohio, korkein oikeus julisti, voiko Ohio kieltää Louis Mallen elokuvan näytöksen, mikä on nykyään todennäköisesti tunnetuin hardcore-pornografian määritelmä: Kuten ymmärrän, se sisällytetään sanatarkkaan kuvaukseen; enkä koskaan voi tehdä siitä ymmärrettävää”, sanoi tuomari Potter Stewart. "Mutta tiedän, mitä se on, kun näen sen, eikä tässä tapaukseen liittyvä elokuva ole."

Koneoppimisalgoritmeilla on sama ongelma. Juuri tämä on ongelma, jota Brian Delorge, erikoistuneen tekoälyn tekniikkaa myyvän yrityksen Picnixin toimitusjohtaja yrittää ratkaista. Yksi heidän tuotteistaan, Iris, on asiakaspuolen sovellus pornografian havaitsemiseksi "ihmisten auttamiseksi", kuten Delorge sanoo, "jotka eivät halua pornoa elämässään". Hän huomauttaa, että pornon erityinen ongelma on, että se voi olla mikä tahansa, joukko erilaisia asioita - ja muilla kuin pornografisilla kuvilla voi olla samanlaisia elementtejä. Rantajuhlakuva voidaan estää ei siksi, että siinä on enemmän ihoa kuin toimistovalokuva, vaan siksi, että se on reunalla. "Siksi on erittäin vaikeaa kouluttaa kuvan tunnistusalgoritmia tekemään kaikki kerralla", DeLorge sanoo."Kun määritelmä tulee vaikeaksi ihmisille, myös tietokoneella on vaikeuksia." Jos ihmiset eivät pääse sopimukseen siitä, mikä porno on ja mikä ei, voiko tietokone jopa toivoa tietävän eron?

Jotta opettaa AI havaitsemaan porno, sinun on ensin tehtävä se pornoa. Paljon pornografiaa. Mistä saan sen? No, ensimmäinen asia, jonka ihmiset tekevät, on ladata joukko videota Pornhubista, XVideos, sanoo Dan Shapiro, Lemay.ai: n perustaja, perustaja, joka luo AI-suodattimia asiakkailleen. "Tämä on yksi niistä oikeudellisen luonteen harmaista alueista - jos esimerkiksi opit muiden ihmisten sisällöstä, kuuluuko se sinulle?"

Kun ohjelmoijat ovat ladanneet tonnia pornoa, he leikkaavat videosta ei-pornografisia materiaaleja varmistaakseen, että käytetyt materiaalit eivät estä pizzan toimittajia. Järjestelmät maksavat ihmisille, enimmäkseen Yhdysvaltojen ulkopuolella, merkinnän tällaiselle sisällölle; työ on vähän palkattua ja tylsää, kuten captchaan pääsy. He vain istuvat ja huomauttavat: tämä on porno, tämä on tämä. Sinun on suodatettava vähän, koska kaikessa pornossa on etiketti. Oppiminen on parempi, jos et käytä pelkästään valokuvia, mutta suuria tietonäytteitä.

Mainosvideo:

"Usein sinun ei tarvitse vain suodattaa pornoa, vaan pikemminkin mukana olevaa materiaalia", Shapiro sanoo. "Kuten vääriä profiileja tytön valokuvan ja puhelimen kanssa." Hän viittaa seksityöntekijöihin, jotka etsivät asiakkaita, mutta se voi olla mitä tahansa, mikä ei ole täysin laillista. "Tämä ei ole pornoa, mutta tämä on sellainen asia, jota et halua katsella laiturillasi, eikö?" Hyvä automatisoitu moderaattori oppii miljoonista - ellei kymmenistä miljoonista - näytesisältöä, mikä voi säästää tonnia työtunteja.

"Voit verrata tätä lapsen ja aikuisen eroon", sanoo Matt Zeiler, Clarifai-yhtiön toimitusjohtaja ja perustaja. Tietokoneen näkemyksen käynnistävä yritys, joka tekee tällaisen kuvan suodattamisen yritysasiakkaille.”Voin kertoa sinulle varmasti - pari kuukautta sitten meillä oli vauva. He eivät tiedä mitään maailmasta, heille kaikki on uutta. " Sinun on näytettävä lapselle (algoritmi) paljon asioita, jotta hän ymmärtää jotain. Miljoonat ja miljoonat esimerkit. Mutta aikuisena - kun olemme luoneet niin paljon kontekstia maailmasta ja ymmärtäneet sen toiminnan - voimme oppia jotain uutta muutamasta esimerkistä. " (Kyllä, AI: n opettaminen aikuisten sisällön suodattamiseksi on kuin näyttää lapselle paljon pornoa.) Clarifai-kaltaiset yritykset kasvavat nopeasti. Heillä on hyvä tietokanta maailmasta, he osaavat kertoa kissojen koirista, pukeutuneita alasti. Zeiler-yritys käyttää mallejaan kouluttaakseen uusia algoritmeja asiakkailleen - koska alkuperäinen malli käsitteli paljon tietoa, henkilökohtaiset versiot vaativat vain uusia tietojoukkoja toimimaan.

Algoritmin on kuitenkin vaikea saada sitä oikein. Se menee hyvin sisällölle, joka on selvästi pornografista; mutta luokittelulaite saattaa merkitä alusvaatteen virheellisesti raja-arvoon, koska kuvassa on enemmän nahkaa kuin esimerkiksi toimistossa. (Bikinien ja alusvaatteiden kanssa Zeilerin mukaan se on erittäin vaikeaa). Tämä tarkoittaa, että markkinoijien tulisi keskittyä työssään näihin reunatapauksiin ja asettaa etusijalle vaikeasti luokiteltavat mallit.

Mikä on vaikein osa?

"Anime porno", Zeiler sanoo. "Alastomuusilmaisimen ensimmäinen versio ei käyttänyt sarjakuvapornografiaa koulutukseen." Monta kertaa AI sai sen väärin, koska se ei tunnistanut hentaa. "Sen jälkeen kun olemme työskennelleet tämän puolesta asiakkaalle, injektoimme paljon hänen tietoja malliin ja paransimme merkittävästi sarjakuvasuodattimen tarkkuutta säilyttäen samalla oikeiden valokuvien tarkkuuden", Zeiler sanoo.

Pornon nuuskaamiseksi opetettu tekniikka voidaan käyttää myös muihin asioihin. Tämän järjestelmän takana olevat tekniikat ovat erittäin joustavia. Tämä on enemmän kuin anime-rinnat. Esimerkiksi Aakkosen palapeliä käytetään laajalti sanomalehden automaattisena kommenttien moderaattorina. Tämä ohjelmisto toimii samalla tavalla kuin kuvan luokittelijat, paitsi että se lajitellaan myrkyllisyyden eikä alastomuuden perusteella. (Myrkyllisyys tekstikommentteissa on yhtä vaikea määrittää kuin pornografia kuvissa.) Facebook käyttää tällaista automaattista suodatusta itsemurhaviestien ja terrorismiin liittyvän sisällön havaitsemiseen ja on yrittänyt käyttää tätä tekniikkaa väärennösten havaitsemiseksi massiivisella alustallaan.

Kaikki tämä riippuu edelleen ihmisen valvonnasta; pystymme käsittelemään paremmin epäselvyyttä ja epäselvää asiayhteyttä. Zeiler sanoo, että hänen mielestään tuotteensa ei ole ottanut kenenkään työtä. Se ratkaisee Internet-skaalauksen ongelman. Ihmiset kouluttavat edelleen AI: tä lajittelemalla ja merkitsemällä sisältöä, jotta AI voi erottaa sen.

Tämä on maltillisuuden tulevaisuus: räätälöityjä avaimet käteen -ratkaisuja, joita tarjotaan yrityksille, jotka harjoittavat koko liiketoimintaansa opettamalla yhä kehittyneemmille luokkijoille enemmän tietoa. Aivan kuten Stripe ja Square tarjoavat valmiita maksuratkaisuja yrityksille, jotka eivät halua käsitellä niitä itse, myös sellaiset startupit, kuten Clarifai, Picnix ja Lemay.ai, tekevät online-moderointia.

Dan Shapiro Lemay.ai: sta on toiveikas.”Kuten minkä tahansa tekniikankin kanssa, sitä keksitään edelleen. Joten en usko, että annamme periksi, jos epäonnistumme. " Mutta pystyykö AI koskaan toimimaan itsenäisesti ilman ihmisen valvontaa? Epäselvä. "Snuff-laatikossa ei ole pieniä miehiä, jotka suodattavat jokaisen laukauksen", hän sanoo. "Sinun on saatava tietoja kaikkialta, jotta siihen voidaan kouluttaa algoritmi."

Zeiler puolestaan uskoo, että tekoäly mallii jonain päivänä kaiken yksinään. Loppujen lopuksi ihmisten väliintulot vähennetään nollaan tai vähän vaivaa. Vähitellen ihmisen ponnistelut muuttuvat asteiksi, joita AI ei voi tehdä nyt, kuten korkean tason päättely, itsetuntemus - kaikkea, mikä ihmisillä on.

Pornografian tunnustaminen on osa sitä. Tunnistaminen on suhteellisen triviaali tehtävä ihmisille, mutta on paljon vaikeampaa kouluttaa algoritmi tunnistamaan vivahteita. Kynnyksen määrittäminen, kun suodatin merkitsee kuvan pornografiseksi tai ei-pornografiseksi, on myös vaikea tehtävä, osittain matemaattinen.

Tekoäly on epätäydellinen peili siitä, kuinka näemme maailman, aivan kuten pornografia on heijastus siitä, mitä tapahtuu ihmisten välillä, kun he ovat yksin. Siinä on totuutta, mutta ei ole kokonaiskuvaa.

Ilja Khel