Kuinka Voynichin Käsikirjoitussalaisuudet Paljastetaan: Tutkimus - Vaihtoehtoinen Näkymä

Sisällysluettelo:

Kuinka Voynichin Käsikirjoitussalaisuudet Paljastetaan: Tutkimus - Vaihtoehtoinen Näkymä
Kuinka Voynichin Käsikirjoitussalaisuudet Paljastetaan: Tutkimus - Vaihtoehtoinen Näkymä

Video: Kuinka Voynichin Käsikirjoitussalaisuudet Paljastetaan: Tutkimus - Vaihtoehtoinen Näkymä

Video: Kuinka Voynichin Käsikirjoitussalaisuudet Paljastetaan: Tutkimus - Vaihtoehtoinen Näkymä
Video: Voynich Manuscript 2024, Saattaa
Anonim

Voynichin käsikirjoituksesta ja venäläisistä tiedemiehistä peräisin olevien sensaatiouutisten takana on, onko mahdollista määrittää teksti kielestä tarkasti, kuinka riittävät matemaatikot työskentelevät kielitieteen "kentällä".

Venäjän tiedotusvälineet levittivät 19. huhtikuuta uutisia venäläisten matemaatikkojen "aikakausien tekemisestä": Uutta menetelmää käyttävät tutkijat paitsi todistivat kuuluisan "Voynich-käsikirjoituksen" tarkoituksenmukaisuuden, mutta pystyivät myös selvittämään, että se kirjoitettiin kahdella kielellä lukuun ottamatta vokaalikirjaimia.

Voynichin käsikirjoitus on keskiaikainen kuvitettu käsikirjoitus, jonka osti antiikkikauppias Wilfred Voynich vuonna 1912. Luotu 1400-luvulla (perustuu pergamentin radiohiilianalyysiin - mutta useimmat tutkijat eivät tällä hetkellä pidä itse tekstiä myöhempänä väärennöksenä), se on kirjoitettu tuntemattomalla kielellä tuntemattomalla aakkosella. Kuvien perusteella teksti koostuu temaattisista lohkoista: kasvitieteellisestä, tähtitieteellisestä, farmakologisesta ja muista. Tekstin dekoodaamisen monimutkaisuus teki Voynichin käsikirjoituksesta "pyhän graalin" salauksen kirjoittajille ja monien tutkimusten kohteeksi, mukaan lukien Big Data -menetelmiä käyttävät tutkimukset.

Uutiset käsikirjoituksesta raportoitiin jotain sensationaalista. Tämä herätti välittömästi epäilyksiä.”Ennen sitä kaikki yritykset purkaa ainutlaatuinen asiakirja ja jopa vain ymmärtää, onko kyseessä mielekäs teksti, epäonnistui. 600 vuotta turhaa työtä!.. CIA: n ja NSA: n kryptografit, supertietokoneet ja jopa "okkulttisten tieteiden" lääkärit allekirjoittivat täydellisen impotenssin. Ison-Britannian Keele-yliopiston kryptologi Gordon Ruggin viimeisin viesti kuuluu:”Voynichin käsikirjoitus on väärennös. Tällainen "monimutkainen teksti" on helppo rakentaa kaikille, jotka tuntevat yksinkertaiset kopiointimenetelmät ", artikkelissa todettiin.

Ensinnäkin tekstin mielekkyys tunnistettiin jo 1970-luvulla ja vahvistettiin useita kertoja 2010-luvun tutkimuksissa, joista kirjoitettiin riittävän yksityiskohtaisesti jopa kotimaisessa mediassa. Toiseksi uutisille toimitettu löytö esitettiin vain instituutin esipainona, ei artikkelina kansainvälisessä vertaisarvioidussa lehdessä (esipainos julkaistiin myös vuonna 2016).

Nämä materiaalin esittelyn omituisuudet pakottivat meidät etsimään selvityksiä ensin tutkimuksen kirjoittajalta ja sitten riippumattomilta asiantuntijoilta - kielitieteilijöiltä, jotka työskentelevät tilastollisten ja matemaattisten menetelmien sekä antiikin skriptien dekoodauksen kanssa.

Kaavan kirjoittaminen on helppoa, mutta numeerisen analyysin suorittaminen on erittäin kallista

Mainosvideo:

Ensinnäkin lyhyesti tutkimuksen olemuksesta. Esitulosteen kirjoittajat, Moskovan fysiikan ja tekniikan instituutin ja Venäjän tiedeakatemian soveltavan matematiikan instituutin matemaatikot luottavat teoksiinsa, joiden mukaan "tekstisymbolien taajuusjakauma on vakaa ominaisuus ei kirjoittajalle tai tekstin aiheelle, vaan kielelle". Toisin sanoen käyttämällä joukkoa matemaattisten työkalujen avulla on mahdollista määrittää, millä kielellä se kirjoitetaan, johtuen siitä, että jokaisella kielellä on oma ominaisuus "profiili" (Hurst-eksponentin jakauma). Tutkijat totesivat näiden menetelmien pohjalta, että käsikirjoituksen teksti kirjoitettiin useiden kielten sekoituksena. Samanaikaisesti siihen lisättiin vääriä välilyöntejä ja vokaalin ääniä osoittavat symbolit poistettiin.

Tutkimuksen johtava kirjoittaja Juri Orlov (IPM RAS ja MIPT) korosti, että Voynichin käsikirjoitus ei ole ollenkaan heidän työnsä päätavoitteita. "Sensaatiomainen" käsikirjoitus on vain esimerkki matemaattisesta menetelmästä kielten tunnistamiseksi tekstistä - ongelma on itse asiassa koneoppimisessa ", Orlov sanoi.

Itse käsikirjoitus ei todellakaan ole mielenkiintoinen meille. Tiede viittaa nimenomaan kielten tilastoihin. Sen avulla voimme ymmärtää, millä kielellä tämä käsikirjoitus on kirjoitettu. Mutta ei sitä, mitä siellä kirjoitetaan, tämä on tärkeä asia. - Juri Orlov. MIPT ja soveltavan matematiikan instituutti, joka on nimetty M. V. Keldysh

Työssä käytetyn kielellisen menetelmän osalta Orlov huomauttaa, että itse tekstien kirjainyhdistelmien taajuuden analyysi on hyvin tunnettu asia. Hurst-indikaattori on kuitenkin kielitieteilijöiden huonosti tiedossa, koska sitä on vaikea laskea edes matemaattisesti. Itse kaava on helppo kirjoittaa, mutta numeerinen analyysi on erittäin kallista. Tätä varten supertietokone, joka sijaitsee M. V. Keldysh, matemaatikko korostaa.

Indoeurooppalaisten kielten valinta analyysiksi selitetään sillä, että ne kaikki ovat hyvin samankaltaisia, Orlov sanoo. Matemaatikoiden kehittämien indikaattorien avulla on helppo erottaa kielet samasta kieliryhmästä, mutta ei perheiden välillä. Teoreettisesti on tietysti mahdollista tehdä sama työ muiden ryhmien kanssa (Ural, Altai tai muut), mutta analyysin arvo on sen täydellisyydessä, Orlov on varma. Indoeurooppalaisten kielten kohdalla ei ole vaikeaa kirjoittaa kutakin kieltä varten tekstiä, sitä on vaikeampaa tehdä muiden perheiden kanssa.

Palattuaan Voynichin käsikirjoitukseen Orlov huomautti, että hän ja hänen kollegansa mainitsivat viisi todistusta (käsikirjoituksen kielten sekoitusta ja poistamista koskevan hypoteesin logaritminen profiili kirjainten taajuusjärjestyksessä tekstillä yhdellä ja useammalla kielellä, Hurst-eksponentin jakauma, ehdollisten todennäköisyyksien matriisin spektrimaalaus ja muut). kirjaimet vokaaleille. He etääntyvät painokkaasti "käsikirjoituksen ympärillä olevasta hangoutista", mutta esittivät ainutlaatuisen tuloksen - avoimen menetelmän, tilastollisen analyysin luotettavuuden arvioinnilla, joka voidaan tarkistaa itsenäisesti.

Johtopäätöstä heikentää se, että emme ymmärrä, mistä materiaalista he ovat saaneet ja mistä - he tarkistivat kaavansa

Pelkkä oletus, että Voynichin käsikirjoituksen tekstistä puuttuu vokaalien kirjaimet, väärin sijoitetut välilyönnit, on kaunis ja hyvä, toteaa kielimatematiikkaa harjoittava kielitieteilijä Evgenia Korovina (Venäjän tiedeakatemian kielitieteiden instituutti) Aikaisemmin kukaan ei esittänyt tällaista hypoteesia. Hän esimerkiksi selittää kauniisti, miksi kirjaimia on vähemmän kuin eurooppalaiselle tekstille odotettaisiin. Mutta ongelmana on, että tutkimuksen kirjoittajat eivät edes ilmoittaneet, mitä tekstejä eri kielillä he vertailivat ja mikä oli näiden testien määrä. Esipainossa mainitaan valtava määrä kieliä. Siksi tutkimusta ei voida toistaa: jos otat mielivaltaisia tekstejä samoilla kielillä, ei ole tosiasia, että samat mallit tulevat esiin.

Muinaisien kielten tutkimuksen korpusmenetelmien asiantuntija Maria Molina (Institute of Linguistics, RAS) on samaa mieltä Korovinan kanssa. Uudet menetelmät kielitiedon käsittelemiseksi auttavat hänen mielestään saamaan tietoa siitä, mikä oli aiemmin kielitutkijoille suljettu. Huonosti valmistettu syöttömateriaali kuitenkin heikentää usein jopa hienoimpia tietojenkäsittelytekniikoita.

Johtopäätöstä heikentää se, että emme ymmärrä, mistä materiaalista he ovat saaneet ja mistä - he testasivat kaavansa. Materiaalini osalta tiedän varmasti, että siinä on pieni metodologinen virhe - ja saan kriittisesti erilaisia numeroita. - Maria Molina. Kielitieteen laitos RAS

"Roskat sisään - roskat ulos", lisää Molina (GIGO on periaate tietojenkäsittelytieteessä, mikä tarkoittaa, että väärät syötetiedot johtavat virheellisiin tuloksiin, vaikka algoritmi itse olisikin oikea, - huomioi Indicator. Ru).

Tilastomenetelmät ovat edelleen vihjeitä tuloksista, ei tuloksista

Albert Davletshin (Venäjän valtion humanitaarisen yliopiston vertailevien tutkimusten instituutin kielellisten vertailututkimusten keskuksen työntekijä, tutkii mayoja ja polynesialaisia kieliä) puhui vielä terävämmin. Jos esipainon kirjoittajat eivät aikoneet tulkita Voynichin käsikirjoitusta, miksi he tekevät sen? Ja jos puhumme nimenomaan tuntemattoman kirjoituksen dekoodaamisesta, syntyy kysymys toisensa jälkeen: Kirjoittamisesta ei ole lähtötietoja - minkä tyyppinen kirje? Kuinka eri transkriptiot saadaan? Kuinka monta merkkiä? Mikä perustuu olemassa oleviin oletuksiin kirjoituksen luonteesta? Kuinka suuri on välilyönneillä erotettu sanan pituus? Mitä välilyönnit tarkoittavat? Kuinka suuri sanakirja on? Mikä on allekirjoitusten ja piirustusten suhde?

Aluksi käy ilmi, että teksti on tanskalainen ja vain tanskalainen (ja tämä on historiallisesti mahdotonta, josta teoksessa ei ole sanaa). Sitten käy ilmi, että teksti on kahdella tuntemattomalla kielellä (todentaminen tässä vaiheessa osoittautuu mahdottomaksi ja perustuu uskoon). Lisäksi on monia konservatiivisia tapoja osoittaa, että kaksi (suurta) sivua kirjoitetaan yhdellä kirjaimella, mutta eri kielillä turvautumatta monimutkaisiin matemaattisiin malleihin. Lopuksi, jos vokaalit poistetaan tekstistä, kuinka paljon tämä vahvistetaan tavallisilla, tunnetuilla menetelmillä (esimerkiksi Sukhotin, Shevoroshkina ja Ventris)?"

Davletshin kritisoi myös tällaiselle tutkimukselle ominaista tuntemattomuutta filologiaan ja historiaan:

Mitä näen tekstissä: on usein ihmisiä, jotka haluavat ottaa lähteen X ja unohtaa, että se on lähde ja esiintyy joissakin historiallisissa, myös kielellisissä, konteksteissa, ja jotenkin laskea siihen jotain. Hypoteesi, että käsikirjoituksessa on enemmän kuin yksi kieli, on mielenkiintoinen. Mutta voit jotenkin näyttää sen inhimillisesti. Tilastolliset menetelmät ovat edelleen vihjeitä tuloksista, ei tuloksista. -Albert Davletshin. Kielellisten vertailevien tutkimusten keskus, IVKA RSUH

Ei ole mitään kriteeriä erottaa mielenkiintoiset tulokset kauheista

Tasapainoisempi kanta oli vertailevan historiallisen kielitieteen (RSUH) asiantuntija Georgy Starostinilla. Häntä kiinnosti enemmän, kuinka hyödyllisiä uudet matemaattiset menetelmät ovat kielitieteilijöiden kohtaamien ongelmien ratkaisemiseen.”Artikkelissa esitetty malli antaa outon vaikutelman. Yhtäältä se näyttää kuuluvan "sokeiden" luokkaan, joka analysoi tekstitietoja ilman alustavia tuomioita aakkosten rakenteesta (esimerkiksi digrafiikoita, kuten englanninkielinen ch, sh, tulisi pitää kahden kirjaimen yhdistelminä, vaikka tämä onkin yksi ääni). Toisaalta vokaalit heitetään pois vertailtuista merkkijonoista, jotka tekstin kirjoittajien mukaan sisältävät vähemmän tietoa ja lisäävät melua. Yleensä testikanta on selvästi hyvin pieni, on mahdotonta puhua jostakin perustavanlaatuisesta niin monilla kielillä."

Artikkelin vertailutaulukossa 3 esitetyt indoeurooppalaisten ja uralilaisten kielten vertailun tulokset eivät herätä erityistä optimismia Starostinissa. Jotkut indikaattorit kielten läheisyydestä on otettu hyvin huomioon (esimerkiksi saksankieliset tai romanikansalliset yhteydet), toiset huonosti (esimerkiksi metodologia ei enää tunnista indoeurooppalaista perhettä). Tärkeintä on, että ei ole kriteeriä erottaa mielenkiintoisia tuloksia kauheista. Parhaassa tapauksessa menetelmä mahdollistaa pienten kieliryhmien erottamisen (vaikka edes täällä se ei toimi läheisesti läheisten suomalaisten ja virojen välillä), mutta kaikki nämä ryhmät voidaan tunnistaa luotettavasti ilman sitä.

Taulukko 3 esipainoksesta, jossa esitetään tulokset, joissa verrataan indoeurooppalaista ja uralilaista kieltä. Sama väri taulukossa. Tunnistetaan 3 kieliryhmää, jotka ovat pareittain lähellä (järjestettyjen taajuuksien L1-normin mukaisesti tekstissä ilman vokaalia). Jotkut yllättäen läheiset kieliparit on merkitty punaisella, kuten saksa / unkari, englanti / viro, latina / baski ja kreikka / suomi. Esikirjoittajat: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A
Taulukko 3 esipainoksesta, jossa esitetään tulokset, joissa verrataan indoeurooppalaista ja uralilaista kieltä. Sama väri taulukossa. Tunnistetaan 3 kieliryhmää, jotka ovat pareittain lähellä (järjestettyjen taajuuksien L1-normin mukaisesti tekstissä ilman vokaalia). Jotkut yllättäen läheiset kieliparit on merkitty punaisella, kuten saksa / unkari, englanti / viro, latina / baski ja kreikka / suomi. Esikirjoittajat: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A

Taulukko 3 esipainoksesta, jossa esitetään tulokset, joissa verrataan indoeurooppalaista ja uralilaista kieltä. Sama väri taulukossa. Tunnistetaan 3 kieliryhmää, jotka ovat pareittain lähellä (järjestettyjen taajuuksien L1-normin mukaisesti tekstissä ilman vokaalia). Jotkut yllättäen läheiset kieliparit on merkitty punaisella, kuten saksa / unkari, englanti / viro, latina / baski ja kreikka / suomi. Esikirjoittajat: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A.

Lopuksi on mielenkiintoinen idea määrittää kielen geneettinen ominaisuus Hurst-eksponentin jakauman avulla ja ehkä jopa viedä tietylle tieteelliselle pisteelle. Mutta tämä vaatii suuren määrän tekstejä eri kielillä. Ja ongelma nousee heti esiin: monia kieliä ei kirjoiteta, ja kuinka aakkosjärjestelmien vertaaminen foneettisiin transkripteihin on epäselvää. Tästä ajatuksesta tulee hyvin vähän käytännön järkeä, Starostin on varma. Parhaimmillaan sitä voidaan todellakin soveltaa Voynichin käsikirjoituksen kaltaisiin tapahtumiin, kun on hypoteesi, että jokin kieli, jolla on tavallinen aakkosellinen kirjoitus, on salattu tiettyjen periaatteiden mukaisesti (esimerkiksi poistamalla vokaalit jne.). Tällaisia tapauksia on kuitenkin maailmassa hyvin vähän.

Yhteenvetona

Mikä on alimmalla rivillä? IPM- ja MIPT-tutkimuksista käyty keskustelu paljasti syvän hajoamisen kieliyhteisön (jopa tilastollisia menetelmiä käyttävien) ja "ulkopuolisten" välillä kielitieteilijöiden suhteen, jotka päättivät soveltaa matemaattisia työkalujaan kielelliseen aineistoon.

Se, että matemaatikot eivät halua työskennellä yhdessä kielitieteilijöiden kanssa, ei vain aiheuta karkeita virheitä, jotka siirtyvät sitten mediaan (esimerkiksi esipainettua baski kieltä kutsutaan indoeurooppalaiseksi, on lause "vokaalikirjaimet"). Mallien kauneus ja supertietokoneiden laskentateho ovat itse asiassa devalvoituneet virheistä tulohetkellä. Jälleen, haluamalla ja avoimella yhteydenpidolla toisen tieteenalan kollegoihin nämä virheet voitaisiin helposti välttää.

Katso itse Voynich-käsikirjoitus täältä.