Kuidas Paljastatakse Voynichi Käsikirja Saladused: Uurimine - Alternatiivvaade

Sisukord:

Kuidas Paljastatakse Voynichi Käsikirja Saladused: Uurimine - Alternatiivvaade
Kuidas Paljastatakse Voynichi Käsikirja Saladused: Uurimine - Alternatiivvaade

Video: Kuidas Paljastatakse Voynichi Käsikirja Saladused: Uurimine - Alternatiivvaade

Video: Kuidas Paljastatakse Voynichi Käsikirja Saladused: Uurimine - Alternatiivvaade
Video: The Last CIA Whistleblower: Drug Trafficking, Training Terrorists, and the U.S. Government 2024, Mai
Anonim

Mis on sensatsiooniliste uudiste taga Voynichi käsikirja ja vene teadlaste kohta, kas tekstist on võimalik keelt täpselt kindlaks määrata, kui adekvaatsed matemaatikud töötavad keeleteaduse "valdkonnas".

19. aprillil levitas Vene meedia uudiseid vene matemaatikute "ajastutruust" avastusest: uut meetodit kasutavad teadlased ei tõestanud mitte ainult kuulsa "Voynichi käsikirja" mõttekust, vaid suutsid ka kindlaks teha, et see on kirjutatud kahes keeles ja välja arvatud häälikute tähed.

Voynichi käsikiri on keskaegne illustreeritud käsikiri, mille ostis 1912. aastal antiikesemete müüja Wilfred Voynich. See on loodud 15. sajandil (pärgamendi radiosüsinikuanalüüsi põhjal - kuid enamik teadlasi ei pea teksti ennast hilisemaks võltsinguks), see on kirjutatud tundmatus keeles, kasutades tundmatut tähestikku. Illustratsioonide järgi otsustades koosneb tekst temaatilistest plokkidest: botaanilistest, astronoomilistest, farmakoloogilistest jt. Teksti dekodeerimise keerukus muutis Voynichi käsikirja krüptograafide jaoks püha graaliks ja paljude uuringute objektiks, sealhulgas Big Data meetodeid kasutavate uuringute objektiks.

Uudiseid käsikirja kohta teatati kui midagi sensatsioonilist. See tekitas kohe teatavat muret. "Enne seda ebaõnnestusid kõik katsed unikaalse dokumendi dešifreerimiseks ja isegi lihtsalt aru saamiseks, kas tegemist on sisuka tekstiga. 600 aastat kasutuid jõupingutusi!.. CIA ja NSA krüptograafid, superarvutid ja isegi "okultistlike teaduste" doktorid kirjutasid alla nende täielikule impotentsusele. Suurbritannia Keele ülikooli krüptoloog Gordon Ruggi viimane postitus kõlab nii: „Voynichi käsikiri on võlts. Sellist "keerukat teksti" on lihtne üles ehitada kõigile, kes tunnevad lihtsaid kopeerimismeetodeid, "seisis artiklis.

Esiteks tunnistati teksti mõttekust juba 1970. aastatel ja kinnitati mitu korda 2010. aastate uuringutes, millest kirjutati piisavalt üksikasjalikult isegi kodumaises meedias. Teiseks, uudistele edastatud avastus esitati ainult instituudi preprindi kujul, mitte rahvusvahelise eelretsenseeritud ajakirja artiklis (eelprint ilmus ka 2016. aastal).

Need kummalisused materjali esituses sundisid meid otsima selgitusi kõigepealt uuringu autorilt ja seejärel sõltumatutelt ekspertidelt - keeleteadlastelt, kes töötavad statistiliste ja matemaatiliste meetodite ning iidsete skriptide dekodeerimisega.

Valemi kirjutamine on lihtne, kuid arvulise analüüsi teostamine on väga kulukas

Reklaamvideo:

Esiteks lühidalt uuringu olemusest. Eelprindi autorid, Moskva Füüsika ja Tehnoloogia Instituudi ning Vene Teaduste Akadeemia rakendusmatemaatika instituudi matemaatikud toetuvad oma töödele, mille kohaselt "tekstisümbolite sagedusjaotus on stabiilne omadus mitte autorile ega teksti subjektile, vaid keelele". See tähendab, et matemaatiliste tööriistade abil saab komplekti kasutades kindlaks teha, millises keeles see on kirjutatud, tulenevalt asjaolust, et igal keelel on oma iseloomulik "profiil" (Hursti eksponendi jaotus). Neid meetodeid aluseks võttes leidsid teadlased, et käsikirja tekst on kirjutatud mitme keele segus. Samal ajal lisati sellele valed tühikud ja eemaldati täishäälikuid tähistavad sümbolid.

Uuringu juhtiv autor Juri Orlov (IPM RAS ja MIPT) rõhutas, et Voynichi käsikiri pole üldse nende töö peamine eesmärk. "Sensatsiooniline" käsikiri on vaid illustratsioon matemaatilisest meetodist keelte tekstist äratundmiseks - probleem on tegelikult masinõppe jaoks, "ütles Orlov.

Käsikiri ise pole meie jaoks absoluutselt huvitav. Teadus viitab konkreetselt keelte statistikale. Selle kaudu saame aru, mis keeles see käsikiri on kirjutatud. Kuid mitte seal kirjutatu, see on oluline punkt. - Juri Orlov. MIPT ja M. V. nime kandev rakendusmatemaatika instituut Keldysh

Teoses kasutatud keelelise meetodi kohta märgib Orlov, et tähekombinatsioonide sageduse analüüs tekstides on ise tuntud asi. Hursti indikaator on keeleteadlastele aga halvasti teada, kuna seda on keeruline isegi matemaatiliselt arvutada. Valemit on iseenesest lihtne kirjutada, kuid arvuline analüüs on väga kulukas. Selle jaoks on M. V.-i nimelises instituudis asuv superarvuti. Keldysh, rõhutab matemaatik.

Indoeuroopa keelte valimine analüüsimiseks on seletatav sellega, et need kõik on väga sarnased, ütleb Orlov. Matemaatikute väljatöötatud näitajate abil on lihtne keelte eristamine sama keelerühma sees, kuid mitte perekondade vahel. Muidugi on teoreetiliselt võimalik sama tööd teha ka teiste rühmadega (Ural, Altai või teised), kuid analüüsi väärtus seisneb selle täielikkuses, on Orlov kindel. Indoeuroopa keelte puhul ei ole keeruline iga keele jaoks tekstide korpust trükkida, seda on keerulisem teha koos teiste peredega.

Naastes Voynichi käsikirja juurde, märkis Orlov, et tõi koos kolleegidega välja viis tõestust (ühes ja mitmes keeles tekstis olevate tähtede sageduse järjestuse logaritmiline profiil, Hursti eksponendi jaotus, tingimuslike tõenäosuste maatriksi spektraalportree ja teised) hüpoteesist käsikirjas keelte segu ja kustutamise kohta tähed täishäälikutele. Nad distantseeruvad rõhutatult "käsikirjaga seotud hangoutist", kuid esitasid ainulaadse tulemuse - avatud meetod, statistiline analüüs koos usaldusväärsuse hinnanguga, mida saab sõltumatult kontrollida.

Järeldust halvendab asjaolu, et me ei saa aru, mis materjalist ja millest nad tulid - nad kontrollisid oma valemit

Juba eeldus, et Voynichi käsikirja tekst puudub täishäälikute jaoks, valesti paigutatud tühikutega, on ilus ja hea, märgib keele matemaatilise statistikaga tegelev keeleteadlane Evgenia Korovina (Vene Teaduste Akadeemia keeleteaduse instituut). Varem ei esitanud keegi sellist hüpoteesi. Näiteks selgitab ta kaunilt, miks on vähem tähti, kui Euroopa teksti puhul oodata võiks. Kuid probleem seisneb selles, et uuringu autorid isegi ei märkinud, milliseid tekste erinevates keeltes nad võrdlesid ja kui suur oli nende testide maht. Eelprindis mainitakse tohutult palju keeli. Seetõttu ei saa uuringut taasesitada: kui võtta suvalisi tekste samades keeltes, pole tõsi, et samad mustrid välja tulevad.

Antiikkeelte uurimise korpusmeetodite spetsialist Maria Molina (RAS), on Korovinaga nõus. Uued keeleliste andmete töötlemise meetodid aitavad tema hinnangul saada teavet selle kohta, mis oli keeleuurijatele varem suletud. Kuid ebapiisavalt ettevalmistatud sisendmaterjal diskrediteerib sageli ka kõige peenemaid andmetöötlusvõtteid.

Järeldust halvendab asjaolu, et me ei saa aru, millist materjali nad joonistasid ja mida nad valemit kontrollisid. Oma materjali kohta tean kindlalt, et on väike metoodiline viga - ja saan kriitiliselt erinevad numbrid. - Maria Molina. Lingvistika Instituut RAS

"Prügi sisse - prügi välja," lisab Molina (GIGO on arvutiteaduse põhimõte, mis tähendab, et valed sisendandmed annavad valesid tulemusi, isegi kui algoritm ise on õige, - märkige Indicator. Ru).

Statistilised meetodid on ikkagi tulemuste vihjed, mitte tulemused

Veel teravamalt rääkis Albert Davletshin (Venemaa Riikliku Humanitaarteaduste Ülikooli võrdlevate uuringute instituudi keelte võrdlevate uuringute keskuse töötaja, uurib maia ja polüneesia keeli). Kui eelprindi autorid ei kavatsenud Voynichi käsikirja dešifreerida, siis miks nad seda teevad? Ja kui räägime konkreetselt tundmatu kirjutise dekodeerimisest, tekib küsimus küsimuse järel: „Kirjutamise kohta pole esialgseid andmeid - mis tüüpi kirju? Kuidas saadakse erinevad transkriptsioonid? Mitu tähemärki? Mis on olemasolevad eeldused kirjutamise olemuse kohta? Kui suur on tühikutega eraldatud ja tühikuteta sõna pikkus? Mida tähendavad tühikud? Kui suur on sõnastik? Kui suur on allkirjade ja jooniste suhe?

Alguses selgub, et tekst on taanikeelne ja ainult taanikeelne (ja see on ajalooliselt võimatu, mille kohta teoses pole ühtegi sõna). Siis selgub, et tekst on kahes tundmatus keeles (verifitseerimine selles etapis osutub võimatuks ja võetakse usku). Pealegi on palju konservatiivseid viise, kuidas näidata, et kaks (suurt) lehte on kirjutatud ühes tähes, kuid erinevates keeltes, keerulisi matemaatilisi mudeleid kasutamata. Ja kui tekstist eemaldatakse täishäälikud, siis kui palju seda kinnitavad tavapärased, juba ammu tuntud meetodid (näiteks Sukhotin, Shevoroshkina ja Ventris)?"

Samuti kritiseerib Davletshin sedalaadi uuringutele iseloomulikku tundetust filoloogia ja ajaloo suhtes:

Mida ma tekstist näen: sageli on inimesi, kes soovivad võtta allika X ja unustavad, et see on allikas ja eksisteerib mõnes ajaloolises, sealhulgas lingvistilises kontekstis, ja loevad sinna midagi. Hüpotees, et käsikirjas on rohkem kui üks keel, on huvitav. Kuid seda võiks kuidagi inimlikult näidata. Statistilised meetodid on ikkagi vihjed tulemustele, mitte tulemustele. -Albert Davletshin. Keele võrdlevate uuringute keskus IVKA RSUH

Puudub kriteerium huvitavate tulemuste eristamiseks kohutavatest

Tasakaalustatuma seisukoha võttis võrdleva ajaloolise lingvistika (RSUH) ekspert Georgy Starostin. Teda huvitas rohkem see, kui kasulikud on uued matemaatilised meetodid keeleteadlaste ees seisvate probleemide lahendamiseks. “Artiklis toodud mudel jätab kummalise mulje. Ühelt poolt näib see kuuluvat kategooriasse "pime", analüüsides tekstiandmeid ilma tähestiku struktuuri puudutavate esialgsete hinnanguteta (näiteks digraafe, nagu ingliskeelset ch, sh, tuleks pidada kahe tähe kombinatsiooniks, ehkki see on tegelikult üks heli). Teiselt poolt visatakse võrreldavatest stringidest välja täishäälikud, mis teksti autorite sõnul sisaldavad vähem teavet ja pigem lisavad müra. Üldiselt on testibaas selgelt väga väike, nii paljudes keeltes on võimatu rääkida millestki põhimõttelisest."

Artikli võrdlustabelis 3 toodud indoeuroopa ja uurali keelte võrdlemise tulemused ei tekita Starostinis erilist optimismi. Mõned keelte läheduse astme näitajad on hästi tabatud (näiteks germaani- või romaanisisesed ühendused), mõned halvasti (näiteks metoodika ei identifitseeri enam indoeuroopa perekonda). Peaasi, et huvitavate ja kohutavate tulemuste eristamiseks pole kriteeriumit. Parimal juhul võimaldab meetod väikesi keelerühmi eraldi välja tuua (ehkki ka siin ei toimi see tihedalt seotud soome ja eesti keeles), kuid ilma nendeta saab kõiki neid rühmi usaldusväärselt tuvastada.

Eeltrüki tabel 3, mis esitab indoeuroopa ja uurali keelte võrdlemise tulemusi. Tabelis sama värvi. Tuvastatakse 3 keelerühma, mis on paarikaupa lähedal (järjestatud sageduste jaotuste normi L1 tähenduses vokaalita tekstides). Mõned ootamatult lähedased keelepaarid on tähistatud punasega, näiteks saksa / ungari, inglise / eesti, ladina / baski ja kreeka / soome keel. Eeltrüki autorid: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A
Eeltrüki tabel 3, mis esitab indoeuroopa ja uurali keelte võrdlemise tulemusi. Tabelis sama värvi. Tuvastatakse 3 keelerühma, mis on paarikaupa lähedal (järjestatud sageduste jaotuste normi L1 tähenduses vokaalita tekstides). Mõned ootamatult lähedased keelepaarid on tähistatud punasega, näiteks saksa / ungari, inglise / eesti, ladina / baski ja kreeka / soome keel. Eeltrüki autorid: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A

Eeltrüki tabel 3, mis esitab indoeuroopa ja uurali keelte võrdlemise tulemusi. Tabelis sama värvi. Tuvastatakse 3 keelerühma, mis on paarikaupa lähedal (järjestatud sageduste jaotuste normi L1 tähenduses vokaalita tekstides). Mõned ootamatult lähedased keelepaarid on tähistatud punasega, näiteks saksa / ungari, inglise / eesti, ladina / baski ja kreeka / soome keel. Eeltrüki autorid: Arutyunov A. A., Borisov L. A., Zenyuk D. A., Ivchenko A. Yu., Kirina-Lilinskaya E. P., Orlov Yu. N., Osminin K. P., Fedorov S. L., Shilin S. A.

Lõpuks on keele geneetilise omaduse määramine Hursti eksponendi jaotuse abil huvitav mõte ja võib-olla isegi viinud selleni teaduslikult. Kuid see nõuab suure hulga tekstide töötlemist erinevates keeltes. Ja probleem tekib kohe: paljud keeled on kirjutamata ja kui õige on tähestikuliste salvestussüsteemide võrdlemine foneetiliste transkriptsioonidega, jääb selgusetuks. Sellest ideest saab praktilist mõtet väga vähe, on Starostin kindel. Parimal juhul saab seda tõesti rakendada selliste juhtumite puhul nagu Voynichi käsikiri, kui on hüpotees, et mõni standardse tähestikulise kirjaga keel on teatud põhimõtete järgi krüpteeritud (näiteks täishäälikute kustutamisega jne). Selliseid juhtumeid on maailmas aga väga vähe.

Summeerida

Mis on kõige alumine rida? IPM- ja MIPT-uuringute ümber peetud arutelu näitas sügavat lõhet keelekogukonna (isegi statistilisi meetodeid kasutavate inimeste) ja „autsaiderite” vahel seoses keeleteaduste spetsialistidega, kes otsustasid rakendada oma matemaatilisi tööriistu keelelise materjali suhtes.

Asjaolu, et matemaatikud ei taha töötada keeleteadlastega, ei tekita ainult jämedaid komistusi, mis seejärel meediasse rändavad (näiteks eeltrükis olevat baski keelt nimetatakse indoeuroopa keeleks, seal on fraas "täishäälikud"). Mudelite ilu ja superarvutite arvutusvõimet devalveerivad sisenemispunkti vead tegelikult. Jällegi, kui soov ja kontaktid on avatud mõnest teisest valdkonnast pärit kolleegidega, saab neid vigu hõlpsasti vältida.

Vaadake siin Voynichi käsikirja ennast.

Soovitatav: