sabato 16 febbraio 2013

Oltre la “Stele di Rosetta”: un potente algoritmo è sulle tracce di idiomi antichi.

Fonte: Gaianews.it
------------------------
Le lingue antiche sono una miniera di informazioni che, in larga misura, non siamo ancora riusciti a decifrare. Gli scienziati dell’Università di Berkeley, in California, hanno ideato un potente sistema di calcolo, una specie di “Stele di Rosetta” computerizzata, in grado di risalire alle prime lingue ancestrali da cui si sono evoluti i moderni idiomi. Il potente algoritmo è in grado di isolare gli antenati linguistici comuni da cui tutte le lingue moderne si sono evolute.
Il principio guida della ricerca è simile alla citata Stele di Rosetta, la lastra in granito scoperta nel 1822 in Egitto che ha permesso di decifrare i geroglifici egiziani. Sul reperto è incisa un’iscrizione in tre lingue: demotico, geroglifico e greco antico. Attraverso la comparazione con il greco antico, un idioma noto agli studiosi, è stato possibile comprendere le regole e i significati della lingua dei faraoni.
Questi antenati, chiamati proto-lingue, sono per ora tre: il proto-indoeuropeo, il proto-afroasiatico e il proto-austronesiano – l’austranesiano è un complesso di oltre 1.200 lingue parlate in una vasta area geografica compresa fra il Madagascar, il sud-est asiatico, Formosa e l’Oceania, da una serie di popolazioni imparentate tra loro e note come Austronesiani.
“Quello che mi entusiasma di questo sistema è che automatizza in una nuova scala molte delle grandi idee che i linguisti hanno avuto sulla ricostruzione storica: più dati, più parole, più lingue, ma meno tempo”, ha detto Dan Klein, Professore Associato di informatica a Berkeley e coautore del paper pubblicato online 11 febbraio sulla rivista Proceedings of National Academy of Sciences.

Un modello statistico e predittivo. Secondo gli storici, la prima scrittura a comparire sulla Terra è stata quella cuneiforme. La usavano i Sumeri, incidendola su tavolette di argilla. Le prime testimonianze risalgono al 3.000 a.C. Successivamente forme di scrittura apparvero in Egitto, quindi in Europa, in Cina e in America del Sud. Non solo esistono circa otto lingue arcaiche ancora da decifrare, ma sono molti gli interrogativi sullo sviluppo e sulle relazioni tra le lingue che ancora oggi parliamo.
Sulla base dello studio dei vocabolari in uso, l’algoritmo promette di aumentare la nostra comprensione della storia e della cultura delle antiche civiltà, e di fornire indizi su come le lingue potrebbero cambiare da oggi in poi. Per ottenere questi risultati il gruppo di ricerca ha ricostruito più di 600 lingue proto-austronesiane partendo da un database esistente di oltre 140.000 parole, replicando con l’85% di precisione ciò che i linguisti avevano fatto manualmente.
A differenza della ricostruzione manuale, un metodo lento e meticoloso che può durare decenni, questo sistema può eseguire una ricostruzione su larga scala in pochi giorni o addirittura ore. “Il nostro modello statistico può essere utilizzato per rispondere a domande scientifiche sulle lingue nel corso del tempo, non solo per fare inferenze sul passato, ma anche per estrapolare come il linguaggio potrebbe cambiare in futuro”, ha precisato Tom Griffiths, Professore Associato di psicologia e direttore della UC Berkeley Lab Computational Cognitive Science.
Come dimostra il caso della Stele di Rosetta, il metodo più utilizzato dai linguisti è quello comparativo. Vengono cioè stabilite relazioni analogiche o differenziali tra le lingue per individuare quei suoni – o fonemi – che cambiano con regolarità nel corso del tempo per determinare se essi condividono una comune madre.
Un albero genealogico delle lingue. Il nuovo tool analizza i cambiamenti sonori a livello delle unità fonetiche di base; di conseguenza i protolinguaggi vengono ricostruiti dal sistema raggruppando parole con significato comune provenienti dai linguaggi moderni correlati, e analizzando le caratteristiche condivise. Nella ricerca è stato utilizzato un metodo statistico, un algoritmo per generare serie numeriche incorrelate che seguono la distribuzione di probabilità che si suppone abbia il fenomeno studiato (Più tecnicamente, si tratta del Metodo di Monte Carlo basato sulla Catena di Markov). Il risultato è un campionamento da distribuzioni di probabilità.
Attraverso gruppi affini ma in lingue diverse, il programma ha selezionato gli idiomi che condividono un suono comune, e ha calcolato le probabilità di una comune derivazione da una proto-lingua. Ad ogni passo il risultato è stato memorizzato in modo da ottenere una struttura simile ad un albero: le radici ei nodi che rappresentano proto-lingue, mentre le parole si trovano nei nodi di questo albero che ne indicano anche l’evoluzione nel tempo.
Ricostruire un largo numero di lingue potrebbe inoltre aiutare gli esperti a mettere alla prova le loro ipotesi grazie a un approccio quantitativo. I ricercatori ritengono che i dati raccolti rappresentino prove inequivocabili a supporto di una teoria del 1955, proposta dal linguista Andre Martinet e non ancora dimostrata: i suoni differenziali, quelli che in una lingua sono cruciali per distinguere le parole tra loro, hanno una bassa probabilità di modificarsi nel tempo.
“La nostra speranza è che questo strumento rivoluzioni il campo della linguistica storica nello stesso modo in cui l’analisi statistica e i computer hanno rivoluzionato la biologia evolutiva”, conclude Alexander Bouchard-Côté, il primo autore della ricerca.
Riferimenti bibliografici: A. Bouchard-Côté, et alii., Automated reconstruction of ancient languages using probabilistic models of sound change, “Proceedings of the National Academy of Sciences”, 2013, DOI:10.1073/pnas.1204678110

Nessun commento: