Kodama, il nuovo algoritmo «fiorentino» per combattere i tumori
FIRENZE – Si chiama Kodama ed è il nuovo algoritmo matematico utilizzabile nella ricerca scientifica e sviluppato dai ricercatori della Fondazione FiorGen Onlus di Firenze. Lo studio, firmato da Claudio Luchinat (professore di chimica all’Università di Firenze), Leonardo Tenori (ricercatore della Fondazione FiorGen) e Stefano Cacciatore (dottorando all’Università di Firenze durante lo sviluppo del nuovo metodo e oggi ricercatore al Dana-Farber Cancer Institute di Boston), nella fase di sperimentazione è stato applicato con successo ai metodi per la lotta contro i tumori e altre malattie degenerative, ma il suo uso non è limitato all’ambito medico, bensì può estendersi anche ad altri campi, come le tecniche di comunicazione, la linguistica etc. Gli stessi ricercatori fiorentini hanno effettuato, ad esempio, un test sui discorsi dei presidenti americani degli ultimi cento anni.
Kodama, letteralmente KnOwledge Discovery by Accuracy MAximization (ovvero, scoperta di conoscenze attraverso la massimizzazione dell’accuratezza), è un nuovo algoritmo per l’analisi multivariata di dati, frutto di studi i cui risultati sono stati pubblicati nei giorni scorsi sulla rivista scientifica PNAS (Proceedings of the National Academy of Science of the United States of America), organo dell’Accademia delle Scienze degli Stati Uniti.
Nel folklore giapponese, Kodama è il nome di uno spirito che vive negli alberi, ma nelle analisi automatiche di grandi set di dati significa dare la possibilità di identificare risultati che al loro interno incorporino già una fase di validazione dei dati stessi, in modo da estrarre soltanto i patterns più significativi e rappresentativi. “Questo meccanismo – spiegano i tre ricercatori della Fondazione FiorGen Onlus – permette di superare i metodi di analisi tradizionali che, una volta completati, hanno sempre bisogno di una validazione a posteriori dei risultati ottenuti. Kodama, al contrario, incorpora al proprio interno una procedura iterativa ed elabora i raggruppamenti di dati forniti, accorpando tra di loro gli elementi più simili del dataset. Alla fine viene fornita una matrice di somiglianza che permette immediatamente di valutare le relazioni tra i dati”.
Gli autori – per verificare l’efficacia delle loro teorie e al tempo stesso per dimostrare la versatilità del metodo – hanno analizzato dati che spaziano dalla metabolomica e dalla genomica, fino all’astronomia e alla linguistica. “Il nuovo metodo dà risultati migliori di quelli ottenuti con metodi tradizionali e offre uno strumento generale per analizzare qualunque tipo di dato complesso in ogni settore delle scienze – spiegano Luchinat, Tenori e Cacciatore -. Ad esempio, è possibile raggruppare diversi tipi di tumore sulla base delle caratteristiche genetiche, oppure gruppi di persone in base al proprio metabolismo individuale, o ancora diversi tipi di galassie in base alle loro caratteristiche osservabili”.
Come test, i ricercatori di FiorGen hanno raggruppato i presidenti americani in base al loro modo di rivolgersi alla Nazione nel tradizionale discorso sullo Stato dell’Unione: gli autori hanno analizzato le caratteristiche linguistiche dei discorsi a partire dal 1900, rivelando con immediatezza una netta transizione avvenuta durante la presidenza di Ronald Reagan, quando parole come “labor”, “expenditures”, “employment”, “relations”, “resources” e “production” rapidamente sono diminuite di frequenza, mentre parole come “parents”, “students”, “pass”, “children”, “Medicare” e “reform” hanno assunto sempre più peso. In sostanza, sul piano linguistico, è emerso che è stato Reagan il presidente di svolta, colui che ha rappresentato una transizione tra le modalità retoriche passate e quelle presenti. Un caso diverso è quello della terza relazione sullo Stato dell’Unione di George Bush (29 gennaio 1991), che è tornato a essere più simile ai discorsi pre-Reagan: un discorso diverso dai precedenti, dal forte carattere emotivo, tenuto nel mezzo dell’Operazione Desert Storm (17 gennaio 1991-28 febbraio 1991). L’attuale presidente Obama ha avuto il primato nella comunicazione fra tutti gli inquilini della Casa Bianca grazie al sapiente uso dei nuovi media, ma nel modo di rivolgersi alla Nazione – secondo l’algoritmo scoperto dagli scienziati fiorentini – è rimasto un allievo di Reagan.
[M.B.]