Oncoscore: un software scova gli oncogeni

Un gruppo di ricerca italiano ha creato uno strumento che può classificare i geni basandosi sulla letteratura disponibile

3140
Oncoscore: un software scova gli oncogeni
Oncoscore: un software scova gli oncogeni

La complessità genotipica e fenotipica del cancro rappresenta una delle più grandi sfide per la medicina moderna. Le cellule tumorali presentano un incredibile eterogeneità, e come sappiamo la varietà di mutazioni che possiamo individuare all’interno delle cellule neoplastiche è incredibilmente grande. La medicina di precisione teorizza un approccio sempre più ad hoc e cucito su misura per ogni singolo paziente e caratterizzando nei minimi dettagli la massa tumorale. Tra le tecniche che stanno permettendo questo cambio di paradigma, il Next Generation Sequencing è sicuramente la più rivoluzionaria.

Ottenere informazioni sull’intero genoma di un tumore è ora un processo veloce ed economico, aprendo così le porte di studi omici in cui gli scienziati possono guardare alla totalità delle componenti cellulari individuando caratteristiche di interesse. Ma la grande quantità di dati così generata è spesso difficile da gestire; enormi liste di geni devono essere interpretate in maniera razionale e spesso la competenza di un singolo esperto potrebbe non essere abbastanza.

Una scoperta tutta italiana

Per risolvere questo problema il gruppo di ricerca dell’Università di Milano Bicocca, guidato dal dottor Gambacorti-Passerini, ha sviluppato uno strumento di text-mining basato sulla letteratura scientifica. Text cosa? Qui la medicina centra ben poco. La procedura mira essenzialmente a recuperare in maniera totalmente automatizzata delle informazioni di alta qualità da ogni tipo di testo. La letteratura scientifica è vastissima, e alcune connessioni sono troppo complesse o nascoste per essere colte dall’essere umano, mentre altre vengono semplicemente ignorate. Tuttavia, tramite modelli statistici complessi e il riconoscimento del linguaggio umano, un computer può efficacemente individuare e classificare in maniera sensata l’enorme prodotto di decenni di ricerca scientifica.

Fermiamoci un attimo per apprezzare la peculiarità di questa idea: non sono state utilizzate conoscenze biologiche in questo contesto. L’idea si basa invece su un’efficiente ricerca attraverso tutte le conoscenze disponibili, permettendo così di individuare velocemente l’associazione tra un gene di interesse e il tema cancro. Il programma, una volta fornita una lista di geni, restituisce un punteggio di associazione che rappresenta quanto il suddetto gene risulta presente in articoli, studi, database e altre risorse correlate con la macro area della ricerca oncologica. Annotare a mano gli enormi file ottenuti dal sequenziamento del DNA sarebbe un lavoro troppo lungo, e questo tipo di automatizzazione consente di restringere subito l’attenzione verso i candidati più interessanti.

Non è tutto oro ciò che luccica…

Lo strumento si basa su PubMed, la più grande risorsa di letteratura scientifica disponibile nel contesto della ricerca biomedica. Anche l’affidabilità delle singole correlazioni è tenuta in considerazione, pesando il valore degli studi in base a prestigio e fonte. Il tool è disponibile per il download presso l’archivio Bioconductor, e secondo i creatori è pensato per essere utilizzato anche dai meno esperti. L’ambizioso software non manca di difetti, come discusso nell’articolo: alcuni geni potrebbero essere stati trascurati nella letteratura, ed errori umani nella nomenclatura e nelle annotazioni potrebbero causare alcuni problemi.

L’era dei Big Data è appena cominciata, e sbocciano le prime applicazioni nei campi più disparati. La medicina, e così i pazienti, potrebbero presto trarre incredibili vantaggi da ricerche interdisciplinari di questo tipo.

FONTI | Oncoscore, a novel, Internet-based tool to assess the oncogenic potential of genes