Queste sono probabilmente le ultime parole “pubbliche” di Jim Gray, guru hi-tech e ricercatore Micorsoft, in una conferenza del Gennaio 2007, poco prima di scomparire in mare al largo della California. Secondo Gray la scienza nell’era dell’informatica ha bisogno di un quarto paradigma che regoli ricerca e gestione dei dati: The Fourth Paradigm si intitola il sul libro-tributo di amici e colleghi appena pubblicato in America.
Dobbiamo impegnarci molto di più per creare strumenti in grado di sostenere l’intero ciclo della ricerca, dall’acquisizione e selezione dei dati all’analisi e visualizzazione degli stessi.
Oggi gli strumenti a disposizione per l’acquisizione dei dati, sia a livelli di megascala sia a quelli di milliscala, sono davvero pessimi. In origine c’era solo la scienza sperimentale, poi è stata la volta di quella teoretica, con le leggi di Keplero, le leggi di Newton sul moto, le equazioni di Maxwell e così via. In seguito, per molti problemi, i modelli teoretici sono diventati troppo complicati da risolvere analiticamente, e così le persone hanno dovuto iniziare a simulare. Queste simulazioni ci hanno aiutato a percorrere la maggior parte della seconda metà dell’ultimo millennio.
In questo momento, le simulazioni stanno generando una smisurata quantità di informazioni, insieme a un colossale aumento di dati da parte delle scienze sperimentali. Oggi le persone non guardano più il mondo attraverso il telescopio. Piuttosto, “guardano” attraverso complessi apparecchi in larga scala che trasmettono i risultati ai data center, e soltanto allora si fermano a esaminare le informazioni sui loro computer.
Il mondo della scienza è cambiato, non ci sono dubbi in merito.
Il nuovo modello prevede che i dati vengano acquisiti da apparecchi o generati tramite simulazioni prima di essere esaminati da un software, e che le informazioni o le nuove nozioni che ne risultano siano conservate nella memoria dei computer. In questo procedimento, quindi, gli scienziati riescono ad avere accesso ai loro dati molto tardi. Le tecniche e le tecnologie per questa scienza fortemente data-oriented sono così diverse dalle precedenti che vale la pensa distinguere questo sistema dalla scienza informatica come un nuovo “quarto paradigma” per l’esplorazione scientifica.
Internet può fare molto di più che mettere a disposizione il testo integrale dei documenti dei ricercatori. In teoria, potrebbe unificare tutti i dati scientifici con tutta la letteratura per dare vita a un mondo nel quale dati e letteratura possano interagire gli uni con l’altra. Un’interazione del genere aumenterebbe la velocità di informazione delle scienze e ottimizzerebbe la produttività scientifica dei ricercatori.
E sono certo che sarebbe un gigantesco balzo in avanti!