Prevedere la diffusione di malattie: il ruolo dei big data

Negli ultimi due post ho raccontato aspetti controversi sull’utilizzo dei big data. Ma ci sono molte altre situazioni in cui i dati possono fare la differenza. Una di queste è la previsione della diffusione di influenze o malattie infettive. Sono diversi i dati che possono essere impiegati in questo tipo di analisi: attività online (sia sui social media che sui motori di ricerca), traffico aereo in uscita dalle zone di focolaio iniziale, localizzazione degli habitat in cui proliferano i vettori dell’infezione. Questi strumenti possono essere di grande supporto alle autorità sanitarie, che per mappare la diffusione di una malattia possono fare affidamento solo sui casi già accertati.

La diffusione del virus Zika, dichiarato emergenza sanitaria dall’Organizzazione Mondiale della Sanità, è stata studiata con tutti questi strumenti attraverso il coinvolgimento di società specializzate in analisi dei dati: l’americana Google e la canadese Blue Dot. Vediamo come.

GOOGLE
Nel 2011 la città di Lahore, in Pakistan, venne colpita da una violenta epidemia di febbre dengue (trasmessa dalla stessa specie di zanzara responsabile per la diffusione di Zika). Furono decine di migliaia le persone contagiate e oltre trecento le vittime. Per cercare di prevenire una nuova epidemia, il governo Pakistano avviò una collaborazione con Google per riuscire a individuare precocemente i nuovi casi e intervenire per eliminare le acque stagnanti dalle aree interessate. Il progetto si basava sull’algoritmo Flubreaks, un figlio di Google Flu Trends. Flubreaks venne corredato con dati “real-world”: casi accertati e larve di zanzara trovate infette raccolti sul territorio da circa 1500 funzionari del governo Pakistano utilizzando smartphone Android. L’anno successivo ci furono poco più di duecento casi accertati di dengue e nessuna vittima.

Il destino di Google Flu Trends non è stato positivo però. Dopo aver fallito la previsione dell’impatto dell’influenza negli Stati Uniti per 100 settimane su 108, Google ha deciso di chiudere il servizio. Il problema era nell’obiettivo: anticipare le previsioni dei CDC (small data) utilizzando le ricerche online (big data). La commistione di dati di natura diversa sembra essere all’origine del fallimento dell’algoritmo. La dichiarazione di Google si può leggere sul sito (che ormai contiene solo l’archivio delle vecchie previsioni): “It is still early days for nowcasting and similar tools for understanding the spread of diseases like flu and dengue – we’re excited to see what comes next. ”

Il 3 marzo scorso Google ha annunciato di aver avviato una collaborazione con l’UNICEF per contenere la diffusione del virus Zika, investendo 1 milione di dollari. L’attività riguardante Zika sui motori di ricerca ha visto nell’ultimo anno un incremento del 3000%. Sarà interessante seguire gli sviluppi di questo progetto.

BLUE DOT
Anche la società canadese Blue dot, specializzata in big data analytics, è impegnata nella lotta digitale contro le malattie infettive. Concepita nel 2003 all’inizio dell’epidemia di SARS in Canada, è stata lanciata nel 2013 all’interno del St. Michael’s Hospital di Toronto per sviluppare modelli epidemiologici basati sui dati. I dati sono il punto critico di questo tipo di indagini. Alcuni fenomeni, soprattutto quelli di origine sociale, sono difficili da quantificare e includere nei modelli, ma sono spesso fondamentali per determinare gli sviluppi di un contagio. Nel caso della malattia dell’Ebola, i CDC formularono nel settembre 2014 una previsione di 1.4 milioni di casi nell’Africa occidentale. Alla fine dell’epidemia le persone contagiate sono state solo 28600 e le vittime 11300 . Ciò che ha allontanato le previsioni del modello dalla realtà, sono stati una serie di eventi “esogeni”. In primo luogo un consistente pacchetto di aiuti sanitari da parte degli Stati Uniti. In secondo luogo, la paura causata dall’uccisione di un gruppo di operatori sanitari in Guinea da parte degli abitanti di un villaggio e che ha indotto le persone a raccogliersi in gruppi e non spostarsi, costringendosi autonomamente in quarantena. Da una parte la politica, dall’altra la paura. Due fenomeni di difficile modellizzazione.

Blue Dot cerca di formulare modelli più realistici. Nell’agosto del 2015, quando i primi segni di una strana infezione virale in Brasile hanno cominciato a emergere, Blue Dot ha utilizzato l’enorme data base di dati in proprio possesso per fare una previsione della diffusione geografica del virus. Dati sui voli in partenza dal Brasile (circa 10 milioni di Brasiliani hanno viaggiato all’estero tra il settembre 2014 all’agosto del 2015), mappe di temperatura, densità di popolazione, distribuzione delle popolazioni di zanzare Aedes Aegypti, vettori del virus. I risultati sono contenuti in questo articolo pubblicato su Lancet. Il compito ultimo di Blue Dot è di affiancare i decisori politici nella gestione di emergenze sanitarie.
Resta il fatto che la descrizione realistica di un’epidemia richiede di prevedere fenomeni sociali e umani che ancora sfuggono agli sforzi dei modelli matematici.

 

Pubblicato da

Chiara Sabelli

Cerco. E, quando trovo, racconto. Giornalista scientifica freelance. Fisica di formazione, in finanza dopo il PhD.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *