Da Facebook a Google, che dati usa il governo nell’emergenza coronavirus

Mappe sulla mobilità, reazioni sui social network e risposte a un chatbot di telemedicina sono le prime fonti al vaglio della task force per valutare l’impatto socio-economico di Covid-19

Contact tracing (foto: Orbon Alija via Getty Images)

I dati sulla mobilità di Facebook. Le mappe e le tendenze delle ricerche su Google. Le domande sui sintomi da Covid-19 al chatbot sviluppato da Pagine mediche, piattaforma di medicina a distanza, e adottato, tra gli altri, da Regione Lombardia. E ancora: le reazioni sui social network alle notizie sull’epidemie, alle misure prese dal governo o ai numeri sui contagi, analizzate con l’agenzia di reputazione digitale The Fool. Sono queste le prime quattro fonti principali di dati che la task force designata dal ministero dell’Innovazione sta analizzando per valutare l’impatto socio-economico dell’emergenza coronavirus in Italia. Lo confermano a Wired gli analisti all’interno del gruppo di lavoro.

Incrociate con altri set di dati, come il bollettino quotidiano delle Protezione civile su contagiati e guariti, queste informazioni (che a quanto ha appurato Wired sono fornite gratuitamente) potranno dare tre tipi di proiezioni per comprendere le conseguenze della pandemia su società ed economia: anticipare tendenze nell’epidemia, pianificare la fase due della lotta al Sars-Cov-2 e monitorare gli effetti della comunicazione e delle misure del governo sulla popolazione. Non serviranno, invece, per fare contact tracing propriamente detto, ossia monitorare i contatti di un singolo individuo affetto da Covid-19. Compito demandato alla app che il governo vuole varare a stretto giro.

I dati sotto esame

Prendiamo i flussi di spostamenti, per esempio. Come quelli che, come anticipato da Wired, Menlo Park ha condiviso con l’unità di ricerca guidata da Stefano Denicolai, docente di gestione dell’innovazione alla facoltà di Economia dell’università di Pavia. Sia Facebook sia Google hanno annunciato di aver condiviso dati aggregati e anonimizzati sulla mobilità. Possono essere usati per tracciare le direttrici di movimento in una città o da regione a regione. Oppure per pianificare la riapertura graduale del trasporto pubblico nella fase due.

Poi c’è l’impatto di notizie e misure politiche sulla popolazione. “Con The Fool lavoriamo su dati testuali dai social network: Facebook e Twitter”, spiega a Wired Denicolai, che fa parte del gruppo di lavoro sull’impatto socio-economico studiato attraverso i big data nella task force di Palazzo Chigi. Al suo tavolo siedono anche Walter Quattrociocchi, a capo del laboratorio di Data science dell’università Ca’ Foscari di Venezia, e Andrea Lacalamita, fondatore dell’agenzia immobiliare online Homepal.

La mappa di Facebook sul coronavirus (Facebook)La mappa di Facebook sul coronavirus (Facebook)

I dati tratti dai social network vengono usati come termometro del dibattito pubblico. “Possiamo capire come lo influenza, che effetto può avere una fake news, ma anche la ragione degli spostamenti, se per lavoro o per necessità”, chiosa Denicolai. In aggiunta, i social possono fornire orientamenti anche su come gestire nuove abitudini di consumo. Non solo il boom di ecommerce e consegne a domicilio, ma anche il ricorso, nei piccoli paesi, agli alimentari sotto casa. “Può essere un’occasione per prepararsi al new normal”, osserva il docente, ossia al nuovo corso della vita quotidiana quando si allenterà la stretta.

Dal web, infine, il gruppo di lavoro vuole estrarre elementi utili per fare chiarezza sulla diffusione del contagio, sul suo spostamento o sull’insorgere di eventuali nuovi focolai. Per questo studia anche le domande (in forma anonima) che arrivano al chatbot di Pagine mediche, startup salernitana specializzata in consulenze da remoto. “Ha avuto già più di centomila interazioni in Italia, perché è integrato su più siti, tra cui quello di Regione Lombardia”, spiega Quattrociocchi.

Il bot, a detta della startup, permette di fare un primo monitoraggio dell’eventuale presenza di sintomi da Covid-19. “Con dati aggregati a livello provinciale, ci permette di capire se c’è un cambiamento nella situazione di un territorio prima che si manifesti, visto che sappiamo che il numero dei contagiati è un dato che arriva in ritardo, poiché si riferisce a persone che hanno contratto il virus almeno cinque giorni prima”, precisa Denicolai.

La mappa di Facebook sul coronavirus (Facebook)La mappa di Facebook sul coronavirus (Facebook)

L’analisi delle informazioni

La correlazione dei dati non serve solo per identificare tendenze emergenti. Secondo gli esperti è anche un modo per pulirli. Per fare quella che Denicolai definisce “igiene del dato”: “Ridurre i bias”, ossia le inclinazioni o tendenze che possano viziare l’analisi e, di conseguenza, le conclusioni a cui giunge.

Per quanto riguarda Facebook, le università sono al lavoro sui dati già due-tre settimane. Non solo l’ateneo pavese, ma anche Ca’ Foscari e Politecnico di Milano che, come spiega Quattrociocchi, stanno completando una ricerca sull’uso di queste informazioni applicate alla mobilità (che poi dovrà essere sottoposta a revisione). “Abbiamo un dataset di 700mila osservazioni e con 3,8 milioni di utenti”, spiega il docente. Si tratta di iscritti al social network che hanno acconsentito all’uso dei dati di localizzazione. Non è stato invece definito un orizzonte temporale per la consegna al ministero delle prime evidenze emerse da queste ricerche.

Menlo Park, nel frattempo, ha sviluppato nuovi strumenti di analisi delle informazioni che ha in pancia. Ha creato mappe di co-localizzazione, che rivelano la probabilità con cui una persona che si trova in una zona può entrare in contatto con una che proviene da un’altra. Se quest’ultima, per esempio, arriva da un’area in cui il coronavirus si è diffuso, la mappa potrebbe consentire di ricostruire possibili catene del contagio. Ci sono poi elaborazioni sui movimenti delle persone all’interno delle città: se stanno vicino a casa o si spostano molto, un dato che può essere usato per valutare le misure di quarantena e che può essere correlato con gli indicatori di Google, che a sua volta studia l’affollamento di luoghi pubblici come negozi, parchi e farmacia. E ancora, Facebook ha elaborato indici di connessioni e amicizie tra diversi paesi.

La questione privacy

Queste proiezioni sono simili a quelle che possono essere sviluppate con i dati delle celle telefoniche, messe a disposizione dalle compagnie telefoniche e già in uso, per esempio, in Regione Lombardia ma richieste anche dalla Commissione europea a livello comunitario. Per Denicolai, però, le piattaforme sono state più veloci a fornire “dati aggregati senza informazioni sensibili al loro interno”.

La privacy è l’aspetto più delicato. Perché il timore è che una raccolta di dati sistematica e pervasiva possa essere usata dai governi per fare sorveglianza, anche dopo la fine dell’emergenza. Ed è chiaro che le grandi piattaforme, fino a ieri al centro di un dibattito acceso sull’uso della grande mole di dati di cui sono in possesso, vogliono dimostrare l’utilità del loro operato. Facebook e Google hanno più volte precisato che le informazioni condivise sono rese anonime e aggregate e che stanno osservando i più alti standard di sicurezza. Mentre le raccolte di Big G sono pubbliche e accessibili a tutte, Menlo Park ha deciso di limitarsi a università e organizzazioni non governative.

Nel frattempo i garanti della privacy in Europa, rifacendosi al regolamento generale per la protezione dei dati (Gdpr) hanno richiamato in molti casi l’invito a prediligere set anonimizzati e aggregati e l’obbligo di distruggere quelle informazioni, dopo che sono state usate. Il garante italiano, Antonello Soro, ha chiesto misure proporzionali, lungimiranti e temporanee, mentre il segretario generale dell’autorità, Giovanni Busia, siede nella task force dei 74 esperti del ministero, che, tra i vari compiti, dovrà anche scegliere tra 319 app quella più adatta per fare monitoraggio della popolazione.

In Europa, invece, il garante Wojciech Wiewiorówski ha scritto alla direzione generale Connect, che coordina le politiche dei big data nella lotta al coronavirus, per fissare i paletti entro cui potrà muoversi nell’uso dei dati forniti non solo dalle compagnie telefoniche, ma anche dalle big tech. Come Facebook e Google, con le quali, come Wired ha anticipato, la trattativa per condividere informazioni è aperta.

Fonte : Wired