Con 215 vittime accertate e altre 45 probabili, Harold Shipman è stato uno dei serial killer più prolifici del Regno Unito. Prima del suo arresto nel 1998, ha sfruttato la sua posizione di medico stimato per uccidere molti dei suoi pazienti anziani. Un modus operandi molto semplice: iniettare ai suoi pazienti la giusta dose letale di morfina e poi alterare le loro cartelle cliniche per far sembrare naturali le loro morti.
Insomma, un vero professionista, non c’è che dire!
Se fossimo in un fumetto della Marvel sarebbe dovuto arrivare il supereroe per catturarlo. Nella realtà gli investigatori furono aiutati da un gruppo di ricerca di statistici che cambiò punto di vista alle indagini e invece di chidersi chi fosse l’assassino iniziarono a domandarsi chi sarà la prossima vittima?
La statistica, disciplina derivante dalla matematica, infatti ha come obiettivo primario rispondere al tipo di interrogativi che insorgono quando vogliamo capire meglio il mondo.
E per farlo ha bisogno dei dati. Dati. Evidenziamo questa parola e mettiamola da parte perché ci servirà in seguito.
La statistica si occupa dell'intero ciclo di vita dei dati, che ha cinque fasi che possono essere riassunte con l'acronimo PPDAC:
Problema
Piano
Dati
Analisi
Conclusione
Problema
Il compito dello statistico è identificare un problema, progettare un piano per risolverlo, raccogliere i dati pertinenti, analizzarli e interpretare una conclusione appropriata. Nel nostro caso specifico acchiappare uno spietato serial killer.
Piano
Che tipo di persone ha ucciso Shipman e quando sono morte? La fase successiva è raccogliere informazioni sulle morti dei pazienti di Shipman e confrontarle con informazioni su altre morti di pazienti nella zona per vedere se c'erano incongruenze sospette nei dati.
Dati
La terza fase del ciclo riguarda il processo effettivo di raccolta dei dati. In questo caso, ciò significava esaminare centinaia di certificati di morte fisici a partire dal 1977.
Analisi
Nella quarta fase, i dati sono stati analizzati, inseriti in un software e confrontati utilizzando grafici. L'analisi ha evidenziato due cose: primo, l'ambulatorio di Shipman registrava un numero di morti molto superiore alla media per la sua zona. Secondo, mentre le morti dei pazienti per altre prassi generali erano distribuite durante tutto il giorno, le vittime di Shipman tendevano a morire tra le 13:00 e le 17:00 - proprio quando Shipman effettuava le sue visite a domicilio.
Conclusione
Il rapporto degli statistici ha concluso che se qualcuno avesse monitorato i dati, le attività di Shipman avrebbero potuto essere scoperte già nel 1984 - 15 anni prima - il che avrebbe potuto salvare fino a 175 vite.
Non ho nient’altro da aggiungere Vostro Onore, facciamo un salto ai giorni nostri e ritorniamo ai dati.
Senza dati sei solo un'altra persona con un'opinione – E. Deming.
I dati sono fondamentali per comprendere il mondo che ci circonda, lo abbiamo visto, ma oggi è l'Intelligenza Artificiale a potenziare enormemente le nostre possibilità consentendoci di analizzarli e trarre insight preziosi. Dopo l'elaborazione, i dati devono essere interpretati. E qui entra in gioco l'AI che svolge un ruolo cruciale nell'analisi dei dati, facilitando e velocizzando il processo di Data Analysis. Come afferma Hal Varian di Google:
Il lavoro più sexy nei prossimi 10 anni sarà lo statistico.