1. Partiamo da una premessa fondamentale. Il significato informativo della prova scientifica è definitivamente differente per l’esperto e per il giudice. Il primo produce un dato scientifico di cui deve dimostrare il grado di attendibilità sulla base delle conoscenze scientifiche note. Il secondo riceve un dato scientifico e, dato il suo grado di attendibilità, deve trarne il significato probatorio utile per i fatti da accertare. L’esperto analizza un’impronta latente sul calcio di una pistola e conclude che è compatibile con quella appartenente a mister X. Il giudice, dato che la pistola è stata impugnata da mister X, trae che mister x ha avuto un contatto diretto con un oggetto utilizzato per commettere un delitto e quindi, date le ulteriori circostanze note nel processo, che mister X è (o non è) autore del delitto.
Questa constatazione, che è certamente piuttosto banale per gli studiosi del processo, non ha suscitato studi particolari fino a tempi recenti. Ciò è accaduto perché il significato probatorio derivante da una certa prova scientifica è stato sempre, tendenzialmente, univoco. Con questo non si vuole dire che il dato scientifico non possa essere incerto per via della contendibilità delle conclusioni affermate dall’esperto. Tuttavia, una volta definiti i limiti di questa incertezza, entro quei limiti la conclusione probatoria che il giudice poteva raggiungere era univoca. L’eventuale residuo grado di incertezza, rispetto alla conclusione probatoria, derivava dalla combinazione dell’elemento noto grazie alla prova scientifica con le altre prove a disposizione del giudice; non dalle caratteristiche intrinseche della prova scientifica.
Oggi non è più così. Almeno non lo è nel campo della genetica.
2. Immaginiamo la scena di un delitto di sangue e collochiamola dentro due scenari differenti.
Nel primo scenario siamo ai primi anni duemila. Un corpo giace senza vita. La vittima, dopo avere lottato, è stata colpita più volte con un coltello. La polizia scientifica identifica alcune chiazze ematiche (si assume per nota la matrice biologica) visibili sugli indumenti della vittima. Si estrae il Dna, che risulta riferibile a mister X. Quindi, gli investigatori possono plausibilmente inferire che la macchia di sangue appartenente a mister X dimostra la presenza del sospettato sul luogo e in occasione del delitto.
Applichiamo una variante. Le macchie di sangue vengono rinvenute su un coltello appartenente a mister X e, questa volta, il sangue appartiene alla vittima. La conclusione è analoga a quella precedente. Il dato scientifico depone in modo univoco – date le ulteriori circostanze note – per la partecipazione di mister X al delitto. Questo grado di convincimento è fornito da una serie di circostanze intrinseche al dato scientifico: la natura della matrice biologico (sangue), il quantitativo di materiale (abbondante), la qualità del materiale (non degradato, non misto). D’altronde quelle caratteristiche decisive per attribuire un valore probatorio univoco al dato scientifico erano pure caratteristiche indispensabili per ottenere un dato scientifico interpretabile. Cioè, i limiti della metodica del tempo consentivano di analizzare solo campioni abbondanti, non degradati, non misti eccetera eccetera. Insomma, quasi per paradosso, le limitate possibilità tecniche garantivano un risultato facile da gestire per il giudice.
Ora, prendiamo la stessa scena del delitto, ma spostiamoci ai giorni d’oggi. Stessa dinamica e stessa scena del crimine. Non sono rilevabili tracce ematiche diverse da quelle appartenenti alla vittima. Tuttavia, vengono effettuati una serie di tamponamenti su oggetti presenti sulla scena, potenzialmente legati alla dinamica dell’omicidio. Da uno di questi tamponamenti viene amplificata una traccia riconducibile a quantità di materiale biologico estremamente scarso e non identificabile nella sua matrice. La traccia è riconducibile a mister X, persona con la quale la vittima non aveva relazione alcuna. Che cosa ci dice questa informazione?
Prima di tutto esiste un problema di attendibilità del risultato. Questo problema è relativamente marginale rispetto a quello che si dirà, ma comunque il giudice dovrà affrontarlo. In sostanza, più il risultato analitico è “tirato” e più è operatore/strumentazione dipendente. Più il campione è in condizioni estreme per qualità/quantità e più il risultato deve fare ricorso alla mediazione interpretativa dell’operatore, che deve ricorrere a modelli statistici e strumenti informatici e così via. Il miglioramento incredibile delle capacità di analisi del materiale genetico ha anche portato a un incremento dell’incertezza del risultato; o quantomeno a una maggiore complessità nella valutazione della sua attendibilità.
Ma lasciamo stare questi aspetti strettamente attinenti all’aspetto tecnico e prendiamo per buono quanto riferito dell’esperto. Cioè, il profilo genetico di mister X è sicuramente presente sulla scena del crimine. Bene, se il campione di sangue con abbondante Dna consentiva di affermare una relazione forte tra il materiale biologico e la presenza fisica di mister X in quelle circostanze di tempo e luogo, questa volta la relazione è molto più debole. In tutti e due i casi possiamo affermare con certezza che il Dna del sospettato è stato trovato sul luogo del delitto, ma questa affermazione è solo apparentemente identica. Trarre dalle due proposizioni conclusioni probatorie identiche sarebbe un grave errore. Perché nel secondo caso dobbiamo considerare la possibilità di una contaminazione, di un trasferimento secondario, terziario e via dicendo[1]. Quindi, il potere informativo e dunque il significato probatorio della prova scientifica, nei due casi, sono sensibilmente differenti. Come si fa a dare una dimensione misurabile a questa “diversità”?
Sicuramente non lo può fare il giudice sulla base del suo personale e arbitrario convincimento. Come sappiamo, i cigni neri esistono[2]. Reputare la spiegazione percepita “normale” (o utile, a secondo dei punti di vista) come quella più oggettivamente accreditata è un grave errore epistemologico.
Soluzioni giocate sull’onere della prova – ad esempio pretendendo dal sospettato la dimostrazione che vi sarebbe stata, magari, una contaminazione di laboratorio o un qualche altro trasferimento di materiale[3] – sono ugualmente inaccettabili. Il grado di incertezza rispetto alla attività umana all’origine del materiale biologico è intrinseco al tipo di analisi svolta; porre questo grado di incertezza a carico del sospettato vorrebbe dire porre a suo carico l’incertezza intrinseca al significato probatorio di quella certa prova scientifica. Con un duplice risultato paradossale. Che le circostanze non note ricadrebbero tutte su chi deve difendersi, con palese inversione di quanto spetta all’accusa dimostrare e che quanto più la prova utilizza tecniche moderne tanto più la possibilità di difesa del sospettato risulterebbe compromessa.
La misura della “diversità” la deve fornire l’esperto perché cade sotto il dominio delle competenze tecniche. Quindi, non sarà più sufficiente chiedere al genetista di confrontare quel certo materiale biologico con il profilo genetico del solito mister X. La domanda da porre dovrà essere più complessa; oserei dire molto più complessa.
3. Per capire come procedere, bisogna fare un passo di lato e affrontare il tema del modo di presentare le conclusioni da parte dell’esperto. Fortunatamente è finita – o almeno dovrebbe esserlo – l’epoca in cui i genetisti si sbizzarrivano concludendo i propri elaborati con l’indicazione di numeri percentuali. Questi numeri sono fuorvianti per l’umanista, che non riesce a comprenderne il significato o perché attribuisce concludenza a valori invece del tutto insignificanti per la genetica (94, 95 %...) o perché ambisce a quel 100% che la scienza non potrà mai fornire.
Le linee guida dell’Enfsi[4] – il network europeo dei laboratori forensi alle cui indicazioni tutti i migliori laboratori pubblici e privati si attengono – raccomandano di esprimere le conclusioni in termini di rapporto di verosimiglianza[5] (o LR, likelihood ratio). Il rapporto di verosimiglianza si basa sull’attribuzione di una probabilità di ottenere un determinato risultato scientifico date due proposizioni concorrenti. Quindi la conclusione dovrebbe esprimere il grado di supporto fornito dalla forensic evidence per una proposizione verbale rispetto al suo opposto. Le proposizioni concorrenti sono i predicati che esprimono l’affermazione dell’accusa rispetto a quella della difesa. Se le due proposizioni concorrenti saranno che quel determinato materiale biologico appartiene o non appartiene al sospettato, il rapporto di verosimiglianza esprimerà il grado di supporto che quel determinato profilo genetico estratto dal materiale biologico fornisce alla proposizione che il materiale biologico provenga dal sospettato piuttosto che non provenga da lui. Il valore di LR sarà numerico, dove 1 rende le due proposizioni equivalenti, valori superiori a 1 supportano la proposizione dell’accusa e valori inferiori ad 1 supportano la proposizione della difesa. Poiché la mente umana non allenata ha difficoltà a comprendere il valore dei numeri[6], le linee guida forniscono anche un equivalente verbale per classi di valore numerico (ad es. da 2 a 10, da 10 a 100, da 100 a 1000 e così via).
Il rapporto di verosimiglianza si esprime nel seguente modo:
Pr (Y I Hp,X) / Pr (Y I Hd, X)
Dove:
I sta per «dato che»…
Pr sta per probabilità
Y sta per evidenza scientifica
Hp sta per ipotesi accusa – prosecutor proposition
Hd sta per ipotesi difesa – defense proposition
X sta per altre circostanze note
Ora, al di là di possibile smarrimento iniziale, perché il giurista, di solito, non ama molto formule e simili, effettivamente il concetto è abbastanza semplice e, una volta digerito, diventa automatico. Ma anche qui le difficoltà possono aumentare.
Le linee guida dell’Enfsi spiegano che le proposizioni sulle quali costruire l’LR possono essere classificate in tre categorie o gerarchie: crime level (si riferisce al fatto che tizio ha commesso quel determinato reato, questo livello appartiene al giudice), activity level (si riferisce ad una determinata attività umana), source level (si riferisce alla fonte di un certo materiale). L’esempio che abbiamo fatto sopra esprime due proposizioni al source level visto che i due predicati in concorrenza postulano la provenienza o meno di quel materiale biologico da quella certa persona.
Ora, quando ci troviamo nelle condizioni descritte nel primo scenario del paragrafo 2., l’LR viene espresso al source level. Questo perché – come abbiamo visto – il fatto che quel materiale provenga o non provenga da una certa traccia attribuita a un determinato soggetto fornisce già un’informazione completa dal punto di vista probatorio[7]. Quando, invece, ci troviamo nel secondo scenario del medesimo paragrafo, il source level non basta più e quindi l’esperto deve esprimere una conclusione utilizzando proposizioni all’activity level. Secondo le linee guida si dovrebbe ricorrere all’activity level ogniqualvolta debbano essere valutati fattori quali trasferimento di materiale, persistenza, origine del materiale, che potrebbero avere rilievo sulla comprensione del valore probatorio del dato scientifico. Solitamente, ciò accade per quantitativi minimi o contaminati di materiale. Che è esattamente ciò che si verifica, appunto, nell’esempio della seconda parte del paragrafo 2. In altre parole, poiché in queste situazioni il dato scientifico non è univocamente correlato ad una certa attività umana, l’esperto deve essere chiamato a valutare le probabilità delle possibili correlazioni per evitare che il dato sia fuorviante per la corte. Ma, poiché complessità chiama complessità, questo passaggio non è affatto semplice.
4. A questo punto ci troviamo di fronte a un bivio ideale: a destra incontriamo le Colonne d’Ercole, a sinistra la propulsione a curvatura della nave Enterprise.
Scegliere le Colonne d’Ercole vuole dire fermarsi di fronte ad una conoscenza non dominabile dal giudice. Questo esito non sarebbe affatto irragionevole. Il processo penale deve alimentarsi di fonti di conoscenza che siano controllabili, valutabili e verificabili dal giudice. Quando queste fonti sono talmente specialistiche e complicate da non potere essere comprese neppure con il medio di un esperto, di fatto espongono la corte al pericolo di un effetto potentemente fuorviante (a meno che non si voglia trasformare il risultato del processo in un atto di fede verso il consulente/perito) e quindi sono fonti che non dovrebbero essere ammesse perché non rilevanti (cioè in concreto non in grado di aumentare il livello di conoscenza del giudice). D’altronde, l’idea sottesa alla sentenza Daubert – che anche la nostra suprema corte ha dimostrato di condividere da tempo[8] – è proprio quello di non esporre la corte a dati scientifici che non è in grado di dominare e che quindi sarebbero ingannevoli per il giudice. Il problema, forse sottovalutato dalla nostra giurisprudenza, è che la sentenza Daubert ha ormai celebrato il suo trentesimo anno e trent’anni, per la scienza, sono un’era geologica. Il confronto tra scienza buona e scienza immondizia (junk), tema al quale Daubert intendeva dare una soluzione, è espressione di una visione riduzionistica del problema. Anni di letteratura giuridica su vecchie e nuove scienze hanno atrofizzato il dibattito sulla scientificità/non scientificità di certe asserzioni[9]; mentre la questione attualizzata pone sfide differenti. Siamo, oggi, di fronte a tecniche che sono sicuramente accreditate dal punto di vista scientifica, che sono tutt’altro che junk science, ma che recano anche un intrinseco grado di interpretabilità/incertezza[10] tanto da riproporre in modo prepotente il tema della loro “ingannevolezza” per la corte. Forse dovremo prendere atto e dichiarare che determinate applicazione scientifiche sono semplicemente unfit per l’uso giudiziario. E forse dovremmo superare l’idea che il processo penale debba impiegare la scienza e la tecnologia più avanzata disponibile sul mercato, forse dovrebbe accontentarsi della scienza e della tecnologia più comprensibile sul mercato perché in grado di fornire una decisione più prevedibile, controllabile e, in ultima analisi, più “giuridica”. Quindi, fermarsi alle Colonne d’Ercole vuol dire fermarsi a quello che la corte può ragionevolmente dominare.
Scegliere la propulsione a curvatura vuol dire pretendere di spingere al massimo il motore della scienza a supporto della decisione giudiziaria. E allora bisogna andare a fondo.
Abbiamo detto che l’LR esprime il rapporto tra due probabilità. Ora, nel caso di analisi genetica al source level possiamo attenderci che questa probabilità sia assegnata sulla base di dati pubblicati e indiscutibilmente solidi. Se dobbiamo analizzare un reperto in condizioni ottimali e valutare la probabilità che questa provenga dall’indagato piuttosto che da altri, di fatto l’LR coincide con la random match probability (o conditional match probability come preferisce Enfsi) calcolata sulla base delle frequenze alleliche note della popolazione di riferimento.
Quando passiamo all’activity level, la disponibilità e sufficienza di dati lineari consolidati viene meno e l’esperto produrrà una probabilità fondata sul suo giudizio soggettivo (probabilità soggettiva). Attenzione, questo non vuol dire certo arbitrio, ma argomentazione razionale, sicuramente motivata e trasparente, tuttavia suscettibile anche di differenti interpretazioni. Questa operazione richiede all’esperto di assumere il dato scientifico unitamente agli ulteriori dati fattuali osservati, per combinare le evidenze disponibili in un ragionamento logico che pesi le diverse possibili relazioni di quel determinato dato scientifico con una certa attività umana (il soggetto ha toccato il coltello durante l’aggressione/il soggetto non ha toccato il coltello durante l’aggressione). Un modo accreditato per costruire queste relazioni è quello di tracciare una rete bayesiana. La rete bayesiana è un modello grafico probabilistico che pone in relazione delle variabili (nodi). Partendo dalle due affermazioni in competizione, l’osservatore individua una serie di variabili ritenute rilevanti per discriminare tra le proposizioni in competizione (ad esempi, “la persona è un buon depositore di Dna”, c.d. shedder status). I nodi – che sono graficamente rappresentati da un ovale – sono connessi da frecce che ne indicano la dipendenza probabilistica. L’attivazione della rete, attraverso un software che gestisce le relazioni di probabilità, restituisce la probabilità di ciascuna delle ipotesi di lavoro e quindi l’LR a livello di attività. La spiegazione che ho cercato di dare non solo è sicuramente imprecisa, ma grandemente insufficiente e addirittura del tutto inutile per la semplice ragione che parliamo di uno strumento concettuale talmente articolato da richiedere l’accesso diretto alla letteratura specifica[11]. Qui si voleva solo trasmettere la percezione delle implicazioni di questo strumento.
Solo per completezza, mi pare utile svolgere le seguenti considerazioni. L’identificazione delle variabili è ovviamente rimessa a chi costruisce la rete, che quindi presuppone delle “scelte” da parte dell’esperto; la probabilità di ciascuna variabile deve essere supportata dalle conoscenze dell’utilizzatore del modello, che ne giustificherà l’attribuzione; il valore di LR cambia in base alle informazioni disponibili; quindi, aggiornando le informazioni cambia il risultato. Questi tre elementi di complicazione identificano plurimi snodi che possono essere oggetto di discussione in dibattimento. In aggiunta all’attendibilità intrinseco del metodo, ai software[12] utilizzati per il calcolo delle probabilità etc.. etc.. insomma, spero di essere riuscito a fare comprendere che i problemi che avevamo fino a ieri con i profili misti o gli effetti stocastici nei profili scarsi sembreranno davvero poca cosa.
A mia conoscenza, questa metodica è stata utilizzata quattro volte in attività giudiziaria reale.[13]. In una sola di queste quattro occasioni il lavoro dell’esperto è stato portato in dibattimento e ha condotto alla condanna dell’imputato.
5. In conclusione, il ricorso a capacità analitiche sempre più avanzate (qui abbiamo parlato di genetica, me le linee guida Enfsi valgono per molte altre scienze forensi, dalla fibroscopia alla dattiloscopia eccetera...) richiede anche modalità di valutazione e presentazione delle conclusioni parimenti elaborate e complesse[14]. Cioè le scienze forensi stanno generando risultati assolutamente esatti dal punto di vista scientifico, ma potenzialmente e pericolosamente fuorvianti in relazione al loro valore e significato probatorio[15].
Nei paragrafi precedenti ho indicato le strade alternative che il sistema giudiziario può imboccare di fronte a questo che, a tutti gli effetti, deve essere considerato un tema nuovo e differente dalla vecchia e trita querelle tra buona scienza e cattiva scienza. Francamente, ad oggi, non ho personalmente maturato una riflessione sufficientemente approfondita per manifestare preferenza netta per l’una o l’altra strada. Alla tentazione di avere tutto quello che la scienza può dare si contrappone la sfiducia nelle capacità del sistema giudiziario e dei suoi attori di compiere quel notevole sforzo organizzativo[16] e formativo che sarebbe assolutamente necessario.
Quello che, invece, è assolutamente scontato è la non accettabilità di soluzioni affidate al caso concreto, all’intuizionismo – che poi è arbitrio se non sorretto dalle necessarie conoscenze – del giudice; di atteggiamenti fondati sulla convinzione che il perito dei periti possa ancora gestire tutti i dati che la voracità del processo fagocita.
[1] L’eventualità, per nulla remota, è analizzata nel noto lavoro C. M. Cale, M. E. Earll, K. E. Latham,, G. L. Bush, Could Secondary Transfer Falsely Place Someone at the Crime Scene ?, in J. Forensic Sc., 2015
[2] La citazione si riferisce al famoso libro del matematico N. Taleb, Il Cigno Nero, Il Saggiatore, ed. 2023, circa l’occorrenza di serie causali imprevedibili nella vita reale.
[3] Sull’evoluzione della giurisprudenza in argomento, sia con riferimento alla genetica che ai reati informatici, rinvio a G. Gennari, Il contributo tecnico nell’accertamento dei reati informatici, in Cybercrime e responsabilità da reato degli enti, A. Monti (a cura di), Milano, Giuffrè, 2022, 115-116.
[4] Enfsi G uideline for Evaluative Reporting in Forensic Evidence, versione 010.2016; https://enfsi.eu/docfile/enfsi-guideline-for-evaluative-reporting-in-forensic-science/ Analogamente si possono consultare le line guida del GeFi che è la società scientifica che raccoglie i genetisti italiani ed è quindi il punto di riferimento nazionale per la genetica forense, https://www.gefi-isfg.org/temp/20112018100445.pdf
[5] Questo vale non solo per la genetica, ma per ogni analisi di comparazione su fibre, proiettili, impronte …
[6] In aggiunta agli stranoti studi di Kahneman merita lettura il classico D. HUff, Mentire con le statistiche, nella ormai risalente e unica traduzione italiana edita da M&A, 2007.
[7] Esattamente, secondo Enfsi, “Reporting analytical results at source level is adequate here because particular expert knowledge is not necessary for the court to interpret the findings at activity level. Because transfer and persistence are not an issue, there is no risk of the report being misleading: the source level information amounts to the activity”.
[8] Uno dei contributi più completi sullo stato della giurisprudenza e, allo stesso tempo, sintetici rimane sempre C. Conti, La prova scientifica alle soglie dei vent’anni dalla sentenza Franzese: vette e vertigini in epoca di pandemia, in Sistema Penale, 9 febbraio 2021.
[9] Sarebbe inutile oltre che impossibile ripercorrere tutta la letteratura. Basti citare uno dei volumi più moderni a ampi che è Prova scientifica e processo penale, G. Canzio, L Luparia (editori), Wolters Kluwer, Milano, 2022 (2° ed.)
[10] Non solo rispetto alla concludenza del dato scientifico per sé, ma pure rispetto al suo valore probatorio nel processo.
[11] F. Taroni, I. De March, P. Garbolino, S. Bozza, Prova genetica del DNA e risultati dissonanti: come valutare congiuntamente gli elementi scientifici di prova, in Diritto penale contemporaneo, 11/2018; D. Taylor et al., A template for constructing Bayesian networks in forensic biology cases when considering activity level preposition, in FSI: Genetics 33 (2018) 136-146; F. Taroni, S. Bozza, A. Biedermann, P. Garbolino, C. Aitken, Data Analysis in forensic science, Wiley, 2010, per una generale prospettiva bayesiana.
[12] Ad esempio il software Hugin.
[13] Nella prima occasione la rete è stata utilizzata per valutare se la probabilità di rinvenire il profilo genetico di un sospetto su due dita di un guanto usato per una rapina fosse maggiore ipotizzando che il soggetto avesse usato per ultimo il guanto durante l’aggressione piuttosto che no. (Proc pen. n. 3571/2021 rgnr, Procura della Repubblica presso il Tribunale di Asti). In tutti i casi l’esperto era il medesimo.
[14] Un approccio statistico alla dattiloscopia è quello di H. J. Swofford, A.J. Koertner, F. Zemp., M. Ausdemore, A. Liu, M.J. Salyards, A method for the statistical interpretation of friction ridge skin impression evidence: Method development and validation, in Forensic Science International 287 (2018), 113-126.
[15] Il prossimo “capitolo” da affrontare sarà certamente quello della biostatistica e del ruolo dell’informatica.
[16] Ad esempio non sarebbe il caso di iniziare a parlare di sezioni specializzate, di corti composte anche da non togati esperti come in altri settori del diritto ? Un modello organizzativo novecentesco fondato sul principio della sostituibilità e della indifferenza del magistrato persona fisica non sembra più sostenibile per realtà complesse come quelle di oggi.