Ogni giorno, la comunità oncologica è sommersa da nuovi dati e risultati di studi. E uno è onnipresente: il valore p. Sfuggire al suo incantesimo e tenersi aggiornati allo stesso tempo è come un’impossibilità. Dopo tutto, è lui che decide, per esempio, se un nuovo farmaco è classificato come efficace o meno. Ma cosa significa esattamente il valore p?
Prima di tutto: più piccolo è, meglio è. Questo è generalmente vero in questo caso e dovrebbe essere familiare alla maggior parte delle persone – anche se lo studio delle statistiche risale a qualche anno fa e l’interesse è limitato. Tuttavia, questa grossolana semplificazione rende un’ingiustizia al valore p, perché c’è molto di più. Molto di più che non è così difficile da capire.
Senso e scopo
Il valore p ha esattamente un compito. Il suo unico scopo è quello di mantenere o rifiutare l’ipotesi nulla. Ad esempio, il valore p determina se accettiamo l’ipotesi che le oncologhe siano più intelligenti dei chirurghi ortopedici. La nostra ipotesi nulla in questo caso sarebbe “le donne oncologhe sono altrettanto intelligenti dei chirurghi ortopedici”. Se il valore p calcolato è inferiore al livello di significatività, che viene impostato in anticipo, possiamo assumere che la nostra ipotesi nulla sia falsa, cioè che gli oncologi siano – secondo le nostre aspettative – più intelligenti dei chirurghi ortopedici. Se, invece, il valore p è superiore al livello di significatività, dobbiamo mantenere l’ipotesi nulla: la presunta differenza di intelligenza non è statisticamente significativa.
E qual è il livello di significatività ora, per favore?
Il livello di significatività è stabilito dagli stessi autori dello studio, nella maggior parte dei casi al 5%. Ecco come nasce la famosa immagine p<0,05, che conosciamo molto bene grazie a diverse pubblicazioni – e spesso è quello che vogliamo vedere. Per p<0,05 significa che l’ipotesi nulla può essere respinta al livello di significatività specificato del 5%, ossia che gli oncologi sono più intelligenti dei chirurghi ortopedici. Il livello di significatività selezionato rappresenta un valore limite. Descrive la probabilità tollerata di commettere un errore rifiutando l’ipotesi nulla. Con un livello di significatività del 5%, nel nostro esempio per l’accettazione della nostra ipotesi (che gli oncologi sono più intelligenti dei chirurghi ortopedici) assumiamo che il rischio di fare un’affermazione falsa in questo senso deve essere inferiore al 5%. Se abbassiamo il valore critico all’1%, la probabilità di errore è corrispondentemente più bassa, ma è anche più difficile confermare la nostra ipotesi. Al contrario, possiamo aumentare il livello di significatività al 50% – con la conseguenza che la nostra affermazione ha il 50% di probabilità di essere falsa e quindi è priva di rilevanza.
Comprendendo il livello di significatività, ora è facile capire anche la dichiarazione del valore p. Questo perché indica il rischio di commettere un errore rifiutando l’ipotesi nulla. Si tratta quindi di una misura della probabilità del risultato o di risultati più estremi se l’ipotesi nulla è vera. Quindi, se il nostro studio conclude che gli oncologi hanno in media 20 punti di QI in più rispetto ai chirurghi ortopedici, il valore p è una misura della probabilità di osservare una differenza di QI di 20 o più punti di QI nel nostro campione, quando in realtà non esiste alcuna differenza di QI. Se il valore p è 0,01, la probabilità di commettere un tale errore è dell’1%. In questo caso, se non c’è differenza di QI nella popolazione, è probabile solo l’1% che si estragga un campione con una differenza di 20 punti di QI o più. Va bene?
Fonte: Fahrmeir L, et al.: Statistik: Der Weg zur Datenanalyse. 8ª ed. Springer Spektrum; 2016.
InFo ONCOLOGIA & EMATOLOGIA 2021; 9(3): 26
InFo PNEUMOLOGIA & ALLERGOLOGIA 2021; 3(4): 27