Le differenze nel design e il loro significato per l'interpretazione

Quali fasi di studio attraversa un nuovo principio attivo prima di arrivare alla pratica clinica? Quali sono le differenze nei disegni degli studi clinici? Quali aspetti sono importanti per l’interpretazione dei risultati? In questo articolo di formazione ECM, verrà illustrato lo sviluppo dei disegni degli studi clinici nelle malattie infiammatorie intestinali (IBD) e verrà spiegato come gli endpoint cambiano dalle misurazioni cliniche ai dati basati sul paziente e come gli endpoint misti siano composti da valutazioni endoscopiche e basate sul paziente.

Può sostenere il test ECM nella nostra piattaforma di apprendimento dopo aver esaminato i materiali consigliati. Clicchi sul seguente pulsante:

Avviare il test ECM

Quali fasi di studio attraversa un nuovo principio attivo prima di arrivare alla pratica clinica? Quali sono le differenze nei disegni degli studi clinici? Quali aspetti sono importanti per l’interpretazione dei risultati? In questo articolo di formazione ECM, viene illustrato lo sviluppo dei disegni degli studi clinici nelle malattie infiammatorie intestinali (IBD) e viene spiegato come gli endpoint cambiano dalle misurazioni cliniche ai dati basati sul paziente e come gli endpoint misti siano composti da valutazioni endoscopiche e basate sul paziente [1].

Le diverse fasi degli studi clinici

Esistono diverse fasi degli studi clinici. La prima fase – la fase 1 – si svolge con gruppi più piccoli, di solito inferiori a 80 partecipanti [2]. A volte anche con volontari sani, sui quali vengono testati i principi attivi, soprattutto per quanto riguarda la sicurezza e il dosaggio. [3,4]L’obiettivo è valutare il dosaggio, la forma di somministrazione e la sicurezza.

Una volta testati questi fattori, seguono le fasi 2a e 2b. Nella fase 2a, viene tipicamente testata la prova di concetto, mentre la fase 2b valuta l’efficacia/sicurezza e determina il dosaggio e la procedura per gli studi di fase 3 [5]. Nell’ambito delle malattie infiammatorie croniche intestinali, la fase 2b è particolarmente importante: l’obiettivo è capire esattamente il dosaggio e la modalità di somministrazione per ottenere la migliore efficacia.

La Fase 3 di solito coinvolge tra i 500 e i 1000 pazienti. L’obiettivo di questa fase è determinare se la sicurezza e l’efficacia sono confermate e se sono rilevanti. Gli studi di Fase 3 sono soggetti a rigorose procedure statistiche e a disegni rigorosi che possono portare all’autorizzazione. Di solito sono randomizzati e in cieco rispetto al placebo [6]. È importante avere la possibilità di confrontare: con un placebo o con un altro principio attivo. Quando si interpretano i risultati, è anche importante verificare se lo studio aveva un piano di analisi statistica rigoroso e predeterminato [6].

L’importanza dello studio è influenzata dagli endpoint definiti all’inizio: nelle IBD, la remissione clinica e la risposta clinica sono solitamente endpoint primari. I comparatori attivi selezionati come controlli determinano la significatività dei risultati [7,8].

Una volta che il principio attivo è stato autorizzato ed è sul mercato, segue la fase 4, in cui possono essere inclusi e osservati molti più pazienti (>100.000). Gli endpoint sono definiti in modo meno rigoroso, ma il periodo di follow-up è più lungo. In questa fase, l’attenzione si concentra principalmente su ulteriori aspetti di sicurezza del principio attivo, che, a causa della loro rarità, si presentano solo se è disponibile un numero corrispondente di pazienti nel mondo reale.

Categorie di disegni di studi clinici e loro limiti

Gli studi controllati con placebo non sono sempre incontestabili, in quanto l’uso di un placebo in molti studi clinici sembra essere eticamente discutibile. Nelle IBD, i placebo vengono quindi utilizzati per un breve periodo (8–12 settimane di induzione) e con un piccolo braccio di controllo (2:2:1). Se il paziente non mostra alcuna risposta dopo questo periodo, può ricevere il verum anche successivamente. I gruppi di controllo vengono sviluppati anche per numerosi studi (studi ombrello/piattaforma).

Poi bisogna trovare il giusto comparatore: In generale, lo standard di cura (SOC) o la scelta di terapie standard da parte dei medici curanti può determinare la credibilità dei risultati [8,9]. In assenza di comparatori appropriati, gli studi potrebbero non essere in grado di dimostrare se una terapia sperimentale è superiore alla pratica prevalente e/o porta a pregiudizi [10].

I comparatori attivi potrebbero non essere adatti, a seconda di questo, tra le altre cose:

dove è stato condotto lo studio – negli studi globali, possono essere utilizzati regimi di trattamento più vecchi, meno efficaci o più tossici [7].
quando lo studio è stato progettato – il SOC al momento della pianificazione dello studio potrebbe non essere più il SOC alla fine dello studio.
se viene utilizzata la migliore terapia disponibile (BAT) rispetto al SOC, soprattutto se è consentito il crossover; questo può portare all’interruzione della BAT a causa della preferenza del paziente/medico, soprattutto negli studi in aperto.

Gli studi testa a testa consentono un confronto diretto dell’efficacia e della sicurezza di due o più trattamenti [11]. Tuttavia, esistono solo pochi studi comparativi diretti (testa a testa) in cui vengono confrontati solo due farmaci e che non consentono di trarre conclusioni sul confronto con altri principi attivi. [11,12]Altri fattori di complicazione sono le differenze tra le popolazioni dello studio, gli endpoint, l’accecamento (rispetto agli studi open-label) e i prodotti di confronto.

Gli studi di fase 3 sono solitamente progettati per dimostrare la superiorità di un nuovo trattamento rispetto al SOC. Possono essere condotti per dimostrare che due interventi non differiscono in nessuna delle due direzioni per più di una quantità arbitraria prestabilita (test a due lati). È importante progettare lo studio con una potenza statistica sufficiente – questo richiede una popolazione campione più ampia [6,8,13–15].

Gli studi di non inferiorità (NI), invece, sono progettati per dimostrare che un nuovo trattamento non è meno efficace di una certa quantità di intervento standard (test unilaterale) . Gli interventi testati sono considerati non-inferiori se la differenza tra i trattamenti rientra in un intervallo di equivalenza predefinito. Le dimensioni del campione necessarie per dimostrare la NI (e quindi i costi dello studio) sono spesso prese in considerazione quando si sceglie un disegno NI, in quanto possono essere controllate impostando il margine NI su determinati valori. Gli studi NI dovrebbero essere generalmente riservati a valutare se un trattamento è meno costoso, meno tossico o meno invasivo rispetto al SOC (Fig. 1).

I limiti degli studi NI includono l’impossibilità di interpretare i risultati come prova di efficacia, in quanto non possono distinguere tra un trattamento efficace e uno meno efficace o inefficace. Inoltre, possono verificarsi dei pregiudizi se c’è poca adesione nel gruppo di controllo (negli studi open-label), in modo che lo studio non abbia un gruppo di confronto per il braccio sperimentale. Date le limitazioni degli studi NI, i risultati di efficacia negli studi di superiorità sono quindi generalmente più facili da interpretare.

Generalizzabilità delle popolazioni di studio ai “pazienti del mondo reale”.

Una volta completato uno studio, è importante assicurarsi che il principio attivo sia adatto anche alla popolazione da trattare. [10]Uno studio include un gruppo specifico di soggetti che raramente corrisponde alla popolazione generale: i partecipanti allo studio sono solitamente più giovani e con meno comorbidità rispetto ai pazienti eterogenei del mondo reale, il che significa che gli eventi avversi (AEs) si verificano più frequentemente nelle popolazioni target dopo l’autorizzazione. Con la crescente consapevolezza della necessità di adattare i risultati degli studi ai pazienti reali, la valutazione della generalizzabilità, la cosiddetta valutazione di generalizzabilità, è in aumento. [17]Le valutazioni di generalizzabilità possono essere differenziate in base al momento in cui è stata effettuata la valutazione:

A priori: generalizzabilità legata all’eleggibilità (cioè i criteri di eleggibilità sono utilizzati principalmente prima dell’inizio dello studio), che valuta quanto la popolazione dello studio sia rappresentativa della popolazione target.

A posteriori: generalizzabilità guidata dal campione (cioè dopo lo studio), che valuta quanto il campione dello studio (pazienti arruolati) sia rappresentativo della popolazione target.

Tuttavia, pochi studi utilizzano il metodo a priori; la maggior parte degli studi è progettata in modo tale che le preoccupazioni sulla generalizzabilità diventano evidenti solo dopo la conclusione dello studio, perdendo l’opportunità di progettare lo studio in modo che sia applicabile alla popolazione target.

L’importanza della generalizzabilità è evidenziata dal crescente apprezzamento dell’evidenza del mondo reale (RWE) per supportare l’uso, i benefici e i rischi di una nuova terapia: la RWE, che riguarda la sicurezza post-marketing, viene sempre più considerata nelle decisioni normative e nella progettazione di studi clinici e studi osservazionali [18,19].

La RWE integra gli studi controllati randomizzati (RCT), che sono esperimenti accuratamente controllati e progettati per testare ipotesi specifiche sull’efficacia e la sicurezza di nuovi farmaci, che non riflettono necessariamente la pratica clinica attuale. Quindi, se esiste un principio attivo o una classe di farmaci con una grande quantità di dati provenienti da studi clinici, la RWE può contribuire alla conoscenza della sicurezza del paziente e alla valutazione dell’efficacia comparativa dei farmaci.

Sviluppo di endpoint clinici nel tempo

Nel corso del tempo, anche gli endpoint clinici sono cambiati: da un lato a causa dello sviluppo di nuovi principi attivi e meccanismi che portano a una migliore cura delle malattie, ma anche per quanto riguarda una maggiore attenzione al paziente. I cosiddetti Patient Reported Outcomes (PROs) ne tengono conto. Al giorno d’oggi, i pazienti possono utilizzare dei tablet per inserire autonomamente i punteggi clinici e contribuire con le loro valutazioni.

Molti studi continuano a lavorare con esiti riferiti clinicamente, come il CDAI o il punteggio MAYO, ma un numero sempre maggiore analizza anche la frequenza delle feci e il dolore addominale nella malattia di Crohn o la frequenza delle feci e il sangue nella colite ulcerosa, che si adattano meglio ai biomarcatori clinici o infiammatori (ad esempio CRP, fCal). Nel quadro generale sono inclusi anche i risultati riferiti dall’osservazione (solitamente valutati dal personale infermieristico) e lo sviluppo endoscopico (come endpoint surrogato, non sufficiente da solo) [1]. I PRO più importanti nell’ambito delle IBD, come la frequenza delle feci, il dolore addominale o l’urgenza, sono mostrati nella Tabella 1.

Infine, ci sono aspetti che sono importanti soprattutto per il paziente, ma che svolgono un ruolo anche per il medico a lungo termine, come la qualità della vita. Questa può essere valutata utilizzando vari punteggi generali, ma anche un punteggio specifico, il Questionario sulle Malattie Infiammatorie Intestinali (IBDQ-32), composto da 32 elementi [20]. Inoltre, ci sono anche fattori come gli aspetti economici o finanziari per i quali esistono punteggi – si tratta di molti questionari per il paziente, ma questi questionari sono rilevanti per ottenere un quadro generale più significativo.

Endpoint compositi e test gerarchici

Le limitazioni riguardano soprattutto i punteggi più vecchi, come il CDAI e il MAYO (Tabella 2), che spesso sono un po’ soggettivi e non possono essere utilizzati per analizzare in modo completo gli endpoint. Ciò riguarda la malattia di Crohn ancor più della colite ulcerosa, in quanto i sintomi della CU sono più facili da valutare.

Gli endpoint compositi, una combinazione di marcatori infiammatori oggettivi con PRO qualificati, vengono utilizzati nel tentativo di riunire la moltitudine di aspetti diversi. L’obiettivo è sviluppare e infine lanciare terapie che siano efficaci e sicure.

In alcuni studi, i vari endpoint vengono successivamente testati gerarchicamente e controllati per errori di tipo I, definendo in anticipo il cosiddetto endpoint primario nel protocollo dello studio [6,21,22]. Questo deve essere positivo o almeno mostrare una differenza, in modo che lo studio sia positivo. Ulteriori analisi, i cosiddetti endpoint secondari, avranno luogo solo se l’endpoint primario è positivo o è più rilevante. Questo crea una gerarchia di diverse analisi, sottogruppi o endpoint, che possono essere interpretati solo se l’aspetto precedentemente definito nella sequenza è positivo (Fig. 2). Se un endpoint nella gerarchia non raggiunge la significatività statistica (fattore di limitazione del livello), non vengono eseguite ulteriori statistiche e tutti gli endpoint inferiori nella gerarchia non sono considerati risultati statisticamente significativi/positivi.

Ci sono vari aspetti nella progettazione degli studi clinici che possono complicare l’analisi e l’interpretazione e possono determinare se uno studio ha effettivamente la rilevanza che vorrebbe avere. Questi includono un crossover di soggetti tra il gruppo di controllo e quello sperimentale o il verificarsi di pregiudizi (Tabella 3).

La combinazione di un agente biologico e di un immunosoppressore si è dimostrata efficace e sicura nel trattamento della malattia infiammatoria cronica intestinale. Un nuovo concetto terapeutico emergente è il Trattamento Combinato Avanzato (ACT) [23], che prevede la combinazione di almeno due agenti biologici o di un agente biologico e di un farmaco a piccola molecola con meccanismi d’azione diversi per ottenere un controllo ottimale della malattia in alcuni pazienti [24]. L’idea alla base è che l’influenza simultanea di diverse vie di segnalazione patogena possa fornire un beneficio additivo o, nel migliore dei casi, addirittura sinergico, che potrebbe offrire un’opzione soprattutto per i pazienti in cui il controllo della malattia non può ancora essere raggiunto con la sola monoterapia o che presentano malattie infiammatorie concomitanti immuno-mediate. Ad esempio, lo studio VEGA di fase 2a ha dimostrato che la terapia di induzione combinata con guselkumab e golimumab era più efficace nei pazienti con colite ulcerosa rispetto alla monoterapia con una delle due sostanze, senza alcun aumento dei problemi di sicurezza [25].

Studi testa a testa

Storicamente, gli studi testa a testa nel campo delle IBD sono iniziati con l’analisi degli steroidi. Alla fine degli anni ’70, la sulfasalazina è stata confrontata con il prednisone rispetto all’azatioprina rispetto al placebo nella malattia di Crohn. Nel 2010, SONIC è stato il primo studio testa a testa nelle IBD che ha incluso la terapia biologica (infliximab + azatioprina vs. infliximab vs. azatioprina nella malattia di Crohn) e ha dimostrato che gli anti-TNF in combinazione con le tiopurine hanno prodotto un miglioramento significativo [26]. A questo ha fatto seguito, nel 2017, il primo studio testa a testa di confronto tra un biologo originatore e un biosimilare nei pazienti con IBD (infliximab nella MC) [27]. In questo caso, in definitiva non è necessario dimostrare molto di più che i farmaci hanno lo stesso effetto, poiché devono essere utilizzati per la stessa indicazione.

Oggi, i confronti testa a testa sono talvolta già inclusi negli studi di fase 3, in quanto lo studio di autorizzazione ha già un braccio di confronto. Due esempi sono lo studio SEAVUE [28], in cui l’adalimumab viene confrontato con l’ustekinumab, e lo studio VARSITY [29], che confronta l’adalimumab con il vedolizumab.

Negli studi testa a testa, devono essere considerati e tenuti in considerazione diversi aspetti, tra cui le influenze soggettive degli sperimentatori o la cosiddetta censura, in cui le osservazioni dei pazienti vengono rimosse, ad esempio se hanno un abbandono al follow-up (Panoramica 1).

Messaggi da portare a casa

Gli endpoint delle malattie infiammatorie croniche intestinali cambiano rapidamente.
Gli endpoint compositi stanno acquisendo importanza: combinazione di misure oggettive e PRO (i PRO sono più soggettivi, i fattori come i parametri di infiammazione e l’endoscopia sono più oggettivi).
I PRO e gli endpoint modulari flessibili potrebbero consentire studi e approvazioni di terapie per l’IBD che mirano ad altri aspetti dell’IBD oltre all’infiammazione.
Gli studi clinici testa a testa sono importanti per decidere tra diverse alternative di trattamento, ma devono essere interpretati con cautela.

Letteratura:

Thabane L, et al: Un tutorial sulle analisi di sensibilità negli studi clinici: cosa, perché, quando e come. BMC Med Res Method 2013; 13: 92.
Juillerat P: Disegni di studi clinici – Come distinguere le differenze e i limiti? IBDmatters – Conferenza ECM; https://medizinonline.com/ibd-matters-clinical-trial-designs
FDA: www.fda.gov/patients/drug-development-process/step-3-clinical-research; ultimo accesso: 15/04/2024.
NCI: Fasi delle sperimentazioni cliniche. www.cancer.gov/about-cancer/treatment/clinical-trials/what-are-trials/phases; ultimo accesso: 15.04.2024.
Le Tourneau C, et al: J Natl Cancer Inst 2009; 101(10): 708-720.
Yuan J, et al: J Biopharm Stat 2016; 26(5): 912-923.
Ananthakrishnan R, et al: Crit Rev Oncol Hematol 2013; 88: 144-153.
Prasad VK: Adv Drug Develop 2019; 17(3): 150-152.
ICH: www.fda.gov/media/71349/download; ultimo accesso: 15/04/2024.
FDA: www.fda.gov/media/130326/download; ultimo accesso: 15/04/2024.
Kim MS, Prasad V.: Cancer 2020; 126(19): 4270-4272.
Kim H, et al: Br J Clin Pharmacol 2013; 77(1): 116-121.
Karanicolas PJ, et al: Can J Surg 2010; 53(5): 345-348.
ICH: www.fda.gov/media/71336/download; ultimo accesso: 15/04/2024.
Head SJ, et al: Eur Heart J 2012; 33: 1318-1324.
Haslam A, et al: J Natl Compr Canc Netw 2020; 18(2): 161-167.
Pouillon, et al: Studi testa a testa nella malattia infiammatoria intestinale: passato, presente e futuro. Nature Reviews Gastroenterology & Hepatology 2020; 17: 365-376.
He Z, et al: Clin Transl Sci 2020; 0: 1-10.
FDA: www.fda.gov/science-research/science-and-research-special-topics/real-world-evidence; ultimo accesso: 15/04/2024.
Sherman, et al: N Engl J Med 2016; 375: 2293-2297.
Yarlas A, et al: Il questionario sulla malattia infiammatoria intestinale negli studi controllati randomizzati sul trattamento della colite ulcerosa: revisione sistematica e meta-analisi. J Patient Cent Res Rev 2020; 7(2): 189-205; doi: 10.17294/2330-0698.1722.
Korn EL, et al: In: Niederhuber JE, et al, eds: Abeloff’s Clinical Oncology, 6th ed. 2020: 296-307.
FDA: www.fda.gov/media/102657/download; ultimo accesso: 15/04/2024.
Solitano V, et al: Trattamento combinato avanzato con agenti biologici e nuovi farmaci a piccole molecole per la malattia infiammatoria intestinale. Gastroenterol Hepatol 2023; 19(5): 251-263.
Danese S, et al: Il futuro dello sviluppo di farmaci per le malattie infiammatorie intestinali: la necessità di ACT (advanced combination treatment). Gut 2022; 71(12): 2380-2387.
Feagan BG, et al, Gruppo di studio VEGA: Terapia combinata guselkumab più golimumab rispetto alla monoterapia con guselkumab o golimumab in pazienti con colite ulcerosa (VEGA): uno studio randomizzato, in doppio cieco, controllato, di fase 2, proof-of-concept. Lancet Gastroenterol Hepatol 2023; 8(4): 307-320.
Colombel JF, et al: Infliximab, Azatioprina o terapia combinata per la malattia di Crohn. N Engl J Med 2010; 362: 1383-1395; doi: 10.1056/NEJMoa0904492.
Duk Ye B, et al: Efficacia e sicurezza del biosimilare CT-P13 rispetto all’originatore infliximab nei pazienti con malattia di Crohn attiva: uno studio internazionale, randomizzato, in doppio cieco, di fase 3 di non inferiorità. Lancet 2019; 393: 1699-1707.
Sands BE, et al: Ustekinumab rispetto ad adalimumab per la terapia di induzione e di mantenimento in pazienti biologici-naive con malattia di Crohn da moderatamente a gravemente attiva: uno studio multicentrico, randomizzato, in doppio cieco, a gruppi paralleli, di fase 3b.
Lancet 2022; 399(10342): 2200-2211; doi: 10.1016/S0140-6736(22)00688-2.
Sands BE, et al: Vedolizumab contro Adalimumab per la colite ulcerosa da moderata a grave. N Engl J Med 2019; 381: 1215-1226; doi: 10.1056/NEJMoa1905725.
Zhang J, et al: Distorsione sistematica tra la revisione centrale indipendente in cieco e la valutazione locale: revisione della letteratura e analisi di 76 studi randomizzati controllati di fase III su 45 688 pazienti con tumore solido avanzato. BMJ Open 2018; 8: e017240; doi: 10.1136/bmjopen-2017-017240.
FDA: www.fda.gov/media/71195/download; ultimo accesso: 15/04/2024.