Par quelles phases d’étude passe une nouvelle substance active avant d’arriver à la pratique clinique ? Quelles sont les différences dans la conception des essais cliniques ? Quels sont les aspects importants pour interpréter les résultats ? Cet article de FMC présente l’évolution des modèles d’essais cliniques dans les maladies inflammatoires chroniques de l’intestin (MICI) et explique comment les critères d’évaluation passent des mesures cliniques aux données basées sur les patients et comment les critères d’évaluation mixtes sont composés d’évaluations endoscopiques et basées sur les patients.
Vous pouvez passer le test de FMC sur notre plateforme d’apprentissage après avoir consulté le matériel recommandé. Pour ce faire, veuillez cliquer sur le bouton suivant :
Par quelles phases d’étude passe une nouvelle molécule avant d’arriver à la pratique clinique ? Quelles sont les différences dans la conception des essais cliniques ? Quels sont les aspects importants pour interpréter les résultats ? Cet article de FMC présente l’évolution des modèles d’essais cliniques dans les maladies inflammatoires chroniques de l’intestin (MICI) et explique comment les critères d’évaluation passent des mesures cliniques aux données basées sur les patients et comment les critères d’évaluation mixtes sont composés d’évaluations endoscopiques et basées sur les patients [1].
Différentes phases d’essais cliniques
Il existe différentes phases d’essais cliniques. La première phase – phase 1 – se déroule avec de petits groupes, généralement moins de 80 participants [2]. Parfois, il s’agit de volontaires sains sur lesquels les substances actives sont testées, surtout en ce qui concerne la sécurité et le dosage. L’objectif est d’évaluer la posologie, la voie d’administration et la sécurité [3,4].
Une fois ces facteurs testés, on passe aux phases 2a et 2b. La phase 2a est généralement consacrée à la preuve de concept, tandis que la phase 2b évalue l’efficacité/la sécurité et détermine le dosage et le déroulement des études de phase 3 [5]. Dans le domaine des maladies inflammatoires chroniques de l’intestin, c’est surtout la phase 2b qui est importante – il s’agit ici de comprendre exactement quelle dose et comment l’administrer afin d’obtenir la meilleure efficacité.
La phase 3 comprend généralement entre 500 et 1000 patients. Au cours de cette phase, il s’agit de vérifier si la sécurité et l’efficacité sont confirmées et si elles sont pertinentes. Les études de phase 3 sont soumises à des procédures statistiques strictes et à des designs rigoureux qui peuvent conduire à l’approbation. Ils sont généralement randomisés et en aveugle avec un placebo [6]. Il est important d’avoir la possibilité de comparer : soit avec un placebo, soit avec une autre substance active. Lors de l’interprétation des résultats, il convient également de vérifier si l’étude disposait d’un plan d’analyse statistique rigoureux et préétabli [6].
La pertinence de l’étude est influencée par les critères d’évaluation définis au départ : dans les MICI, la rémission clinique et la réponse clinique sont généralement des critères d’évaluation primaires. Les comparateurs actifs choisis comme contrôle déterminent la puissance des résultats [7,8].
Une fois que la substance active est approuvée et commercialisée, la phase d’observation 4 est lancée et permet d’inclure et de suivre un nombre beaucoup plus important de patients (>100 000). Les critères d’évaluation sont moins stricts, mais la période de suivi est plus longue. Dans cette phase, l’accent est mis sur d’autres aspects de la sécurité de la substance active qui, en raison de leur rareté, n’apparaissent que si l’on dispose d’un nombre suffisamment élevé de patients dans le cadre du monde réel.
Catégories de designs d’études cliniques et leurs limites
Les études contrôlées par placebo ne font pas toujours l’unanimité, car l’utilisation d’un placebo dans de nombreux essais cliniques semble poser des problèmes éthiques. Dans les MICI, les placebos sont donc utilisés pour une courte période (8-12 semaines d’induction) et avec un petit bras de contrôle (2:2:1). Si le patient ne présente pas de réponse après cette période, il peut également recevoir le verum par la suite. Des groupes de contrôle sont également développés pour de nombreuses études (études Umbrella/Plateforme).
Il faut ensuite trouver le bon comparateur : En général, le Standard of Care (SOC) ou le choix des thérapies standard par les médecins traitants peut déterminer la crédibilité des résultats [8,9]. Sans comparateur approprié, les études peuvent ne pas être en mesure de démontrer si un traitement à l’étude est supérieur à la pratique dominante et/ou s’il entraîne des biais [10].
Les comparateurs actifs peuvent ne pas convenir, en fonction, entre autres, de
- où l’étude a été menée – les études globales peuvent utiliser des schémas thérapeutiques plus anciens, moins efficaces ou plus toxiques [7].
- quand l’étude a été conçue – le SOC au moment de la planification de l’étude peut ne plus être le SOC à la fin de l’étude.
- si une Best Available Ther apy (BAT) vs. SOC est utilisée, surtout si un crossover est autorisé ; cela peut conduire à l’arrêt de la BAT en raison de la préférence du patient/médecin, en particulier dans le cas d’études open label.
Les études tête-à-tête permettent de comparer directement l’efficacité et la sécurité de deux traitements ou plus [11]. Cependant, il existe peu d’études comparatives directes(head-to-head) qui ne comparent que deux médicaments et ne permettent pas de tirer des conclusions sur les comparaisons avec d’autres substances actives. Les facteurs aggravants ici sont en outre les différences dans les populations d’étude, les critères d’évaluation, l’aveuglement (par rapport aux études open label) et les produits de comparaison [11,12].
Les études de phase 3 sont généralement conçues pour démontrer la supériorité d’un nouveau traitement par rapport au SOC. Ils peuvent être réalisés pour montrer que deux interventions ne diffèrent pas dans une direction de plus d’un montant arbitraire prédéterminé (test bilatéral). Il est alors important de concevoir l’étude avec une puissance statistique suffisante – ce qui nécessite une population d’échantillons plus importante [6,8,13–15].
Les études de non-infériorité ( NI), quant à elles, visent à démontrer qu’un nouveau traitement n’est pas moins efficace qu’une quantité donnée d’intervention standard (test unilatéral). Les interventions testées sont considérées comme non inférieures si la différence entre les traitements se situe dans une marge d’équivalence prédéfinie. La taille de l’échantillon nécessaire pour démontrer l’IN (et donc le coût de l’étude) est souvent prise en compte lors du choix d’un design d’IN, car elle peut être contrôlée en fixant la marge d’IN à certaines valeurs. Les études NI devraient généralement être réservées à l’évaluation du fait qu’un traitement est moins coûteux, moins toxique ou moins invasif que le SOC (Fig. 1).
L’une des limites des études NI est l’impossibilité d’interpréter les résultats comme une preuve d’efficacité, car elles ne peuvent pas faire la distinction entre un traitement efficace et un traitement moins efficace ou inefficace. De plus, il peut y avoir des biais s’il y a peu d’adhésion dans le groupe de contrôle (dans les études open label) de sorte que l’étude n’a en fait pas de groupe de comparaison pour le bras expérimental. Compte tenu des limites des études NI, les résultats d’efficacité dans les études de supériorité sont donc généralement plus faciles à interpréter.
Généralisation des populations d’étude aux patients du monde réel
Une fois qu’une étude est terminée, il faut s’assurer que la substance active est adaptée à la population à traiter. Une étude inclut un groupe spécifique de sujets qui ne correspond que rarement à la population générale : les participants à l’étude sont généralement plus jeunes et présentent moins de comorbidités que les patients réels hétérogènes, ce qui entraîne une plus grande fréquence d’événements indésirables (EI) dans les populations cibles après l’autorisation [10]. Avec la prise de conscience croissante de la nécessité d’adapter les résultats des études aux patients réels, l’évaluation de la généralisation, appelée Generalizability Assessment, prend de l’ampleur. Les évaluations de la généralisabilité peuvent être distinguées en fonction du moment où l’évaluation a eu lieu [17]:
A priori : généralisation basée sur l’aptitude (c’est-à-dire que l’on utilise principalement des critères d’aptitude avant le début de l’étude), qui évalue dans quelle mesure la population étudiée est représentative de la population cible.
A posteriori : généralisation basée sur l’échantillonnage (c’est-à-dire après l’étude), qui évalue dans quelle mesure l’échantillon de l’étude (patients inscrits) est représentatif de la population cible.
Cependant, peu d’études utilisent la méthode a priori ; la plupart des études sont conçues de telle sorte que les préoccupations relatives à la généralisation ne peuvent être identifiées qu’après la fin de l’étude, ce qui constitue une occasion manquée de concevoir l’étude de manière à ce qu’elle soit applicable à la population cible.
L’importance de la généralisation est soulignée par l’appréciation croissante des preuves du monde réel (RWE) pour étayer l’utilisation, les bénéfices et les risques d’une nouvelle thérapie [18,19]: les RWE, qui se réfèrent à la sécurité post-commercialisation, sont de plus en plus prises en compte dans les décisions réglementaires et dans la conception des essais cliniques et des études d’observation.
Dans ce contexte, RWE complète les essais contrôlés randomisés (ECR), qui sont des expériences soigneusement contrôlées visant à tester des hypothèses spécifiques sur l’efficacité et la sécurité de nouveaux médicaments qui, de par leur conception, ne correspondent pas nécessairement à la pratique clinique actuelle. Ainsi, lorsqu’il existe une molécule ou une classe de médicaments disposant d’une grande quantité de données issues d’essais cliniques, le RWE peut contribuer à la connaissance de la sécurité des patients et à l’évaluation de l’efficacité comparée des médicaments.
Évolution des critères cliniques au fil du temps
Au fil du temps, les critères d’évaluation cliniques ont également évolué : d’une part, en raison du développement de nouvelles molécules et de nouveaux mécanismes permettant de mieux guérir les maladies, et d’autre part, en raison d’une plus grande attention portée aux patients. Les résultats rapportés au patient (Patient Reported Outcomes – PRO) tiennent compte de cette évolution. Aujourd’hui, les patients peuvent utiliser des tablettes pour saisir eux-mêmes des scores cliniques et donner leur avis.
De nombreuses études continuent de travailler avec des résultats rapportés cliniques tels que le score CDAI ou MAYO, mais de plus en plus d’analyses sont effectuées dans le sens de la fréquence des selles et des douleurs abdominales dans la maladie de Crohn ou de la fréquence des selles et du sang dans la colite ulcéreuse, qui correspondent mieux aux biomarqueurs cliniques ou inflammatoires (par ex. CRP, fCal). Les Observational Reported Outcomes (généralement évalués par les infirmières) et l’évolution endoscopique (en tant que critère d’évaluation de substitution, insuffisant à lui seul) sont également pris en compte dans le tableau général [1]. Les principaux PROs dans le domaine des MICI, tels que la fréquence des selles, les douleurs abdominales ou l’urgence, sont présentés dans le tableau 1.
Enfin, il y a des aspects qui sont importants en premier lieu pour le patient, mais qui jouent également un rôle à long terme pour les soignants, comme la qualité de vie. Celle-ci peut être évaluée par différents scores généraux, mais aussi par un score spécifique, le 32-item Inflammatory Bowel Disease Questionnaire (IBDQ-32) [20]. Il existe également des facteurs tels que les aspects économiques ou commerciaux, pour lesquels il existe des scores respectifs – cela fait beaucoup de questionnaires pour le patient, mais ces questionnaires sont pertinents pour obtenir une image globale plus pertinente.
Endpoints composites et test hiérarchique
Les limitations concernent surtout les anciens scores tels que CDAI et MAYO (tableau 2), qui sont souvent quelque peu subjectifs et ne permettent pas une analyse complète des critères d’évaluation. Cela concerne encore plus la maladie de Crohn que la colite ulcéreuse, car les symptômes de la maladie de Crohn sont plus faciles à évaluer.
Les critères composites, qui combinent des marqueurs objectifs de l’inflammation avec des PRO qualifiés, visent à rassembler la multitude d’aspects différents. L’objectif est de développer et finalement de mettre sur le marché des traitements qui sont à la fois efficaces et sûrs.
Dans certaines études, les différents critères d’évaluation sont ensuite testés de manière hiérarchique et contrôlés pour les erreurs de type I en définissant préalablement le critère d’évaluation primaire dans le protocole d’étude [6,21,22]. Celui-ci doit être positif ou au moins montrer une différence, de sorte que l’étude soit positive. D’autres analyses, appelées endpoints secondaires, ne seront effectuées que si l’endpoint primaire est positif ou plus pertinent. Il en résulte une hiérarchie de différentes analyses, sous-groupes ou endpoints, que l’on ne peut interpréter que si l’aspect défini précédemment dans l’ordre était positif (fig. 2). Si un critère n’atteint pas la significativité statistique dans la hiérarchie (facteur limitant le niveau), aucune autre statistique n’est réalisée et tous les critères situés plus bas dans la hiérarchie ne sont pas considérés comme des résultats statistiquement significatifs/positifs.
Dans la conception des essais cliniques, plusieurs aspects peuvent compliquer l’analyse et l’interprétation finales et déterminer si une étude est réellement aussi pertinente qu’elle le voudrait. Il s’agit notamment du crossover des sujets entre le groupe de contrôle et le groupe expérimental ou de l’apparition de biais (tableau 3).
L’association d’un agent biologique et d’un immunosuppresseur s’est révélée efficace et sûre dans le traitement des maladies inflammatoires chroniques de l’intestin. Un nouveau concept thérapeutique émergent est le traitement combiné avancé (Advanced Combination Treatment, ACT [23]), qui consiste à combiner au moins deux agents biologiques ou un agent biologique et un médicament de faible poids moléculaire ayant des mécanismes d’action différents afin d’obtenir un contrôle optimal de la maladie chez certains patients [24]. L’idée est que l’action simultanée sur plusieurs voies de signalisation pathogènes peut apporter un bénéfice supplémentaire ou, dans le meilleur des cas, synergique, ce qui pourrait être une option pour les patients chez qui une monothérapie seule n’a pas permis de contrôler la maladie ou qui présentent des maladies inflammatoires à médiation immunitaire concomitantes. Par exemple, l’étude de phase 2a VEGA a montré que le traitement d’induction combiné par guselkumab et golimumab était plus efficace que la monothérapie avec l’une des deux substances chez les patients atteints de colite ulcéreuse, sans que cela n’entraîne de problèmes de sécurité accrus [25].
Études tête-bêche
Historiquement, les études tête-à-tête dans le domaine des MICI ont d’abord commencé par l’analyse des stéroïdes. À la fin des années 1970, la sulfasalazine a été comparée à la prednisone et l’azathioprine à un placebo dans la maladie de Crohn. En 2010, SONIC [26] a été la première étude de tête dans les MICI à inclure un traitement biologique (infliximab + azathioprine vs infliximab vs azathioprine dans la maladie de Crohn) et à démontrer que les anti-TNF associés aux thiopurines entraînaient une amélioration significative. En 2017, la première étude tête-à-tête a suivi, comparant un médicament biologique original à un biosimilaire chez des patients atteints de MCE (infliximab dans la MC) [27]. Dans un tel cas, il n’est finalement pas nécessaire de démontrer beaucoup plus que les médicaments agissent également de la même manière, puisque vous souhaitez les utiliser pour la même indication.
Aujourd’hui, les comparaisons tête-bêche sont parfois déjà incluses dans les études de phase 3, dans la mesure où l’étude pivot possède déjà un bras comparatif. Deux exemples sont l’étude SEAVUE [28], qui compare l’adalimumab à l’ustékinumab, et l’étude VARSITY [29], qui compare l’adalimumab au vedolizumab.
Dans les études tête-à-tête, plusieurs aspects doivent être pris en compte et considérés, notamment les influences subjectives des investigateurs ou ce que l’on appelle la censure, qui consiste à supprimer les observations des patients, par exemple s’ils sont perdus de vue lors du suivi (aperçu 1).
Messages Take-Home
- Les critères d’évaluation des maladies inflammatoires chroniques de l’intestin évoluent rapidement.
- Les critères d’évaluation composites gagnent en importance : combinaison de mesures objectives et de PRO (les PRO sont plus subjectifs, les facteurs tels que les paramètres d’inflammation et l’endoscopie sont plus objectifs).
- Les PRO et les critères d’évaluation modulaires flexibles pourraient permettre de réaliser des études et d’obtenir des autorisations pour des traitements des MICI ciblant d’autres aspects des MICI, au-delà de l’inflammation.
- Les études cliniques en tête-à-tête sont importantes pour trancher entre différentes alternatives de traitement, mais leur interprétation doit être prudente.
Littérature :
- Thabane L, et al. : Un tutoriel sur les analyses de sensibilité dans les essais cliniques : le quoi, le pourquoi, le quand et le comment. BMC Med Res Method 2013 ; 13 : 92.
- Juillerat P : Clinical Trial Designs – How to distinguish differences and limitations ? IBDmatters – Conférence de formation continue CME ; https://medizinonline.com/ibd-matters-clinical-trial-designs/
- FDA : www.fda.gov/patients/drug-development-process/step-3-clinical-research ; dernier accès : 15.04.2024.
- NCI : Phases of Clinical Trials. www.cancer.gov/about-cancer/treatment/clinical-trials/what-are-trials/phases ; dernier accès : 15.04.2024.
- Le Tourneau C, et al : J Natl Cancer Inst 2009 ; 101(10) : 708-720.
- Yuan J, et al : J Biopharm Stat 2016 ; 26(5) : 912-923.
- Ananthakrishnan R, et al : Crit Rev Oncol Hematol 2013 ; 88 : 144-153.
- Prasad VK : Adv Drug Develop 2019 ; 17(3) : 150-152.
- ICH : www.fda.gov/media/71349/download ; dernier accès : 15.04.2024.
- FDA : www.fda.gov/media/130326/download ; dernier accès : 15.04.2024.
- Kim MS, Prasad V. : Cancer 2020 ; 126(19) : 4270-4272.
- Kim H, et al : Br J Clin Pharmacol 2013 ; 77(1) : 116-121.
- Karanicolas PJ, et al : Can J Surg 2010 ; 53(5) : 345-348.
- ICH : www.fda.gov/media/71336/download ; dernier accès : 15.04.2024.
- Head SJ, et al : Eur Heart J 2012 ; 33 : 1318-1324.
- Haslam A, et al : J Natl Compr Canc Netw 2020 ; 18(2) : 161-167.
- Pouillon, et al : Essais en tête-à-tête dans la maladie inflammatoire du côlon : passé, présent et futur. Nature Reviews Gastroenterology & Hepatology 2020 ; 17 : 365-376.
- He Z, et al : Clin Transl Sci 2020 ; 0 : 1-10.
- FDA : www.fda.gov/science-research/science-and-research-special-topics/real-world-evidence ; dernier accès : 15.04.2024.
- Sherman, et al : N Engl J Med 2016 ; 375 : 2293-2297.
- Yarlas A, et al : The Inflammatory Bowel Disease Questionnaire in Randomized Controlled Trials of Treatment for Ulcerative Colitis : Systematic Review and Meta-Analysis. J Patient Cent Res Rev 2020 ; 7(2) : 189-205 ; doi : 10.17294/2330-0698.1722.
- Korn EL, et al : In : Niederhuber JE, et al, eds : Abeloff’s Clinical Oncology, 6th ed. 2020 : 296-307.
- FDA : www.fda.gov/media/102657/download ; dernier accès : 15.04.2024.
- Solitano V, et al : Advanced Combination Treatment With Biologic Agents and Novel Small Molecule Drugs for Inflammatory Bowel Disease. Gastroenterol Hepatol 2023 ; 19(5) : 251-263.
- Danese S, et al : L’avenir du développement de médicaments pour la maladie inflammatoire du côlon : le besoin d’ACT (traitement combiné avancé). Gut 2022 ; 71(12) : 2380-2387.
- Feagan BG, et al., VEGA Study Group : Guselkumab plus golimumab combination therapy versus guselkumab or golimumab monotherapy in patients with ulcerative colitis (VEGA) : a randomised, double-blind, controlled, phase 2, proof-of-concept trial. Lancet Gastroenterol Hepatol 2023 ; 8(4) : 307-320.
- Colombel JF, et al : Infliximab, Azathioprine, or Combination Therapy for Crohn’s Disease. N Engl J Med 2010 ; 362 : 1383-1395 ; doi : 10.1056/NEJMoa0904492.
- Duk Ye B, et al : Efficacité et sécurité du biosimilaire CT-P13 comparé à l’infliximab d’origine chez les patients atteints de la maladie de Crohn active : une étude internationale, randomisée, en double aveugle, de phase 3 non-infériorité. Lancet 2019 ; 393 : 1699-1707.
- Sands BE, et al. : Ustekinumab versus adalimumab pour l’induction et le traitement d’entretien chez les patients biologiquement naïfs atteints de la maladie de Crohn modérément à sévèrement active : une étude multicentrique, randomisée, en double aveugle, en groupes parallèles, phase 3b. Lancet 2022 ; 399(10342) : 2200-2211 ;
doi : 10.1016/S0140-6736(22)00688-2. - Sands BE, et al : Vedolizumab versus Adalimumab for Moderate-to-Severe Ulcerative Colitis. N Engl J Med 2019 ; 381 : 1215-1226 ; doi : 10.1056/NEJMoa1905725.
- Zhang J, et al : Systematic bias between blind independent central review and local assessment : literature review and analyses of 76 phase III randomised controlled trials in 45 688 patients with advanced solid tumour. BMJ Open 2018 ; 8 : e017240 ;
doi : 10.1136/bmjopen-2017-017240. - FDA : www.fda.gov/media/71195/download ; dernier accès : 15.04.2024.
PRATIQUE DU MÉDECIN DE FAMILLE 2024 ; 19(7) : 4-9