Diferencias en el diseño y su importancia para la interpretación

¿Qué fases de estudio atraviesa un nuevo principio activo antes de llegar a la práctica clínica? ¿Qué diferencias existen en los diseños de los ensayos clínicos? ¿Qué aspectos son importantes para interpretar los resultados? En este artículo de formación CME se mostrará el desarrollo de los diseños de los ensayos clínicos en la enfermedad inflamatoria intestinal (EII) y se explicará cómo cambian los criterios de valoración de las mediciones clínicas a los datos basados en el paciente y cómo los criterios de valoración mixtos se componen de evaluaciones endoscópicas y basadas en el paciente.

Puede realizar el examen CME en nuestra plataforma de aprendizaje después de revisar los materiales recomendados. Haga clic en el siguiente botón:

Iniciar la prueba CME

¿Qué fases de estudio atraviesa una nueva sustancia activa antes de llegar a la práctica clínica? ¿Cuáles son las diferencias en los diseños de los ensayos clínicos? ¿Qué aspectos son importantes para interpretar los resultados? En este artículo de formación CME se muestra el desarrollo de los diseños de los ensayos clínicos en la enfermedad inflamatoria intestinal (EII) y se explica cómo cambian los criterios de valoración de las mediciones clínicas a los datos basados en el paciente y cómo los criterios de valoración mixtos se componen de evaluaciones endoscópicas y basadas en el paciente [1].

Diferentes fases de los estudios clínicos

Existen diferentes fases en los ensayos clínicos. La primera fase, la fase 1, tiene lugar con grupos más pequeños, normalmente de menos de 80 participantes [2]. A veces también con voluntarios sanos, en los que se prueban las sustancias activas, especialmente en lo que respecta a la seguridad y la dosificación. El objetivo es evaluar la dosis, la forma de administración y la seguridad [3,4].

Una vez probados estos factores, siguen las fases 2a y 2b. En la fase 2a se suele probar la prueba de concepto, la fase 2b evalúa la eficacia/seguridad y determina la dosis y el procedimiento para los ensayos de fase 3 [5]. En el ámbito de la enfermedad inflamatoria intestinal crónica, la fase 2b es especialmente importante: el objetivo aquí es comprender exactamente cuál debe ser la dosis y cómo debe administrarse para lograr la mejor eficacia.

En la fase 3 suelen participar entre 500 y 1.000 pacientes. El objetivo de esta fase es determinar si se confirman la seguridad y la eficacia y si son relevantes. Los ensayos de fase 3 están sujetos a procedimientos estadísticos estrictos y diseños rigurosos que pueden conducir a la autorización. Suelen ser aleatorios y ciegos al placebo [6]. Es importante tener la posibilidad de comparar: ya sea con un placebo o con otra sustancia activa. A la hora de interpretar los resultados, también es importante comprobar si el estudio contaba con un plan de análisis estadístico estricto y predeterminado [6].

La importancia del estudio se ve influida por los criterios de valoración definidos al principio: en la EII, la remisión clínica y la respuesta clínica suelen ser criterios de valoración primarios. Los comparadores activos seleccionados como controles determinan la importancia de los resultados [7,8].

Una vez que la sustancia activa ha sido autorizada y está en el mercado, sigue la fase 4, en la que se puede incluir y observar a un número significativamente mayor de pacientes (>100.000). Los criterios de valoración se definen aquí de forma menos estricta, pero el periodo de seguimiento es más largo. En esta fase, la atención se centra principalmente en otros aspectos de seguridad de la sustancia activa que, debido a su rareza, sólo se plantean si se dispone de un número correspondientemente elevado de pacientes en el mundo real.

Categorías de diseños de ensayos clínicos y sus limitaciones

Los estudios controlados con placebo no siempre están exentos de polémica, ya que el uso de un placebo en muchos estudios clínicos parece cuestionable desde el punto de vista ético. Por ello, en la EII se utilizan placebos durante un periodo corto (8–12 semanas de inducción) y con un pequeño brazo de control (2:2:1). Si el paciente no muestra respuesta después de este tiempo, también puede recibir el verum más adelante. También se desarrollan grupos de control para numerosos estudios (estudios paraguas/plataforma).

Entonces hay que encontrar el comparador adecuado: En general, el estándar de atención (SOC) o la elección de terapias estándar por parte de los médicos tratantes puede determinar la credibilidad de los resultados .[8,9] Sin comparadores apropiados, es posible que los estudios no puedan demostrar si una terapia en investigación es superior a la práctica predominante y/o da lugar a sesgos [10].

Los comparadores activos pueden no ser adecuados, dependiendo de esto, entre otras cosas:

el lugar en el que se realizó el estudio: en los estudios globales pueden utilizarse regímenes de tratamiento más antiguos, menos eficaces o más tóxicos [7].
cuando se diseñó el estudio: el SOC en el momento de la planificación del estudio puede que ya no sea el SOC al final del estudio.
Si se utiliza la mejor terapia disponible (MTD) frente al SOC, especialmente si se permite el cruce; esto puede llevar a que se interrumpa la MTD debido a la preferencia del paciente/médico, especialmente en los estudios abiertos.

Los estudios cara a cara permiten comparar directamente la eficacia y la seguridad de dos o más tratamientos [11]. Sin embargo, sólo existen unos pocos estudios comparativos directos(cabeza a cabeza) en los que sólo se comparan dos fármacos y que no permiten extraer conclusiones sobre las comparaciones con otras sustancias activas. Otros factores que complican esta situación son las diferencias en las poblaciones de estudio, los criterios de valoración, el cegamiento (en comparación con los estudios abiertos) y los productos de comparación [11,12].

Los ensayos de fase 3 suelen diseñarse para demostrar la superioridad de un nuevo tratamiento en comparación con el SOC. Pueden realizarse para demostrar que dos intervenciones no difieren en ninguna dirección en más de una cantidad arbitraria preespecificada (prueba de dos caras). Es importante diseñar el estudio con suficiente potencia estadística, lo que requiere una muestra de población más amplia [6,8,13–15].

Los estudios de no inferioridad (NI), por su parte, están diseñados para demostrar que un tratamiento novedoso no es menos eficaz que una cantidad determinada de la intervención estándar (prueba unilateral) . Las intervenciones probadas se consideran no inferiores si la diferencia entre los tratamientos se encuentra dentro de un rango de equivalencia predefinido. Los tamaños de muestra necesarios para demostrar la NI (y, por tanto, los costes del estudio) suelen tenerse en cuenta a la hora de elegir un diseño NI, ya que pueden controlarse fijando el margen NI en determinados valores. Por lo general, los estudios NI deben reservarse para evaluar si un tratamiento es menos costoso, menos tóxico o menos invasivo que el SOC (Fig. 1).

Las limitaciones de los estudios NI incluyen la imposibilidad de interpretar los resultados como prueba de eficacia, ya que no pueden distinguir entre un tratamiento eficaz y otro menos eficaz o ineficaz. Además, puede producirse un sesgo si hay poca adherencia en el grupo de control (en los estudios abiertos), de modo que el estudio básicamente no tiene grupo de comparación para el brazo experimental. Dadas las limitaciones de los estudios de IN, los resultados de eficacia en los estudios de superioridad son, por lo general, más fáciles de interpretar.

Generalizabilidad de las poblaciones de estudio a los “pacientes del mundo real”

Una vez finalizado un estudio, es importante asegurarse de que el principio activo también es adecuado para la población que se va a tratar. [10]Un estudio incluye un grupo específico de sujetos que rara vez se corresponde con la población general: los participantes en el estudio suelen ser más jóvenes y tener menos comorbilidades que los pacientes heterogéneos del mundo real, lo que significa que los acontecimientos adversos (AA) se producen con mayor frecuencia en las poblaciones diana tras la autorización . Con la creciente concienciación sobre la necesidad de adaptar los resultados de los estudios a los pacientes reales, está aumentando la evaluación de lageneralizabilidad, la llamada evaluación de generalizabilidad. Las evaluaciones de la generalizabilidad pueden diferenciarse en función del momento en que tuvo lugar la evaluación [17]:

A priori: generalizabilidad relacionada con la elegibilidad (es decir, los criterios de elegibilidad se utilizan principalmente antes del inicio del estudio), que evalúa hasta qué punto la población del estudio es representativa de la población objetivo.
A posteriori: generalizabilidad basada en la muestra (es decir, después del estudio), que evalúa hasta qué punto la muestra del estudio (pacientes inscritos) es representativa de la población objetivo.

Sin embargo, pocos estudios utilizan el método a priori; la mayoría se diseñan de tal forma que las preocupaciones sobre la generalizabilidad no se manifiestan hasta después de que el estudio haya finalizado, con lo que se pierde la oportunidad de diseñar el estudio para que sea aplicable a la población objetivo.

La importancia de la generalizabilidad se ve resaltada por la creciente apreciación de las pruebas del mundo real (RWE, por sus siglas en inglés) para respaldar el uso, los beneficios y los riesgos de una nueva terapia [18,19]: las RWE, que se refieren a la seguridad posterior a la comercialización, se tienen cada vez más en cuenta en las decisiones normativas y en el diseño de ensayos clínicos y estudios observacionales.

La EMR complementa los ensayos controlados aleatorios (ECA), que son experimentos cuidadosamente controlados diseñados para probar hipótesis específicas sobre la eficacia y la seguridad de nuevos fármacos que no reflejan necesariamente la práctica clínica actual. Así, si existe una sustancia activa o una clase de fármacos con una gran cantidad de datos procedentes de ensayos clínicos, la EMR puede contribuir al conocimiento sobre la seguridad de los pacientes y a la evaluación de la eficacia comparativa de los fármacos.

Desarrollo de criterios de valoración clínicos a lo largo del tiempo

Con el tiempo, los criterios de valoración clínicos también han cambiado: por un lado, debido al desarrollo de nuevas sustancias activas y mecanismos que conducen a una mejor curación de las enfermedades, pero también con respecto a una mayor atención al paciente. Los llamados Resultados Informados por el Paciente (PRO, por sus siglas en inglés) tienen esto en cuenta. Hoy en día, los pacientes pueden utilizar tabletas para introducir ellos mismos las puntuaciones clínicas y aportar sus valoraciones.

Muchos estudios siguen trabajando con resultados notificados clínicamente, como el CDAI o la puntuación MAYO, pero cada vez son más los que analizan también la frecuencia de las deposiciones y el dolor abdominal en la enfermedad de Crohn o la frecuencia de las deposiciones y la sangre en la colitis ulcerosa, que encajan mejor con los biomarcadores clínicos o inflamatorios (por ejemplo, PCR, fCal). También se incluyen en el cuadro general los resultados notificados por observación (normalmente evaluados por el personal de enfermería) y la evolución endoscópica (como criterio de valoración sustitutivo, no suficiente por sí solo) [1]. Los PRO más importantes en el ámbito de la EII, como la frecuencia de las deposiciones, el dolor abdominal o la urgencia, se muestran en la tabla 1.

Por último, hay aspectos que son principalmente importantes para el paciente, pero que también desempeñan un papel para el profesional a largo plazo, como la calidad de vida. [20]Esto puede evaluarse utilizando diversas puntuaciones generales, pero también una puntuación específica, el Cuestionario de la Enfermedad Inflamatoria Intestinal (IBDQ-32) de 32 ítems . Además, también hay factores como los aspectos económicos o financieros para los que existen puntuaciones; son muchos cuestionarios para el paciente, pero estos cuestionarios son relevantes para obtener una imagen global más significativa.

Puntos finales compuestos y pruebas jerárquicas

Las limitaciones se refieren principalmente a las puntuaciones más antiguas, como el CDAI y el MAYO (tabla 2), que suelen ser algo subjetivas y no pueden utilizarse para analizar de forma exhaustiva los criterios de valoración. Esto afecta aún más a la enfermedad de Crohn que a la colitis ulcerosa, ya que los síntomas de la CU son más fáciles de evaluar.

Los criterios de valoración compuestos, una combinación de marcadores inflamatorios objetivos con PRO cualificados, se utilizan en un intento de aunar la multitud de aspectos diferentes. El objetivo es desarrollar y, en última instancia, lanzar terapias que sean a la vez eficaces y seguras.

En algunos estudios, los distintos criterios de valoración se prueban posteriormente de forma jerárquica y se comprueba que no haya errores de tipo I definiendo de antemano el denominado criterio de valoración primario en el protocolo del estudio [6,21,22]. Éste debe ser finalmente positivo o al menos mostrar una diferencia para que el estudio sea positivo. Los análisis posteriores, los llamados criterios de valoraciónsecundarios, sólo tendrán lugar si el criterio de valoración primario es positivo o es más relevante. Esto crea una jerarquía de diferentes análisis, subgrupos o criterios de valoración, que sólo pueden interpretarse si el aspecto definido previamente en la secuencia fue positivo (Fig. 2). Si un criterio de valoración de la jerarquía no alcanza la significación estadística (factor limitante del nivel), no se realizan más estadísticas, y todos los criterios de valoración inferiores de la jerarquía no se consideran resultados estadísticamente significativos/positivos.

Existen diversos aspectos en el diseño de los estudios clínicos que, en última instancia, pueden complicar el análisis y la interpretación y pueden determinar si un estudio tiene realmente la relevancia que desearía. Entre ellos se incluyen el cruce de sujetos entre los grupos de control y experimental o la aparición de sesgos (Tabla 3).

La combinación de un agente biológico y un inmunosupresor ha demostrado ser eficaz y segura en el tratamiento de la enfermedad inflamatoria intestinal crónica. Un nuevo concepto terapéutico emergente es el tratamiento combinado avanzado (TCA) [23], que implica la combinación de al menos dos agentes biológicos o un agente biológico y un fármaco de molécula pequeña con diferentes mecanismos de acción para lograr un control óptimo de la enfermedad en determinados pacientes [24]. La idea subyacente es que la influencia simultánea de varias vías de señalización patogénica puede proporcionar un beneficio aditivo o, en el mejor de los casos, incluso sinérgico, lo que podría ofrecer una opción especialmente para los pacientes en los que aún no se ha podido lograr el control de la enfermedad con monoterapia sola o que padecen enfermedades inflamatorias inmunomediadas concomitantes. [25]Por ejemplo, el estudio VEGA de fase 2a demostró que la terapia de inducción combinada con guselkumab y golimumab era más eficaz en pacientes con colitis ulcerosa que la monoterapia con una de las dos sustancias, sin que aumentaran los problemas de seguridad .

Estudios cara a cara

Históricamente, los estudios frente a frente en el campo de la EII comenzaron inicialmente con el análisis de los esteroides. A finales de los años 70, se comparó la sulfasalazina con la prednisona frente a la azatioprina frente al placebo en la enfermedad de Crohn. En 2010, SONIC fue el primer estudio cara a cara en EII que incluyó terapia biológica (infliximab + azatioprina frente a infliximab frente a azatioprina en la enfermedad de Crohn) y demostró que los anti-TNF en combinación con tiopurinas producían una mejora significativa [26]. A esto le siguió en 2017 el primer estudio cara a cara que comparó un biológico originario con un biosimilar en pacientes con EII (infliximab en MC) [27]. En tal caso, en última instancia no es necesario demostrar mucho más que los medicamentos tienen el mismo efecto, ya que se van a utilizar para la misma indicación.

En la actualidad, las comparaciones directas a veces ya se incluyen en los estudios de fase 3, en el sentido de que el estudio de autorización ya cuenta con un brazo comparativo. Dos ejemplos de ello son el estudio SEAVUE [28], en el que se compara el adalimumab con el ustekinumab, y el estudio VARSITY [29], que compara el adalimumab con el vedolizumab.

En los estudios cara a cara deben considerarse y tenerse en cuenta varios aspectos, como las influencias subjetivas de los investigadores o la llamada censura, en la que se eliminan las observaciones de los pacientes, por ejemplo, si abandonan el seguimiento (Resumen 1).

Mensajes para llevar a casa

Los criterios de valoración en las enfermedades inflamatorias intestinales crónicas cambian rápidamente.
Los criterios de valoración compuestos están ganando importancia: combinación de mediciones objetivas y PRO (los PRO son más subjetivos, factores como los parámetros de inflamación y la endoscopia son más objetivos).
Los PRO y los criterios de valoración modulares flexibles podrían permitir la realización de estudios y la aprobación de terapias para la EII dirigidas a otros aspectos de la EII más allá de la inflamación.
Los estudios clínicos cara a cara son importantes para decidir entre distintas alternativas de tratamiento, pero deben interpretarse con precaución.

Literatura:

Thabane L, et al: Un tutorial sobre análisis de sensibilidad en ensayos clínicos: el qué, el por qué, el cuándo y el cómo. BMC Med Res Method 2013; 13: 92.
Juillerat P: Diseños de ensayos clínicos – ¿Cómo distinguir las diferencias y las limitaciones? IBDmatters – Conferencia CME; https://medizinonline.com/ibd-matters-clinical-trial-designs
FDA: www.fda.gov/patients/drug-development-process/step-3-clinical-research; fecha de acceso: 15/04/2024.
NCI: Fases de los ensayos clínicos. www.cancer.gov/about-cancer/treatment/clinical-trials/what-are-trials/phases; fecha de acceso: 15.04.2024.
Le Tourneau C, et al: J Natl Cancer Inst 2009; 101(10): 708-720.
Yuan J, et al: J Biopharm Stat 2016; 26(5): 912-923.
Ananthakrishnan R, et al: Crit Rev Oncol Hematol 2013; 88: 144-153.
Prasad VK: Adv Drug Develop 2019; 17(3): 150-152.
ICH: www.fda.gov/media/71349/download; fecha de acceso: 15/04/2024.
FDA: www.fda.gov/media/130326/download; fecha de acceso: 15/04/2024.
Kim MS, Prasad V.: Cáncer 2020; 126(19): 4270-4272.
Kim H, et al: Br J Clin Pharmacol 2013; 77(1): 116-121.
Karanicolas PJ, et al: Can J Surg 2010; 53(5): 345-348.
ICH: www.fda.gov/media/71336/download; fecha de acceso: 15/04/2024.
Head SJ, et al: Eur Heart J 2012; 33: 1318-1324.
Haslam A, et al: J Natl Compr Canc Netw 2020; 18(2): 161-167.
Pouillon, et al: Ensayos directos en la enfermedad inflamatoria intestinal: pasado, presente y futuro. Nature Reviews Gastroenterology & Hepatology 2020; 17: 365-376.
He Z, et al: Clin Transl Sci 2020; 0: 1-10.
FDA: www.fda.gov/science-research/science-and-research-special-topics/real-world-evidence; fecha de acceso: 15/04/2024.
Sherman, et al: N Engl J Med 2016; 375: 2293-2297.
Yarlas A, et al: El cuestionario de la enfermedad inflamatoria intestinal en los ensayos controlados aleatorios de tratamiento de la colitis ulcerosa: revisión sistemática y metaanálisis. J Patient Cent Res Rev 2020; 7(2): 189-205; doi: 10.17294/2330-0698.1722.
Korn EL, et al: En: Niederhuber JE, et al, eds: Abeloff’s Clinical Oncology, 6ª ed. 2020: 296-307.
FDA: www.fda.gov/media/102657/download; fecha de acceso: 15/04/2024.
Solitano V, et al: Tratamiento combinado avanzado con agentes biológicos y nuevos fármacos de molécula pequeña para la enfermedad inflamatoria intestinal. Gastroenterol Hepatol 2023; 19(5): 251-263.
Danese S, et al: El futuro del desarrollo de fármacos para la enfermedad inflamatoria intestinal: la necesidad de ACT (tratamiento combinado avanzado). Gut 2022; 71(12): 2380-2387.
Feagan BG, et al, Grupo de estudio VEGA: Tratamiento combinado de guselkumab más golimumab frente a guselkumab o monoterapia con golimumab en pacientes con colitis ulcerosa (VEGA): un ensayo aleatorizado, doble ciego, controlado, de fase 2, de prueba de concepto. Lancet Gastroenterol Hepatol 2023; 8(4): 307-320.
Colombel JF, et al: Infliximab, azatioprina o terapia combinada para la enfermedad de Crohn. N Engl J Med 2010; 362: 1383-1395; doi: 10.1056/NEJMoa0904492.
Duk Ye B, et al: Eficacia y seguridad del biosimilar CT-P13 en comparación con el infliximab originario en pacientes con enfermedad de Crohn activa: un estudio internacional, aleatorizado, doble ciego, de fase 3 de no inferioridad. Lancet 2019; 393: 1699-1707.
Sands BE, et al: Ustekinumab frente a adalimumab para el tratamiento de inducción y mantenimiento en pacientes sin tratamiento biológico con enfermedad de Crohn de moderada a gravemente activa: un ensayo multicéntrico, aleatorizado, doble ciego, de grupos paralelos, de fase 3b.
Lancet 2022; 399(10342): 2200-2211; doi: 10.1016/S0140-6736(22)00688-2.
Sands BE, et al: Vedolizumab frente a adalimumab para la colitis ulcerosa de moderada a grave. N Engl J Med 2019; 381: 1215-1226; doi: 10.1056/NEJMoa1905725.
Zhang J, et al: Sesgo sistemático entre la revisión central independiente ciega y la evaluación local: revisión bibliográfica y análisis de 76 ensayos controlados aleatorizados de fase III en 45 688 pacientes con tumor sólido avanzado. BMJ Open 2018; 8: e017240; doi: 10.1136/bmjopen-2017-017240.
FDA: www.fda.gov/media/71195/download; fecha de acceso: 15/04/2024.