martes, 7 de agosto de 2018

Aspectos generales de los exámenes de detección del cáncer (PDQ®)—Versión para profesionales de salud - National Cancer Institute

Aspectos generales de los exámenes de detección del cáncer (PDQ®)—Versión para profesionales de salud - National Cancer Institute

Instituto Nacional Del Cáncer

Aspectos generales de los exámenes de detección del cáncer (PDQ®)–Versión para profesionales de salud





SECCIONES

Exámenes de detección del cáncer

Posibles beneficios y perjuicios

En 2017, se calcula que 1 688 780 personas en los Estados Unidos se diagnosticarán con cáncer y que 600 920 morirán por esta enfermedad.[1] Los cálculos de las muertes prematuras que se podrían haber evitado mediante la detección oscilan entre 3 y 35 %, según hipótesis variadas. Más allá de la posibilidad de evitar la muerte, los exámenes de detección pueden reducir la morbilidad por cáncer, dado que el tratamiento del cáncer en estadios tempranos suele ser menos invasivo que el de los cánceres en estadios más avanzados.
Se deben tener en cuenta varios perjuicios posibles contra todo beneficio eventual de los exámenes de detección del cáncer.[2] Si bien gran parte de los exámenes de detección del cáncer no son invasivos o son mínimamente invasivos, algunos presentan pequeños riesgos de complicaciones graves que pueden ser inmediatos (por ejemplo, una perforación durante la colonoscopia) o demorados (por ejemplo, posible carcinogenia por la radiación). Otro perjuicio es el resultado positivo falso de una prueba, que puede generar ansiedad y dar lugar a procedimientos diagnósticos invasivos e innecesarios. Estos procedimientos diagnósticos invasivos suponen riesgos de complicaciones graves. Un perjuicio menos conocido es el sobrediagnóstico; es decir, el diagnóstico de una afección que no hubiera tenido importancia clínica de no haberse identificado en los exámenes de detección. Este perjuicio se está volviendo más común con el aumento de la sensibilidad de los exámenes de detección para identificar tumores diminutos. Por último, un examen de detección con resultado negativo falso puede tranquilizar erróneamente a un individuo con signos o síntomas clínicos subsiguientes de cáncer y, como consecuencia, demorar en realidad un diagnóstico y tratamiento eficaz.
En una publicación de 2009 de resultados preliminares de un proyecto sobre exámenes de detección del cáncer en el Japón mediante el uso de varias tecnologías de detección de cuerpo completo, se ilustran claramente los problemas de los resultados positivos falsos de los exámenes de detección y del eventual sobrediagnóstico.[3]
En el proyecto se inscribieron 1217 voluntarios sanos, de 35 años y más, entre agosto de 2003 y julio de 2004. Los voluntarios eran empleados de Hamamatsu Photonics K.K. y empresas afiliadas en el Japón. Los participantes se inscribieron en un programa de seguro médico empresarial y la mayoría se sometió a controles anuales obligatorios de salud durante muchos años, que incluían radiografía de tórax, prueba de sangre oculta en la materia fecal (FOBT), series del aparato digestivo superior y mamografía como exámenes de detección. Se excluyó a 20 candidatos con antecedentes de cáncer, con lo cual quedaron 1197 participantes para la evaluación. Todos los participantes se podían considerar con bajo riesgo de cáncer identificado con exámenes de detección.[3]
Se ofreció a todos los participantes someterse un examen de detección anual de cuerpo completo por medio de una tomografía por emisión de positrones con fluorodesoxiglucosa, tomografía computarizada (TC) de tórax y abdomen, imágenes por resonancia magnética (IRM) del encéfalo y la pelvis, análisis de marcadores tumorales séricos, como el antígeno carcinoembrionario, el antígeno oncológico 19-9 (CA19-9), el antígeno del carcinoma de células escamosas, el antígeno prostático específico para varones mayores de 50 años de edad, el antígeno del cáncer 125 (CA-125) para las mujeres y FOBT.
Se estandarizaron clasificaciones específicas de importancia clínica para todos los resultados de los análisis y las pruebas de diagnóstico por imágenes se leyeron independientemente tres veces, con resolución por unanimidad (consultar los detalles en [3]). El resultado del examen de detección se clasificó como positivo si alguna prueba indicaba alguna neoplasia maligna y, en tal caso, los sujetos se derivaron a un hospital local para la administración de otras pruebas o la repetición de la prueba en el centro de detección. Los episodios de cáncer en los intervalos se verificaron mediante entrevistas o exámenes de detección posteriores.[3]
Veintidós cánceres primarios se confirmaron mediante exámenes de patología; entre ellos, 18 durante el examen de detección inicial y 1 en la segunda ronda. Se diagnosticaron 3 cánceres debido a signos y síntomas clínicos. Se notificó que la sensibilidad general del análisis de cuerpo completo con multiplicidad de pruebas fue de 81,8 %, con una especificidad de 70,6 % (índice de positivos falsos 29,4 %) cuando se consideró que los resultados indicaban una neoplasia maligna o el cáncer no se pudo descartar definitivamente y 68,2 vs. 87,4 %, respectivamente, para la clasificación del examen de detección más restrictivo de una neoplasia maligna únicamente.
La incidencia de cánceres identificados en el examen de detección inicial superó de 3 a 4 veces la incidencia de cáncer anual calculada según la edad en el Japón. Se sabía que varios cánceres identificados durante los exámenes de detección eran poco activos y podrían ser inocuos durante un largo tiempo sin afectar a la mortalidad por cáncer.[3]
También se determinaron los posibles perjuicios de la repetición de programas multimodales de detección del cáncer utilizando los datos del grupo de intervención del Prostate, Lung, Colorectal, and Ovarian Cancer Screening Trial que fue controlado y aleatorizado. Se realizó el examen de detección a un total de 68 436 participantes para tres cánceres, según el sexo, utilizando el antígeno prostático específico (PSA), tacto rectal, ecografía transvaginal, CA-125 sérico, radiografía de tórax o sigmoidoscopia flexible, o todos. En el estudio se determinó que al cabo de cuatro exámenes de detección (realizados en el período de un día en el ensayo), la probabilidad acumulada de que un individuo recibiera al menos un resultado positivo falso fue de 37 % para los hombres y 26 % para las mujeres. Al cabo de 14 pruebas (o 3 años de detección), la probabilidad se elevó a 60 % para los hombres y 49 % para las mujeres, mientras que la probabilidad acumulada de someterse a un procedimiento invasivo como resultado directo de un examen positivo falso fue de 29 % para los hombres y 22 % para las mujeres.[4]
Los perjuicios de los exámenes de detección son motivo de especial preocupación en el caso del sobrediagnóstico, dado que el individuo, por definición, no puede obtener ningún beneficio posible de la detección, pero puede sufrir los efectos adversos relacionados, como tratamientos innecesarios. El sobrediagnóstico se puede manifestar de dos maneras: 1) la detección de una lesión que, en esencia, no tiene potencial maligno (algunas veces llamada “pseudoenfermedad”); y 2) la detección de una lesión que crece de forma suficientemente lenta como para que el individuo muera por otra causa. De este modo, el uso de los exámenes de detección en individuos con una expectativa de vida limitada puede ser una causa importante de sobrediagnóstico. Los estudios de modelos de práctica actual en los Estados Unidos mostraron una utilización considerable de exámenes de detección del cáncer en situaciones en las que la probabilidad de sobrediagnóstico es alta y el beneficio muy bajo. Por ejemplo, los investigadores vincularon los datos del registro de cáncer Surveillance, Epidemiology, and End Results (SEER) de reclamos presentados a Medicare, a fin de evaluar el uso de los exámenes de detección del cáncer en personas de 65 años y más con un diagnóstico conocido de cáncer avanzado (como cáncer de pulmón en estadios IIIB a IV, cáncer colorrectal en estadio IV, cáncer gastroesofágico en estadio IV, cáncer de mama en estadio IV y cáncer de páncreas en estadio avanzado). Se encontró que 9 % de las mujeres con diagnósticos establecidos de cáncer avanzado se sometieron a exámenes de detección con mamografía y 6 % a frotis de Papanicolaou de rutina; 15 % de los hombres con diagnóstico establecido de cáncer avanzado todavía se sometieron a los exámenes de detección con el antígeno prostático específico (PSA). El factor pronóstico individual más sólido de la detección en el entorno del cáncer avanzado fueron los antecedentes de detección recientes antes del diagnóstico.[5]
Hay una relación entre el diagnóstico de cáncer y el comportamiento suicida (ya sea consumado o intentado) en el primer año después del diagnóstico. Esta relación se observó tanto en adultos como en personas jóvenes, con un riesgo relativo (RR), que oscila entre 1,6 y 2,0.[6,7]
En la redacción de los sumarios sobre los exámenes de detección del cáncer, el Consejo Editorial sobre Exámenes de Detección y Prevención de PDQ utiliza las siguientes definiciones:
  • Los exámenes de detección son un medio utilizado para descubrir temprano una enfermedad en personas asintomáticas.
  • Los resultados positivos de los exámenes, las pruebas o los procedimientos utilizados en la detección no son habitualmente diagnósticos, pero identifican a personas con un aumento de riesgo de presentar cáncer en quienes se justifica una evaluación adicional.
  • El diagnóstico es la confirmación de la enfermedad por biopsia o examen tisular en las pruebas posteriores a los resultados positivos de los exámenes de detección. (Después de un resultado positivo en el examen de detección, a menudo se puede descartar el cáncer mediante procedimientos distintos a la biopsia o el examen tisular).
El propósito del presente sumario es presentar un enfoque científico explícito con base en datos probatorios que se utiliza para la redacción de los sumarios sobre los exámenes de detección. En las conclusiones, se sopesan tanto los riesgos como los beneficios. Sin embargo, no se tienen en cuenta los costos ni la eficacia en función de los costos. Asimismo, se aborda la asignación de grados de comprobación relacionados con tales exámenes de detección.
Por su diseño, el PDQ no publica directrices de práctica clínica. Aunque muchas organizaciones de salud pública presentan directrices para la atención de la salud y actividades de detección, la calidad de estas directrices varía ampliamente,[8] en parte porque se basan en opiniones y dependen de las revisiones sistemáticas de los datos probatorios que son de calidad variable. Las mejores directrices, evaluadas mediante la Appraisal of Guidelines for Research and Evaluation (AGREE) son aquellas basadas en las mejores revisiones sistemáticas de Assessment of Multiple Systematic Reviews (AMSTAR).

Toma de decisiones médicas bien fundadas y compartidas

Las directrices para los exámenes de detección mencionan cada vez más la importancia de que los individuos tomen decisiones con conocimiento de causa sobre cómo participar de la detección y a la vez compartir la toma de decisiones. La información objetiva y equilibrada sobre los beneficios y perjuicios potenciales de la prevención, la detección y el tratamiento desempeña una función importante para que el paciente tome una decisión bien sopesada.
En una encuesta nacional sobre las decisiones que se toman con conocimiento de causa durante las conversaciones entre el proveedor de salud y el paciente sobre los exámenes de detección de cáncer colorrectal, mama y próstata, los pacientes se consideraron a sí mismos como bien informados pero con frecuencia no tenían conocimiento sobre los riesgos y beneficios de los exámenes de detección. Los pacientes relataron que por lo general no les preguntaban sobre sus preferencias en cuanto al examen de detección de cáncer; y si bien 90 % de las conversaciones abordaban los pros del examen de detección, 30 % o menos abordaban los contra de estos exámenes.[9]
En muchas de las decisiones sobre la detección, se indica compartir la decisión, ya que el proveedor ayuda al paciente a escoger opciones inteligentes fundamentadas en los valores entre dos o más alternativas médicamente razonables.[10,11] Esto es de suma importancia cuando los exámenes de detección presentan perjuicios potenciales y beneficios limitados. Hay tres componentes de la toma de decisiones compartidas:[12]
  1. El proveedor comparte información sobre las opciones de detección fundamentadas en las pruebas en lo relativo a beneficios, perjuicios e incertidumbres.
  2. El paciente comparte sus preferencias con el proveedor, quien ayuda al paciente a evaluar estas opciones y preferencias y tomar la decisión.
  3. El proveedor ayuda en la documentación y ejecución de las preferencias del paciente.
Los diferentes medios de ayuda al paciente pueden ser útiles para proveer información y ayudar al paciente a tomar una decisión. Estos alientan al paciente a interpretar las pruebas en el contexto de sus propias metas y preocupaciones. Los métodos audiovisuales que ayudan a tomar decisiones están disponibles en diferentes formatos, como panfletos, folletos, videos y páginas web. Algunos de estos medios incluyen historietas o relatos de pacientes. Diversos pacientes podrían preferir un formato en particular en vez de otro. La mayoría de los formatos alientan al paciente a que tome sus decisiones contando con la ayuda de su médico. El International Patient Decision Aid Standards (IPDAS) Collaboration ha elaborado un método que evalúa la calidad del método de ayuda en la toma de decisiones.[13]
Una revisión de Cochrane de 115 ensayos aleatorizados controlados sobre la toma de decisiones compartidas con la ayuda de un método audiovisual se indicó que, en general, estos métodos mejoran los conocimientos del paciente sobre opciones y riesgos; reducen los conflictos al tomar decisiones por sentirse desinformado o confuso sobre los valores personales; y estimula a los pacientes a participar más activamente en la toma de decisiones. Se ha notado que en algunos casos, estos métodos audiovisuales reducen el número de pacientes que eligen una operación importante electiva e invasiva en vez de otras opciones más conservadoras, y menos pacientes que eligen exámenes de detección del cáncer. El efecto de usar métodos audiovisuales en el transcurso de la consulta varía, y va desde acortar el tiempo de la consulta a ningún cambio o a prolongar el tiempo de la consulta.[14]
Luego de usar un método audiovisual para la toma de decisiones que incluía información en cuanto a la sobredetección de cáncer de mama, más mujeres tomaron una decisión con conocimiento de causa de si debían examinarse, y cumplieron con los requisitos de un conocimiento general adecuado. Al comparárseles con el grupo de control cuyos métodos de ayuda no contenían información sobre la detección, menos mujeres expresaron actitudes positivas hacia la detección o tuvieron la intención de someterse al análisis en un futuro.[15] Las personas mejor informadas podrían tener menos tendencia a participar en un examen de detección del cáncer.

Redacción de los sumarios

Los sumarios sobre los exámenes de detección del cáncer se basan en varios niveles de datos probatorios científicos publicados y en la experiencia clínica colectiva. Se considera que el grado más alto de comprobación es la reducción de la mortalidad en estudios o ensayos clínicos controlados aleatorizados. En la redacción de los sumarios, también se tienen en cuenta los resultados de estudios clínicos, estudios de casos y controles, estudios de cohortes y otra información. Además, se considera la incidencia del cáncer, la distribución de los estadios, el tratamiento y las tasas de mortalidad. Los sumarios están sujetos a modificaciones a medida que se dispone de nuevos datos probatorios.

Fundamento científico

Para que el examen de detección sea eficaz, se deben satisfacer por lo menos dos requisitos:
  1. Se debe contar con una prueba o procedimiento para detectar los cánceres antes de que se detectara el cáncer como resultado de la aparición de síntomas.
  2. Se debe probar que el tratamiento iniciado más temprano como consecuencia del examen de detección produce un mejor desenlace.
Estos requisitos son necesarios, pero no suficientes, para probar la eficacia del examen de detección, que exige una disminución de la mortalidad por causas específicas. Por ejemplo, solo se cumplió con uno de estos dos criterios en el caso del examen de detección para el neuroblastoma infantil mediante evaluación de los metabolitos urinarios de las catecolaminas. Entre 1981 y 1992, se realizó un programa de detección en masa en la Prefectura de Saitama, en el Japón, para lactantes de 6 meses de edad.[16] Durante ese período de 12 años, la incidencia anual del neuroblastoma en niños menores de 1 año de edad aumentó de aproximadamente 28 por millón a 260 por millón, pero sin una reducción significativa en la incidencia en los niños mayores de 1 año de edad. Debido a la falta de reducción de la mortalidad por la enfermedad, esta experiencia ofreció pruebas contundentes de sobrediagnóstico: el diagnóstico de algunos neuroblastomas identificables por medio de detección que no se habrían diagnosticado más adelante. En otras partes del Japón [17] y en el Quebec Neuroblastoma Screening Project (QNSP) en Canadá, se notificaron experiencias similares.[18] La historia del examen de detección de neuroblastomas también proporcionan una ilustración útil del beneficio de realizar evaluaciones bien diseñadas de las tecnologías emergentes de exámenes de detección antes de poner en marcha programas de detección. Si bien tales estudios son muy costosos, se demostró que el QNSP mismo evitó una morbilidad innecesaria para miles de niños, al tiempo que tuvo un rendimiento calculado dentro de límites razonables de ahorro de costos de 64,5 veces en relación con la inversión en el estudio.[19]

Detección

La observación visual directa o asistida con instrumentos es el examen más ampliamente disponible para la detección del cáncer. Es útil para identificar lesiones sospechosas en la piel, la retina, los labios, la boca, la laringe, los genitales externos y el cuello uterino.
El segundo procedimiento de detección más común es la palpación para detectar bultos, nódulos o tumores en la mama, la boca, las glándulas salivales, la tiroides, los tejidos subcutáneos, el ano, el recto, la próstata, los testículos, los ovarios y el útero, así como los ganglios linfáticos agrandados en el cuello, la axila o la ingle.
Para los cánceres internos, se necesitan procedimientos y pruebas como endoscopias, radiografías, IRM o ecografías. En la detección de cánceres específicos se han empleado análisis de laboratorio, como el frotis de Papanicolaou o la FOBT.
El rendimiento de las pruebas de detección se suele medir en términos de la sensibilidad, la especificidad y los valores pronósticos de un resultado positivo (VPP) y los valores pronósticos de un resultado negativo (VPN). La sensibilidad es la probabilidad de que una persona con cáncer tenga un resultado de prueba positivo. La especificidad es la probabilidad de que una persona sin cáncer tenga un resultado de prueba negativo. El VPP es la posibilidad de que una persona con un resultado positivo de una prueba tenga cáncer. El VPN es la probabilidad de que una persona con un resultado negativo de una prueba no tenga cáncer. El VPP y, en menor medida, el VPN están afectados por la prevalencia de la enfermedad en la población sometida a exámenes de detección. Para una sensibilidad y especificidad dadas, cuanto mayor es la prevalencia, mayor es el VPP.

Poblaciones con riesgo alto

Se sabe que algunas personas tienen un riesgo alto de cáncer; por ejemplo, aquellos con antecedentes personales o muchos antecedentes familiares de cáncer. De modo creciente, a medida que se encontró que las mutaciones genéticas y los polimorfismos guardan relación con cánceres específicos, las personas con riesgo alto se identificarán mediante pruebas genéticas. El tipo, la periodicidad y el comienzo de la detección en poblaciones de riesgo alto para la mayoría de los cánceres reflejan el juicio de los profesionales más que los datos probatorios obtenidos en estudios científicos. El juicio de los médicos es necesario en tales circunstancias para determinar la aplicación más pertinente de los métodos de detección disponibles. La prudencia indica mayor vigilancia en las poblaciones de riesgo más alto. Como mínimo, esto significa que se identifica a la persona de riesgo alto, se la asesora adecuadamente y se la somete sistemáticamente a esos procedimientos de detección que mostraron ser beneficiosos para la población general.

Recidiva del cáncer

Para mayor información sobre la recidiva del cáncer, consultar los sumarios del PDQ sobreTratamiento del cáncer en adultos.

Mejores desenlaces

Para prácticamente todos los cánceres, las opciones de tratamiento y la supervivencia se relacionan con el estadio, que por lo general se caracteriza por el grado de extensión anatómica de la enfermedad. Sobre esta base, se asume que la detección temprana del cáncer en un estadio temprano puede permitir mejores desenlaces. En la década de 1940, se creó una estadificación generalizada de enfermedades localizadas, regionales y a distancia para reflejar las tendencias a largo plazo, la cual aún es útil. En el sistema más detallado de TNM, modificado periódicamente, también se clasifican el tamaño del (T)umor, el estado de los ga(N)glios linfáticos y el estado de las (M)etástasis a distancia. Estos elementos se agrupan en los estadios 0, I, II, III y IV, conforme a su relación con la supervivencia. En términos generales, los tumores malignos primarios más grandes tienen una incidencia más alta de metástasis en los ganglios linfáticos regionales y en sitios distantes. El estadio tiene un efecto tan profundo en el desenlace que todos los ensayos de tratamientos aleatorizados exigen la comparación de estadios similares para evaluar las diferencias en el desenlace. Los cambios en el estadio también pueden augurar mejora en la supervivencia y disminución de la mortalidad, si bien el cambio por sí solo no establece beneficios.
Las características celulares biológicas del cáncer, como el grado, la sensibilidad hormonal y la sobreexpresión genética se reconocen como factores pronóstico importantes de los comportamientos del cáncer. Por ejemplo, el cáncer de grado alto puede ser de crecimiento rápido y metastatizar rápidamente, de forma independiente del estadio en el momento del diagnóstico. En consecuencia, la detección de estos cánceres cuando son pequeños puede no afectar el desenlace. Los ensayos controlados aleatorizados son más definitivos para determinar los beneficios de los exámenes de detección.

Patrones observados en los estadios del cáncer en el momento del diagnóstico

El Surveillance, Epidemiology, and End Results (SEER) Program del Instituto Nacional del Cáncer recopila datos sobre la incidencia del cáncer de 11 áreas geográficas, que cubren aproximadamente a 14 % de la población de los Estados Unidos. Estos datos de larga duración (de 1973 al presente) basados en poblaciones, son un recurso singular e importante para verificar la supervivencia en cada estadio.

Interpretación de los cambios en la supervivencia relativa con el transcurso del tiempo

Sin embargo, los aumentos en la supervivencia con el transcurso del tiempo son difíciles de interpretar, incluso cuando se basan en datos de registros de tumores, como el SEER, que incluyen todos los casos en una población determinada. Pueden reflejar los beneficios de la detección temprana o la mejora en el tratamiento, pero también pueden resultar del sesgo de anticipación diagnóstica y el sobrediagnóstico, que se presentan comúnmente con la detección.
El sesgo de anticipación diagnóstica resultará en un cálculo de supervivencia más prolongada de las personas con cánceres identificados mediante exámenes de detección porque el tiempo que precede el diagnóstico clínico del cáncer se incluye en el cálculo de la supervivencia.
El sobrediagnóstico puede resultar de la identificación de cánceres que nunca se habrían manifestado clínicamente. Por definición, estos cánceres tienen un buen pronóstico. Por ejemplo, en series de autopsias se mostró un alto porcentaje de carcinomas de próstata incipientes ocultos en hombres de edad avanzada que murieron por causas no relacionadas con el cáncer de próstata.[20] El descubrimiento de estos cánceres mediante detección sistemática podría aumentar el número de casos y dar la apariencia de un cambio de estadio y aumentos en las tasas de supervivencia o curación, sin reducir necesariamente la mortalidad. En un análisis de los datos notificados por el programa SEER entre 1950 y 1996, se encontró que los cambios con el tiempo en las tasas relativas de supervivencia a 5 años para 20 cánceres principales no se relacionaron esencialmente con las tendencias en las tasas de mortalidad para esos cánceres durante el mismo período.[21] Los autores indican que los cambios en las tasas de supervivencia a 5 años se deben en gran medida al diagnóstico más temprano y a la detección de casos asintomáticos que tal vez nunca habrían surgido clínicamente. Llegan a la conclusión que las inferencias sobre la eficacia del diagnóstico o el tratamiento tempranos no deben trazarse a partir de cambios temporales en las tasas de supervivencia a 5 años, sino que se deben basar en cambios en las tasas de mortalidad. De este modo, los cambios en las tasas de supervivencia a 5 años o los cambios de estadio no son medidas apropiadas de la eficacia del examen de detección para la enfermedad en estadio temprano. Las reducciones en las tasas de incidencia para los tumores en estadio tardío representan una mejor medida del progreso debido a la detección que las tendencias de supervivencia a 5 años, aunque tales pruebas sean menos convincentes que las reducciones en mortalidad.

Diseño de los estudios

Se pueden emplear los resultados de estudios llevados a cabo con diversos diseños para respaldar un sumario dado. El diseño más sólido es el de un ensayo controlado aleatorizado. Sin embargo, no siempre es práctico realizar este tipo de ensayo para abordar cada pregunta en torno al campo de la detección sistemática. En cada afirmación sobre datos probatorios en los sumarios, se menciona la solidez relacionada con los diseños de los estudios. Hay cinco diseños de estudios que se usan generalmente para juzgar los datos probatorios. En orden de solidez del diseño, los cinco niveles son los siguientes:
  1. Datos probatorios obtenidos en ensayos controlados aleatorizados.
  2. Datos probatorios obtenidos en ensayos controlados no aleatorizados.
  3. Datos probatorios obtenidos en estudios de cohorte o de casos y controles (testigos).
  4. Datos probatorios obtenidos en estudios ecológicos y descriptivos (por ejemplo, estudios de patrones internacionales, series temporales).
  5. Opiniones de autoridades respetadas por su experiencia clínica, estudios descriptivos o informes de comités de expertos.
Los ensayos experimentales se diseñan para corregir o eliminar los sesgos de selección, de anticipación diagnóstica, duración, voluntario sano y otros sesgos cuando se prueba de manera prospectiva un procedimiento de detección con el propósito de determinar su efecto en el desenlace de salud. El índice más alto de datos probatorios y el mayor beneficio de la detección es la reducción de la mortalidad en un ensayo controlado aleatorizado. En la mayoría de los centros, no se dispone de datos probatorios. En teoría, es posible realizar ensayos aleatorizados para gran parte de las intervenciones pero el tamaño de la muestra necesario, el gasto y la duración de tales ensayos para la mayoría de los cánceres, con frecuencia, restan practicidad a esta estrategia. En consecuencia, a menudo se suelen usar los datos probatorios obtenidos por otros métodos.
En ciertos casos, otra opción preliminar para no usar la reducción de la mortalidad en la evaluación de una nueva modalidad de detección podría ser una comparación relativamente de corto plazo (por ejemplo, varios años) de los intervalos de las tasas de cáncer observados en un ensayo aleatorizado en el que se compara la prueba nueva con la modalidad de detección "estándar". Si la nueva prueba de detección tiene el potencial de mejorar la mortalidad por la enfermedad específica, las aplicaciones repetidas en un período de tiempo discreto resultarán en una menor proporción de pacientes en el grupo de intervención que presentan un cáncer sintomático (del tipo objeto de la detección) entre detecciones negativas. Es decir, con la detección temprana y el tratamiento resultante, el nuevo examen de detección evita que un porcentaje más alto de lesiones asintomáticas de importancia clínica avancen hasta tornarse cáncer manifiesto. A diferencia de las comparaciones transversales de sensibilidad en las que los participantes de los estudios se someten a modalidades nuevas y antiguas de detección, este diseño de ensayo permite calcular el grado de sobrediagnóstico generado por un examen de detección. Esta comparación se debe realizar en el contexto de un ensayo controlado aleatorizado.[22]
Los estudios de casos y controles y los estudios de cohortes ofrecen datos probatorios indirectos de la eficacia de la detección sistemática, pero es difícil eliminar la contribución del sesgo de selección y el sesgo de voluntarios sanos evidentes en estos estudios.
Los estudios ecológicos pueden demostrar una relación entre el uso de exámenes de detección y un cambio en el estadio del cáncer que puede proporcionar datos probatorios del valor de la detección. Estos datos probatorios son especialmente convincentes de la eficacia de la detección del cáncer de cuello uterino.[23] En este contexto se utilizó la correlación ecológica de la mortalidad y la intensidad de la detección. Dichos estudios no prueban un efecto en la reducción de la mortalidad y pueden sustancialmente incluir un sesgo que invalida las inferencias de estudios no experimentales o generar resultados confusos.[24-29]
Los estudios descriptivos no controlados basados en la experiencia de médicos individuales, hospitales y registros no poblacionales pueden generar cierta información sobre los exámenes de detección. Las características del desempeño de varias pruebas de detección, como sensibilidad, especificidad y los VPP, por lo general, se notifican primero en estos estudios descriptivos. Los primeros datos probatorios de que la detección puede ser exitosa es un aumento en la incidencia de cánceres tempranos y la reducción de la incidencia de cánceres metastásicos en estadio tardío (cambio de estadio); más adelante, es posible que se presente una reducción del número de muertes. Estos estudios descriptivos no establecen la eficacia debido a la ausencia de un grupo de control apropiado.
En el sumario de PDQ Grados de comprobación científica de los estudios de investigación sobre detección y prevención del cáncer se puede encontrar una descripción más detallada de la manera en que el Consejo Editorial sobre Exámenes de Detección y Prevención del Cáncer del PDQ clasifica los datos probatorios generales relacionados con los beneficios y perjuicios de las pruebas de detección.

Modelos de simulación

Elaborar modelos es otra manera de recabar datos sobre exámenes de detección. Los modelos brindan la oportunidad de obtener información sobre exámenes de detección de cáncer en circunstancias en las que se carece de datos probatorios de tipo empírico. Se han creado diversos modelos probabilísticos y de simulación por computador para los siguientes fines:
  • Analizar las tendencias en la detección de cáncer y compararlas con las tendencias registradas en bases de datos nacionales y regionales.
  • Investigar la rentabilidad de distintas estrategias de exámenes de detección de cáncer.
  • Intentar calcular el sobrediagnóstico resultante de los exámenes de detección de cáncer.
Un esfuerzo importante en esta área son los modelos de simulación del programa de la Cancer Intervention and Surveillance Modeling Network (CISNET) del Instituto Nacional del Cáncer. Se han elaborado modelos para investigar la repercusión de los exámenes de detección de cáncer de mama, colon, pulmón, próstata, cuello uterino y esófago. Un ejemplo es un modelo de un examen de detección de cáncer de próstata, en el que se indica que la combinación de cambios en el tratamiento de cáncer de próstata, mejoras en la atención de la enfermedad después de la terapia primaria y la implementación de exámenes de detección contribuyeron a la disminución de la mortalidad por este tipo de cáncer.[30] En otro ejemplo se modelan los beneficios y perjuicios de las estrategias para la detección de cáncer de mama después de que se investigaran 8 estrategias en las que se incluyeron diferencias en la edad de inicio de los exámenes de detección (40, 45 o 50 años) e intervalos entre estos (anual, bienal o híbrido).[31] Además, en una investigación sobre los beneficios y perjuicios de los exámenes de detección de cáncer de pulmón con tomografía computarizada (TC), se compararon 576 situaciones distintas con diferentes criterios de idoneidad (edad, índice de tabaquismo de cajetillas-año, años sin fumar), intervalos entre exámenes de detección (1, 2 o 3 años) y las edades al iniciar (45, 50, 55 o 60 años) y suspender (75, 80 u 85 años) los exámenes de detección.[32]
Todos los modelos conllevan una advertencia importante: serán tan válidos como lo sean las suposiciones en las que se fundamenten, en especial las suposiciones sobre una evolución natural desconocida de la enfermedad en cuestión. Muchos modelos son complejos, por eso es difícil comprender cómo interactúan los elementos y cómo se obtienen los resultados. Además, en los modelos a menudo se tiende a sobreestimar los beneficios de los exámenes de detección debido a que no se toman en cuenta de manera apropiada los sesgos por anticipación diagnóstica y duración de la enfermedad. Asimismo, los modelos con frecuencia dan resultados que son extrapolaciones fuera del alcance de los datos de entrada de los modelos. Por tanto, es imperativo que los resultados de los modelos se interpreten con cautela.

Criterios de valoración de la mortalidad por enfermedad específica y por todas las causas

La mortalidad por enfermedad específica ha sido el criterio de valoración aceptado de manera más generalizada en los ensayos clínicos aleatorizados de detección del cáncer; sin embargo, la validez de este criterio de valoración se basa en las premisas fundamentales de que la causa de la muerte se pueda determinar con precisión y que la detección y el tratamiento subsiguiente tengan efectos insignificantes sobre otras causas de muerte. En las últimas revisiones de los ensayos clínicos aleatorizados de detección del cáncer, se indica que la clasificación errónea de la causa de muerte ha sido un problema importante que exageró la eficacia (o subestimó los perjuicios) de los exámenes de detección.[33-35] A diferencia de la mortalidad por enfermedad específica, la mortalidad por todas las causas depende solamente del establecimiento preciso de las defunciones y del momento en el que ocurren y, en consecuencia, no está afectada por la clasificación errónea de la causa de muerte. Sin embargo, una limitación importante del criterio de valoración de la mortalidad por todas las causas es que es improbable que revele un efecto estadísticamente significativo de la detección sistemática del cáncer porque esta intervención habitualmente se dirige a una enfermedad que causa solo una pequeña proporción de todas las muertes. De todos modos, se debe considerar la mortalidad por todas las causas junto con la mortalidad por enfermedad específica para reducir la posibilidad de que quede oculto un perjuicio (o beneficio) importante de la detección por la clasificación errónea de la causa de muerte.
Una pregunta importante, que se puede abordar mediante la investigación de ambos criterios de valoración, es si la detección realmente salva vidas. Se llevó a cabo una revisión sistemática de los metanálisis y los ensayos aleatorizados para enfermedades en las que la muerte es un desenlace común, incluso varios cánceres, para determinar si la detección reduce la mortalidad por todas las causas. La mamografía para el cáncer de mama, y la sigmoidoscopia y la prueba de sangre oculta en la materia fecal para el cáncer colorrectal fueron los únicos exámenes de detección que dieron lugar a reducciones de la mortalidad por enfermedad específica; sin embargo, no hubo ninguna prueba que llevara a la reducción de la mortalidad por todas las causas.[36]

Mediciones del riesgo

En la investigación del cáncer se utilizan varias medidas de riesgo. El riesgo absoluto (o tasa absoluta) mide el riesgo o la tasa de cáncer real en una población o subgrupo (por ejemplo, la población de los Estados Unidos, o los estadounidenses de raza blanca o los estadounidenses de origen africano). Por ejemplo, en el SEER Program se notifica riesgo y tasa de cáncer en zonas geográficas específicas de los Estados Unidos.
Las tasas se suelen ajustar (por ejemplo, tasas ajustadas por edad) para permitir comparar con mayor precisión las tasas con el transcurso del tiempo o entre grupos. El propósito del ajuste es asemejar más a los grupos con respecto a características importantes que pueden afectar las conclusiones. Por ejemplo, cuando el SEER Program se comparan tasas de cáncer con el transcurso del tiempo en los Estados Unidos, las tasas se ajustan de acuerdo con una distribución por edad. En caso contrario, las tasas de cáncer parecerían aumentar con el transcurso del tiempo simplemente porque la población estadounidense envejece y el riesgo de cáncer es más alto en grupos de edad más avanzada.
El riesgo relativo (RR) compara el riesgo de presentar cáncer entre aquellas personas que tienen una característica o exposición particular con aquellos que no la tienen. El RR se expresa como un cociente de riesgos o tasas; oscila entre el infinito y el inverso del infinito (es decir, cero). Si el RR es mayor que 1, la exposición o la característica se relaciona con un riesgo más alto de cáncer; si el riesgo relativo es igual a 1, la exposición y el cáncer no guardan relación alguna entre sí; si el riesgo relativo es inferior a 1, la exposición se relaciona con un riesgo más bajo de cáncer (es decir, la exposición es protectora). El riesgo relativo se suele usar en los ensayos clínicos de prevención y detección del cáncer para calcular la reducción del riesgo de cáncer o el riesgo de muerte, respectivamente.
La oportunidad relativa (OR) se suele usar como un cálculo del RR. También indica si hay una relación entre una exposición o característica y el cáncer. Compara las probabilidades de una exposición o característica en los casos de cáncer con las probabilidades de un grupo comparativo sin cáncer. Si bien no se comprende tan intuitivamente como las tasas o los riesgos, la OR se usa porque estadísticamente es más válida en algunos entornos cuando otras medidas del riesgo no son válidas. Para los episodios o las enfermedades relativamente poco comunes como un diagnóstico de cáncer, la OR se puede interpretar como un RR; sin embargo, se torna un cálculo cada vez más impreciso del RR a medida que el riesgo absoluto subyacente de la enfermedad en la población estudiada se eleva por encima de 10 %. Las OR se usan se usan normalmente en estudios de casos y controles para identificar los posibles factores de riesgo o factores protectores del cáncer.
La diferencia de riesgo o tasa (o exceso de riesgo) compara el riesgo o la tasa real de cáncer entre por lo menos dos grupos de personas, según una característica o exposición importantes, mediante la sustracción de los riesgos o las tasas entre sí (por ejemplo, al sustraer las tasas de cáncer de pulmón entre los no fumadores de las tasas de los fumadores de cigarrillos se calcula el riesgo excesivo de cáncer de pulmón debido al tabaquismo). Esto se puede usar en el campo de la salud pública para calcular el número de casos de cáncer que se podrían evitar si se redujese o eliminara una exposición en la población.
El riesgo atribuible a la población mide la proporción de cánceres que se pueden atribuir a una exposición o característica particular. Combina la información sobre el RR del cáncer relacionado con una exposición particular con la prevalencia de esa exposición en la población, y calcula la proporción de casos de cáncer en una población que se podrían evitar con la reducción o la eliminación de una exposición.
El número necesario para la detección calcula el número de personas que deben participar en un programa de detección para prevenir una muerte en un intervalo de tiempo determinado.
Los años de vida ganados en promedio calcula el número de años que una intervención salva, por término medio, para una persona que se somete a la intervención. Esto refleja la reducción de la mortalidad y la extensión de vida (o las muertes prematuras que se evitan).
Bibliografía
  1. American Cancer Society: Cancer Facts and Figures 2017. Atlanta, Ga: American Cancer Society, 2017. Available online. Last accessed March 7, 2018.
  2. Kramer BS: The science of early detection. Urol Oncol 22 (4): 344-7, 2004 Jul-Aug. [PUBMED Abstract]
  3. Nishizawa S, Kojima S, Teramukai S, et al.: Prospective evaluation of whole-body cancer screening with multiple modalities including [18F]fluorodeoxyglucose positron emission tomography in a healthy population: a preliminary report. J Clin Oncol 27 (11): 1767-73, 2009. [PUBMED Abstract]
  4. Croswell JM, Kramer BS, Kreimer AR, et al.: Cumulative incidence of false-positive results in repeated, multimodal cancer screening. Ann Fam Med 7 (3): 212-22, 2009 May-Jun. [PUBMED Abstract]
  5. Sima CS, Panageas KS, Schrag D: Cancer screening among patients with advanced cancer. JAMA 304 (14): 1584-91, 2010. [PUBMED Abstract]
  6. Lu D, Fall K, Sparén P, et al.: Suicide and suicide attempt after a cancer diagnosis among young individuals. Ann Oncol 24 (12): 3112-7, 2013. [PUBMED Abstract]
  7. Baade PD, Fritschi L, Eakin EG: Non-cancer mortality among people diagnosed with cancer (Australia). Cancer Causes Control 17 (3): 287-97, 2006. [PUBMED Abstract]
  8. Burda BU, Norris SL, Holmer HK, et al.: Quality varies across clinical practice guidelines for mammography screening in women aged 40-49 years as assessed by AGREE and AMSTAR instruments. J Clin Epidemiol 64 (9): 968-76, 2011. [PUBMED Abstract]
  9. Hoffman RM, Lewis CL, Pignone MP, et al.: Decision-making processes for breast, colorectal, and prostate cancer screening: the DECISIONS survey. Med Decis Making 30 (5 Suppl): 53S-64S, 2010 Sep-Oct. [PUBMED Abstract]
  10. O'Connor AM, Llewellyn-Thomas HA, Flood AB: Modifying unwarranted variations in health care: shared decision making using patient decision aids. Health Aff (Millwood) Suppl (Variation): VAR63-72, 2004. [PUBMED Abstract]
  11. Charles C, Gafni A, Whelan T: Shared decision-making in the medical encounter: what does it mean? (or it takes at least two to tango). Soc Sci Med 44 (5): 681-92, 1997. [PUBMED Abstract]
  12. Coulter A, Collins A: Making Shared Decision-Making a Reality: No Decision About Me, Without Me. London, UK: The King's Fund, 2011. Also available online. Last accessed April 21, 2017.
  13. Elwyn G, O'Connor A, Stacey D, et al.: Developing a quality criteria framework for patient decision aids: online international Delphi consensus process. BMJ 333 (7565): 417, 2006. [PUBMED Abstract]
  14. Stacey D, Hawker G, Dervin G, et al.: Decision aid for patients considering total knee arthroplasty with preference report for surgeons: a pilot randomized controlled trial. BMC Musculoskelet Disord 15: 54, 2014. [PUBMED Abstract]
  15. Hersch J, Barratt A, Jansen J, et al.: Use of a decision aid including information on overdetection to support informed choice about breast cancer screening: a randomised controlled trial. Lancet 385 (9978): 1642-52, 2015. [PUBMED Abstract]
  16. Yamamoto K, Hayashi Y, Hanada R, et al.: Mass screening and age-specific incidence of neuroblastoma in Saitama Prefecture, Japan. J Clin Oncol 13 (8): 2033-8, 1995. [PUBMED Abstract]
  17. Bessho F: Effects of mass screening on age-specific incidence of neuroblastoma. Int J Cancer 67 (4): 520-2, 1996. [PUBMED Abstract]
  18. Woods WG, Tuchman M, Robison LL, et al.: A population-based study of the usefulness of screening for neuroblastoma. Lancet 348 (9043): 1682-7, 1996 Dec 21-28. [PUBMED Abstract]
  19. Soderstrom L, Woods WG, Bernstein M, et al.: Health and economic benefits of well-designed evaluations: some lessons from evaluating neuroblastoma screening. J Natl Cancer Inst 97 (15): 1118-24, 2005. [PUBMED Abstract]
  20. Woolf SH: Screening for prostate cancer with prostate-specific antigen. An examination of the evidence. N Engl J Med 333 (21): 1401-5, 1995. [PUBMED Abstract]
  21. Welch HG, Schwartz LM, Woloshin S: Are increasing 5-year survival rates evidence of success against cancer? JAMA 283 (22): 2975-8, 2000. [PUBMED Abstract]
  22. Irwig L, Houssami N, Armstrong B, et al.: Evaluating new screening tests for breast cancer. BMJ 332 (7543): 678-9, 2006. [PUBMED Abstract]
  23. Hakama M, Miller AB, Day NE, eds.: Screening for cancer of the uterine cervix. Lyon, France: International Agency for Research on Cancer, 1986.
  24. Connor RJ, Prorok PC, Weed DL: The case-control design and the assessment of the efficacy of cancer screening. J Clin Epidemiol 44 (11): 1215-21, 1991. [PUBMED Abstract]
  25. Friedman DR, Dubin N: Case-control evaluation of breast cancer screening efficacy. Am J Epidemiol 133 (10): 974-84, 1991. [PUBMED Abstract]
  26. Janzon L, Andersson I: The Malmo mammographic screening trial. In: Miller AB, Chamberlain J, Day NE, et al., eds.: Cancer Screening. Cambridge: Cambridge University Press, 1991, pp 37-44.
  27. Moss SM: Case-control studies of screening. Int J Epidemiol 20 (1): 1-6, 1991. [PUBMED Abstract]
  28. Weiss NS, Lazovich D: Case-control studies of screening efficacy: the use of persons newly diagnosed with cancer who later sustain an unfavorable outcome. Am J Epidemiol 143 (4): 319-22, 1996. [PUBMED Abstract]
  29. Suzuki KJ, Nakaji S, Tokunaga S, et al.: Confounding by dietary factors in case-control studies on the efficacy of cancer screening in Japan. Eur J Epidemiol 20 (1): 73-8, 2005. [PUBMED Abstract]
  30. Etzioni R, Gulati R, Tsodikov A, et al.: The prostate cancer conundrum revisited: treatment changes and prostate cancer mortality declines. Cancer 118 (23): 5955-63, 2012. [PUBMED Abstract]
  31. Mandelblatt JS, Stout NK, Schechter CB, et al.: Collaborative Modeling of the Benefits and Harms Associated With Different U.S. Breast Cancer Screening Strategies. Ann Intern Med 164 (4): 215-25, 2016. [PUBMED Abstract]
  32. de Koning HJ, Meza R, Plevritis SK, et al.: Benefits and harms of computed tomography lung cancer screening strategies: a comparative modeling study for the U.S. Preventive Services Task Force. Ann Intern Med 160 (5): 311-20, 2014. [PUBMED Abstract]
  33. Black WC: Overdiagnosis: An underrecognized cause of confusion and harm in cancer screening. J Natl Cancer Inst 92 (16): 1280-2, 2000. [PUBMED Abstract]
  34. Olsen O, Gøtzsche PC: Screening for breast cancer with mammography. Cochrane Database Syst Rev (4): CD001877, 2001. [PUBMED Abstract]
  35. Black WC, Haggstrom DA, Welch HG: All-cause mortality in randomized trials of cancer screening. J Natl Cancer Inst 94 (3): 167-73, 2002. [PUBMED Abstract]
  36. Saquib N, Saquib J, Ioannidis JP: Does screening for disease save lives in asymptomatic adults? Systematic review of meta-analyses and randomized trials. Int J Epidemiol 44 (1): 264-77, 2015. [PUBMED Abstract]

No hay comentarios:

Publicar un comentario