Exploración de la clasificación de lesiones tisulares

El microscopio ha sido una herramienta para que el ojo del patólogo observe los tejidos a nivel celular. Con la maduración de los campos del aprendizaje profundo y la visión por computadora, los patólogos ahora tienen una herramienta para complementar su conjunto de habilidades y ayudarlos en la clasificación de imágenes. Una tarea común para un patólogo es el examen de tejido de una biopsia a nivel microscópico para diagnosticar cánceres. La inspección de los portaobjetos de tejido es un trabajo minucioso y preciso que requiere años de capacitación especializada para dominarlo. La visión por computadora es una herramienta obvia que puede facilitar diagnósticos más rápidos y precisos. La utilidad de la visión por computadora dentro del campo de la patología, específicamente, se ha establecido aún más con el avance de la patología digital. Al delegar tareas específicas al software de visión por computadora, el patólogo puede centrar su atención en procesos de nivel superior, incluida la síntesis de información para la interpretación clínica y la toma de decisiones.

Descripción del problema

El francés Society of Pathology ( SFP ) organizó una competencia el DrivenData ,

Este desafío se centra en las lesiones epiteliales del cuello uterino y presenta una colección única de miles de WSI recopilados en centros médicos de Francia. Las lesiones en portaobjetos como estos suelen ser benignas (class 0), pero algunas otras tienen bajo potencial maligno (class 1) o alto potencial maligno. (class 2), y otros pueden ya ser cánceres invasivos (class 3).

para desarrollar un clasificador de imágenes a medida en portaobjetos de microscopio de biopsias de tejido cervical uterino recogidas de la población francesa. La SFP y el Health Data Hub de Francia proporcionaron un conjunto de entrenamiento de 928 GB de imágenes de diapositivas completas etiquetadas con cada diapositiva clasificada por patólogos anatómicos según la gravedad de la lesión:

  • 0 Normal o subnormal
  • 1 Lesión intraepitelial escamosa de bajo grado
  • 2 Lesión intraepitelial escamosa de alto grado
  • 3 Carcinoma escamoso invasivo

Se proporcionaron imágenes de portaobjetos completos ( WSI: un WSI es una representación digital de un portaobjetos de microscopio con altos niveles de aumento) en una variedad de formatos, aunque estábamos interesados ​​en el formato piramidal TIF. Los TIF piramidales son un formato de resolución múltiple con cada resolución almacenada como una capa separada en el archivo TIF. Estas imágenes se comprimen ligeramente para que sean menos intensivas en hardware, pero conservan un nivel de detalle adecuado para que los patólogos las utilicen en el diagnóstico.

Esquema de TIF piramidal. Cmglee , CC BY-SA 3.0 , a través de Wikimedia Commons

También se proporcionaron datos de anotación para las imágenes de entrenamiento. Aquí, los patólogos habían etiquetado regiones de 300 x 300 micrones como lesionado o tejido normal . Sin embargo, las regiones anotadas no necesariamente abarcaron todo el tejido normal / lesionado en el portaobjetos, y las lesiones podrían extenderse más allá de los límites de las regiones anotadas.

En última instancia, nuestro objetivo era clasificar a nivel de portaobjetos, no el nivel de anotación. Por ejemplo, una imagen etiquetada como clase 3 podría tener anotaciones correspondientes a todas las clases 0, 1, 2 y 3, pero al menos una región contendría una lesión de clase 3.

Metodología

Las imágenes de diapositivas completas de este conjunto de datos pueden tener un tamaño enorme con la resolución más alta (100.000 x 100.000 píxeles o más). Muchas de las diapositivas también contienen cantidades significativas de fondo sin tejido, varios artefactos y regiones borrosas.

WSI de baja resolución con candidatos de tejido filtrado

Para analizar el WSI, dividimos la imagen en muchos candidatos de tejido de 300×300 micrones. Para hacer esto, usamos un filtro de máscara de tejido personalizado, que extrae regiones no superpuestas del WSI. Ejecutamos este filtro a baja resolución, lo que permite una segmentación de tejido extremadamente rápida, pero cambia algo de precisión por esta velocidad.

Una vez que tenemos un conjunto de candidatos de tejido, predecimos una etiqueta para cada uno y compílelos en un conjunto de candidatos para el WSI. El problema ahora es una instancia de Aprendizaje de instancias múltiples , donde necesitamos predecir una sola etiqueta de una bolsa de candidatos etiquetados.Debido a limitaciones de tiempo, nos decidimos por un método de predicción muy simple de utilizar un umbral de cuantiles. Para hacer esto, construimos una distribución de las etiquetas candidatas y elegimos el valor que ocurre en el percentil 70. Este valor funcionó bien en la práctica, a pesar de que existen métodos más rigurosos.

Para nuestro modelo de clasificación de candidatos, usamos una arquitectura CNN de estilo ResNet estándar. El modelo se entrenó en las imágenes de 300 x 300 micrones etiquetadas por los patólogos.

Diagrama de flujo para procesar WSI

Para entrenar nuestra CNN, usamos un solo escritorio Titan RTX, un Ryzen 2700x y 64 GB de RAM.

Resultados

El rendimiento se evaluó de acuerdo con una métrica ideada por un panel de patólogos. Cada clasificación se puntuó como 1 menos el error y la puntuación total fue el promedio de todas las predicciones.

Debido a la naturaleza del problema, es fundamental que la predicción sea correcta; sin embargo, no todas las clasificaciones erróneas son equivalentes. Es mucho peor clasificar un portaobjetos como normal cuando hay un carcinoma invasivo presente que tiene el potencial de una desventaja mucho mayor que el escenario opuesto.

En una sola semana de trabajo, pudimos armar un sistema que alcanzó una puntuación de 0,8933. Esto representa un error promedio de ~ 0.1, que corresponde a una predicción promedio que está dentro de 1 etiqueta de la verdad.

Gracias a DrivenData, la Sociedad Francesa de Patología y el Centro de Datos de Salud por organizar este competencia. Un agradecimiento especial a todos los patólogos individuales que etiquetaron y anotaron los datos. La creación de conjuntos de datos como el que se utiliza aquí es un recurso valioso que captura la experiencia colectiva del patólogo y permite avanzar en la visión médica por computadora.