Udforskning af vævslæsionsklassificering

Mikroskopet har været et værktøj for patologens øje til at se væv på celleniveau. Med modningen af ​​felterne dyb læring og computersyn har patologer nu et værktøj til at supplere deres færdigheder og hjælpe dem med billedklassificering. En fælles opgave for en patolog er undersøgelse af væv fra en biopsi på et mikroskopisk niveau for at diagnosticere kræft. Inspektion af vævsklip er omhyggeligt og præcist arbejde, der kræver mange års specialuddannelse at mestre. Computersyn er et oplagt værktøj, der kan lette hurtigere og nøjagtige diagnoser. Nytten af ​​computersyn inden for patologiområdet er specifikt blevet yderligere etableret ved fremskridt inden for digital patologi. Ved at delegere specifikke opgaver til computersynssoftware er patologen i stand til at fokusere deres opmærksomhed på processer på højere niveau, herunder syntese af information til klinisk fortolkning og beslutningstagning.

Problembeskrivelse

Den franske Society of Pathology ( SFP ) var vært for en konkurrence om DrivenData ,

Denne udfordring fokuserer på epitel-læsioner i livmoderhalsen og indeholdt en unik samling af tusindvis af ekspertmærket WSIer indsamlet fra medicinske centre i hele Frankrig. Læsionerne i dias som disse er oftest godartede (class 0), men nogle andre har lavt ondartet potentiale (class 1) eller højt ondartet potentiale (class 2), og andre kan allerede være invasive kræftformer (class 3).

for at udvikle en skræddersyet billedklassifikator på objektglas fra livmoderhalskræftvævsbiopsier indsamlet fra den franske befolkning. SFP og Frankrigs Health Data Hub leverede et 928 GB træningssæt med mærkede hele diasbilleder med hvert dias klassificeret af anatomiske patologer i henhold til læsionens sværhedsgrad:

  • 0 Normal eller subnormal
  • 1 Pladeskadet intraepiteliel læsion med lav kvalitet
  • 2 High squamous intraepithelial læsion
  • 3 Invasiv squamous carcinoma

Hele diasbilleder ( WSIer: en WSI er en digital repræsentation af et objektglas ved høje forstørrelsesniveauer) i en række forskellige formater, selvom vi var interesserede i det pyramideformede TIF-format. Pyramidale TIFer er et format med flere opløsninger, hvor hver opløsning er gemt som et separat lag i TIF-filen. Disse billeder er komprimeret lidt for at gøre dem mindre hardwareintensive, men bevarer et detaljeringsniveau, som patologer kan bruge til diagnoser.

Skematisk af pyramideformet TIF. Cmglee , CC BY-SA 3.0 , via Wikimedia Commons

Annotationsdata blev også leveret til træningsbillederne. Her havde patologerne mærket 300×300 mikronregioner som læsioneret eller normalt væv . De annoterede regioner omfattede dog ikke nødvendigvis alt læsioneret / normalt væv på diaset, og læsioner kunne strække sig ud over de annoterede regioners grænser.

I sidste ende var vores mål at klassificere på diasniveau, ikke annoteringsniveauet. For eksempel kan et billede, der er mærket som klasse 3, have annoteringer, der svarer til alle klasser 0, 1, 2 og 3, men mindst en region vil indeholde en klasse 3-læsion.

Metode

Hele diasbilleder i dette datasæt kan have massiv størrelse i den højeste opløsning (100.000 x 100.000 pixels eller højere). Meget af objektglassene indeholder også betydelige mængder vævsløs baggrund, forskellige artefakter og slørede områder.

WSI med lav opløsning med filtrerede vævskandidater

For at analysere WSI opdeler vi billedet i mange 300×300 mikron vævskandidater. For at gøre dette brugte vi et brugerdefineret vævsmaskefilter, der ekstraherer ikke-overlappende regioner i WSI. Vi kører dette filter med en lav opløsning, hvilket giver mulighed for ekstrem hurtig vævssegmentering, men handler med en vis nøjagtighed for denne hastighed.

Når vi har et sæt vævskandidater, forudsiger vi en etiket for hver enkelt, og kompilere dem i et sæt kandidater til WSI. Problemet er nu en forekomst af Multiple Instance Learning , hvor vi har brug for at forudsige en enkelt etiket fra en pose med mærkede kandidater.På grund af tidsbegrænsninger besluttede vi os for en meget enkel forudsigelsesmetode til brug af en kvantitetstærskel. For at gøre dette opbygger vi en fordeling af kandidatmærkerne og vælger den værdi, der opstår ved den 70. percentil. Denne værdi fungerede godt i praksis, på trods af at der var mere stringente metoder.

Til vores kandidatklassificeringsmodel brugte vi en standard ResNet-stil CNN-arkitektur. Modellen blev trænet på de 300×300 mikron billeder, der var mærket af patologerne.

Flowchart til behandling af WSIer

Til træning af vores CNN brugte vi et enkelt desktop Titan RTX, en Ryzen 2700x og 64 GB RAM.

Resultater

Ydeevne blev evalueret i henhold til en måling udtænkt af et panel af patologer. Hver klassificering blev scoret som 1 minus fejlen, og den samlede score var gennemsnittet på tværs af alle forudsigelser.

På grund af problemets art er det vigtigt at få forudsigelsen korrekt; dog er ikke alle forkert klassifikationer ens. Det er meget værre at klassificere et dias som normalt, når der er et invasivt karcinom til stede, der har potentiale til en langt større ulempe end det modsatte scenario.

Inden for en enkelt uges arbejde var vi i stand til at sammensætte en system, der opnåede en score på 0,8933. Dette repræsenterer en gennemsnitlig fejl på ~ 0,1, hvilket svarer til en gennemsnitlig forudsigelse, der ligger inden for en etiket fra sandheden.

Tak til DrivenData, det franske patologiforening og Health Data Hub for at organisere dette konkurrence. En særlig tak til alle de enkelte patologer, der har mærket og kommenteret dataene. Oprettelsen af ​​datasæt som den, der bruges her, er en værdifuld ressource, der fanger patologens kollektive ekspertise og gør det muligt at gøre fremskridt inden for medicinsk computersyn.