Utforsking av vevslesjonsklassifisering

Mikroskopet har vært et verktøy for patologens øye for å se vev på mobilnivå. Med modningen av feltene dyp læring og datasyn, har patologer nå et verktøy for å supplere ferdighetene sine og hjelpe dem med bildeklassifisering. En vanlig oppgave for en patolog er undersøkelsen av vev fra en biopsi på et mikroskopisk nivå for å diagnostisere kreft. Inspeksjon av vevssklier er omhyggelig, presist arbeid som krever mange års spesialutdannelse for å mestre. Datasyn er et åpenbart verktøy som kan legge til rette for raskere og mer nøyaktige diagnoser. Nytten av datasyn innen patologi, spesielt, har blitt ytterligere etablert ved å fremme digital patologi. Ved å delegere spesifikke oppgaver til programvare for datasyn, er patologen i stand til å rette oppmerksomheten mot prosesser på høyere nivå, inkludert syntese av informasjon for klinisk tolkning og beslutningstaking.

Problembeskrivelse

Fransk Society of Pathology ( SFP ) arrangerte en konkurranse på DrivenData ,

Denne utfordringen fokuserer på epitellesjoner i livmorhalsen, og inneholdt en unik samling på tusenvis av ekspertmerket WSI-er samlet fra medisinske sentre over hele Frankrike. Lesjonene i lysbilder som disse er oftest godartede (class 0), men noen andre har lavt ondartet potensial (class 1) eller høyt ondartet potensial (class 2), og andre kan allerede være invasive kreftformer (class 3).

for å utvikle et skreddersydd bildeklassifiseringsprogram på mikroskop-lysbilder av livmorhalskreftvevbiopsier samlet fra den franske befolkningen. SFP og Frankrikes Health Data Hub ga et 928 GB treningssett med merkede hellysbilder med hvert lysbilde klassifisert av anatomiske patologer i henhold til lesjonens alvorlighetsgrad:

  • 0 Normal eller subnormal
  • 1 Plateinflame med lav grad av intraepitelial lesjon
  • 2 High squamous intraepithelial lesion
  • 3 Invasiv squamous carcinoma

Hele lysbildebilder ( WSIs: en WSI er en digital representasjon av et mikroskop lysbilde ved høye forstørrelsesnivåer) i en rekke formater, selv om vi var interessert i det pyramideformede TIF-formatet. Pyramidale TIFer er et format med flere oppløsninger med hver oppløsning lagret som et eget lag i TIF-filen. Disse bildene er komprimert litt for å gjøre dem mindre maskinvarekrevende, men beholder et detaljnivå som er tilstrekkelig for patologer å bruke til diagnoser.

Skjematisk oversikt over pyramideformet TIF. Cmglee , CC BY-SA 3.0 , via Wikimedia Commons

Kommentordata ble også gitt for treningsbildene. Her hadde patologene merket 300×300 mikronregioner som skadet eller normalt vev . De merkede områdene omfattet ikke nødvendigvis alt skadet / normalt vev på lysbildet, og lesjoner kunne strekke seg utenfor grensene til de merkede områdene.

Til slutt var vårt mål å klassifisere på lysbildenivå, ikke merknadsnivået. For eksempel kan et bilde merket som klasse 3 ha merknader som tilsvarer alle klassene 0, 1, 2 og 3, men minst en region vil inneholde en klasse 3-lesjon.

Metodikk

Hele lysbildebilder i dette datasettet kan ha massiv størrelse med den høyeste oppløsningen (100.000 x 100.000 piksler eller høyere). Mye av lysbildene inneholder også betydelige mengder vevsfri bakgrunn, forskjellige gjenstander og uskarpe regioner.

Lav oppløsnings WSI med filtrerte vevskandidater

For å analysere WSI deler vi bildet i mange 300×300 mikron vevskandidater. For å gjøre dette brukte vi et tilpasset vevsmaskefilter, som trekker ut ikke-overlappende regioner av WSI. Vi kjører dette filteret med lav oppløsning, noe som gir ekstremt rask vevssegmentering, men bytter nøyaktighet for denne hastigheten.

Når vi har et sett med vevskandidater, forutsier vi en etikett for hver og samle dem i et sett med kandidater til WSI. Problemet er nå en forekomst av Multiple Instance Learning , der vi trenger å forutsi en enkelt etikett fra en pose med merkede kandidater.På grunn av tidsbegrensninger avgjorde vi en veldig enkel prediksjonsmetode for å bruke en kvantitetsterskel. For å gjøre dette bygger vi opp en fordeling av kandidatetikettene, og velger verdien som oppstår ved den 70. persentilen. Denne verdien fungerte bra i praksis, til tross for at det var strengere metoder.

For vår kandidatklassifiseringsmodell brukte vi en standard ResNet-stil CNN-arkitektur. Modellen ble trent på 300×300 mikron bilder merket av patologene.

Flytskjema for behandling av WSIer

For å trene vår CNN brukte vi en enkelt desktop Titan RTX, en Ryzen 2700x og 64 GB RAM.

Resultater

Ytelsen ble evaluert i henhold til en beregning utarbeidet av et panel av patologer. Hver klassifisering ble scoret som 1 minus feilen, og den totale poengsummen var gjennomsnittet i alle spådommer.

På grunn av problemets natur er det viktig å få spådommen riktig; imidlertid ikke alle feilklassifiseringer er likeverdige. Det er mye verre å klassifisere et lysbilde som normalt når det er et invasivt karsinom som har potensial for en mye større ulempe enn det motsatte scenariet.

Innen en enkelt ukes arbeid kunne vi sette sammen en system som oppnådde en poengsum på 0,8933. Dette representerer en gjennomsnittsfeil på ~ 0,1, som tilsvarer en gjennomsnittlig prediksjon som er innenfor en etikett fra sannheten.

Takk til DrivenData, French Pathology Society og Health Data Hub for organisering av dette konkurranse. En spesiell takk til alle de enkelte patologene som merket og merket dataene. Opprettelsen av datasett som den som brukes her er en verdifull ressurs som fanger patologens kollektive ekspertise og gjør det mulig å gjøre fremskritt innen medisinsk datasyn.