Utforska vävnadslesionsklassificering

Mikroskopet har varit ett verktyg för patologens öga för att se vävnader på cellulär nivå. Med mognandet av områdena djupinlärning och datorsyn har patologer nu ett verktyg för att komplettera sina färdigheter och hjälpa dem i bildklassificering. En vanlig uppgift för en patolog är undersökning av vävnad från en biopsi på mikroskopisk nivå för att diagnostisera cancer. Att inspektera vävnadsglas är noggrant, exakt arbete som kräver år av specialutbildning för att bemästra. Datorsyn är ett uppenbart verktyg som kan underlätta snabbare och noggrannare diagnoser. Användningen av datorvision inom patologifältet har specifikt etablerats ytterligare genom utvecklingen av digital patologi. Genom att delegera specifika uppgifter till datorvisionsprogramvara kan patologen fokusera sin uppmärksamhet på högre nivåer, inklusive syntetisering av information för klinisk tolkning och beslutsfattande.

Problembeskrivning

Franska Society of Pathology ( SFP ) var värd för en tävling på DrivenData ,

Denna utmaning fokuserar på epitelskador i livmoderhalsen och innehöll en unik samling av tusentals expertmärkta WSI: er samlade från medicinska centra över hela Frankrike. Skadorna i bilder som dessa är oftast godartade (class 0), men vissa andra har låg malign potential (class 1) eller hög malign potential (class 2), och andra kan redan vara invasiva cancerformer (class 3).

för att utveckla en skräddarsydd bildklassificering på objektglas från livmoderhalsvävnadsbiopsier samlade från den franska befolkningen. SFP och Frankrikes Health Data Hub tillhandahöll en 928 GB utbildningsuppsättning med märkta helbildbilder med varje bild klassificerad av anatomiska patologer enligt svårighetsgraden av lesionen:

  • 0 Normal eller subnormal
  • 1 Låggradig skivepitel intraepitelial lesion
  • 2 Högkvalitativ skivepitel intraepitelial lesion
  • 3 Invasiv skivepitelcancer

Hela bildbilder ( WSIs: en WSI är en digital representation av ett mikroskopglas med hög förstoringsnivå) i en mängd olika format, även om vi var intresserade av det pyramidformade TIF-formatet. Pyramidala TIF-filer är ett format med flera upplösningar där varje upplösning lagras som ett separat lager i TIF-filen. Dessa bilder komprimeras något för att göra dem mindre hårdvaruintensiva, men behåller en detaljnivå som är tillräcklig för patologer att använda för diagnoser.

Schematisk bild av pyramidal TIF. Cmglee , CC BY-SA 3.0 , via Wikimedia Commons

Annotationsdata tillhandahölls också för träningsbilderna. Här hade patologerna märkt 300×300 mikronregioner som skadat eller normal vävnad . De kommenterade regionerna omfattade inte nödvändigtvis all skadad / normal vävnad på bilden, och lesioner kunde sträcka sig utanför gränserna för de kommenterade regionerna.

I slutändan var vårt mål att klassificera på bilden, inte anteckningsnivån. Till exempel kan en bild märkt som klass 3 ha anteckningar som motsvarar alla klasserna 0, 1, 2 och 3 men åtminstone en region skulle innehålla en klass 3-lesion.

Metod

Hela bildbilder i denna dataset kan ha stor storlek med högsta upplösning (100 000 x 100 000 pixlar eller högre). Mycket av bilderna innehåller också betydande mängder vävnadslös bakgrund, olika artefakter och suddiga områden.

WSI med låg upplösning med filtrerade vävnadskandidater

För att analysera WSI, delar vi upp bilden i många 300×300 mikron vävnadskandidater. För att göra detta använde vi ett anpassat vävnadsmaskerfilter som extraherar icke-överlappande regioner i WSI. Vi kör det här filtret med låg upplösning, vilket möjliggör extremt snabb vävnadssegmentering, men byter viss noggrannhet för denna hastighet.

När vi har en uppsättning vävnadskandidater förutsäger vi en etikett för var och en sammanställa dem till en uppsättning kandidater för WSI. Problemet är nu en instans av Multiple Instance Learning , där vi behöver förutsäga en enda etikett från en påse med märkta kandidater.På grund av tidsbegränsningar bestämde vi oss för en mycket enkel förutsägelsemetod för att använda en kvantitröskel. För att göra detta bygger vi upp en fördelning av kandidatetiketterna och väljer det värde som uppstår vid den 70: e percentilen. Detta värde fungerade bra i praktiken, trots att det finns strängare metoder.

För vår kandidatklassificeringsmodell använde vi en standard ResNet-stil CNN-arkitektur. Modellen utbildades på 300×300 mikron bilder märkta av patologerna.

Flödesschema för bearbetning av WSI

För träning av vårt CNN använde vi ett enda skrivbord Titan RTX, en Ryzen 2700x och 64 GB RAM.

Resultat

Prestanda utvärderades enligt ett mått som utarbetats av en panel av patologer. Varje klassificering fick 1 minus felet och den totala poängen var genomsnittet för alla förutsägelser.

På grund av problemets natur är det viktigt att få förutsägelsen korrekt; emellertid är inte alla felklassificeringar likvärdiga. Det är mycket värre att klassificera en bild som normalt när det finns ett invasivt karcinom som har potential för en mycket större nackdel än det motsatta scenariot.

Inom en enda arbetsvecka kunde vi sätta ihop en system som uppnådde en poäng på 0,8933. Detta representerar ett genomsnittligt fel på ~ 0,1, vilket motsvarar en genomsnittlig förutsägelse som ligger inom en etikett från sanningen.

Tack till DrivenData, French Pathology Society och Health Data Hub för att organisera detta konkurrens. Ett särskilt tack till alla enskilda patologer som märkte och kommenterade uppgifterna. Skapandet av datamängder som den som används här är en värdefull resurs som fångar patologens samlade expertis och gör det möjligt att göra framsteg inom medicinsk datorsyn.