Tutkimalla kudosvaurioiden luokitusta

Mikroskooppi on ollut työkalu patologin silmälle kudosten tarkastelemiseen solutasolla. Syvän oppimisen ja tietokonenäön kenttien kypsyessä patologeilla on nyt työkalu täydentää taitojaan ja auttaa heitä kuvien luokittelussa. Yhteinen tehtävä patologille on koepalan kudosten tutkiminen mikroskooppisella tasolla syöpien diagnosoimiseksi. Kudosluistojen tarkastus on huolellinen, tarkka työ, jonka hallitsemiseksi tarvitaan vuosien erikoistumista. Tietokonenäkö on ilmeinen työkalu, joka voi helpottaa nopeampaa ja tarkempaa diagnoosia. Tietokonenäön hyödyllisyys erityisesti patologian alalla on edelleen vahvistettu edistämällä digitaalista patologiaa. Siirtämällä tietyt tehtävät tietokoneiden visio-ohjelmistoille patologi pystyy keskittämään huomionsa korkeamman tason prosesseihin, mukaan lukien tietojen syntetisointi kliinistä tulkintaa ja päätöksentekoa varten.

Ongelman kuvaus

ranska Patologian yhdistys ( SFP ) järjesti kilpailun DrivenData ,

Tämä haaste keskittyy kohdun kohdunkaulan epiteelivaurioihin, ja siinä oli ainutlaatuinen kokoelma tuhansia asiantuntijamerkittyjä WSI: t kerättiin lääketieteellisistä keskuksista ympäri Ranskaa. Tämän kaltaisten dioiden leesiot ovat useimmiten hyvänlaatuisia (class 0), mutta joillakin muilla on vähäinen pahanlaatuinen potentiaali (class 1) tai korkea pahanlaatuinen potentiaali (class 2), ja muut voivat jo olla invasiivisia syöpiä (class 3).

kehittyä mittatilaustyönä kuvaluokitus Ranskan väestöstä kerättyjen kohdun kohdunkaulan kudosbiopsioiden mikroskooppikuville. SFP ja Ranskan Health Data Hub tarjosivat 928 Gt: n kokoisen koulutusjoukon leimattuja kokonaisia ​​diakuvia, joista jokainen dia oli luokiteltu anatomisten patologien mukaan vaurion vakavuuden mukaan:

  • 0 Normaali tai epänormaali
  • 1 Matala-asteen okasepiteelisisäinen leesio
  • 2 Korkean asteen okasepiteelisisäinen vaurio
  • 3 Invasiivinen okasyöpä

Kokonaiset diakuvat ( WSI: a WSI on mikroskooppidian digitaalinen esitys suurella suurennuksella) monissa muodoissa, vaikka olimme kiinnostuneita pyramidin muotoisesta TIF-muodosta. Pyramidaaliset TIF-tiedostot ovat moniresoluutioisia muotoja, ja jokainen resoluutio on tallennettu erillisenä kerroksena TIF-tiedostoon. Nämä kuvat pakataan hieman, jotta ne olisivat vähemmän laitteistovaatimuksia, mutta säilyttävät riittävän yksityiskohtaisen tason, jonka patologit voivat käyttää diagnooseissa.

Kaavio pyramidisesta TIF: stä. Cmglee , CC BY-SA 3.0 Wikimedia Commonsin kautta

Merkintätiedot toimitettiin myös harjoituskuville. Tässä patologit olivat merkinneet 300×300 mikronin alueet vaurioituneeksi tai normaaliksi kudokseksi . Merkityt alueet eivät välttämättä käsittäneet kaikkia dian leesioituneita / normaaleja kudoksia, ja vauriot voisivat ulottua annotoitujen alueiden rajojen ulkopuolelle.

Viime kädessä tavoitteemme oli luokittelu diatasolla merkintätaso. Esimerkiksi luokassa 3 merkitty kuva voi sisältää merkintöjä, jotka vastaavat kaikkia luokkia 0, 1, 2 ja 3, mutta ainakin yksi alue sisältäisi luokan 3 vaurion.

Menetelmä

Tämän datasetin kokonaiset diakuvat voivat olla suurikokoisia korkeimmalla tarkkuudella (100 000 x 100 000 pikseliä tai enemmän). Suuri osa dioista sisältää myös merkittävän määrän kudoksia sisältämätöntä taustaa, erilaisia ​​esineitä ja näön alueita.

Matala resoluutio WSI suodatettujen kudosten ehdokkailla

WSI: n analysoimiseksi jaamme kuvan moniin 300×300 mikronin kudosehdokkaisiin. Tätä varten käytimme mukautettua kudosmaskisuodatinta, joka poimii WSI: n päällekkäiset alueet. Suoritamme tätä suodatinta matalalla tarkkuudella, mikä mahdollistaa erittäin nopean kudossegmentoinnin, mutta käy jonkin verran tarkkuutta tälle nopeudelle.

Kun meillä on joukko kudosehdokkaita, ennustamme jokaiselle leiman ja koota heidät joukoksi ehdokkaita WSI: lle. Ongelma on nyt monen instanssin oppimisen esimerkki, jossa meidän on ennustettava yksi tunniste leimattujen ehdokkaiden pussista.Aikarajoitteiden takia päädyimme hyvin yksinkertaiseen ennustusmenetelmään kvantiilikynnyksen käyttämiseksi. Tätä varten rakennamme ehdokasetikettien jakauman ja valitsemme arvon, joka esiintyy 70. prosenttipisteessä. Tämä arvo toimi käytännössä hyvin, huolimatta siitä, että menetelmiä on tiukempia.

Ehdokasluokittelumallissamme käytimme vakiomallista ResNet-tyylistä CNN-arkkitehtuuria. Malli koulutettiin patologien merkitsemiin 300×300 mikronin kuviin.

Vuokaavio WSI-tiedostojen käsittelemiseksi

CNN: n kouluttamiseen käytimme yhtä työpöydän Titan RTX -laitetta, Ryzen 2700x -muistia ja 64 Gt RAM-muistia.

Tulokset

Suorituskyky arvioitiin patologilautakunnan laatiman mittarin mukaan. Jokainen luokitus pisteytettiin arvona 1 miinus virhe ja kokonaispisteet olivat kaikkien ennusteiden keskiarvo.

Ongelman luonteen vuoksi on kriittistä saada ennuste oikein; kaikki väärät luokitukset eivät kuitenkaan ole samanarvoisia. On paljon huonompi luokitella dio normaaliksi, kun läsnä on invasiivinen karsinooma, jonka potentiaalia voi olla paljon suurempi kuin päinvastaisessa skenaariossa.

Yhden viikon työhön saimme koonnut järjestelmä, joka saavutti pistemäärän 0,8933. Tämä edustaa keskimääräistä virhettä ~ 0,1, mikä vastaa keskimääräistä ennustetta, joka on yhden merkinnän sisällä totuudesta.

Kiitos DrivenDatalle, Ranskan patologiayhdistykselle ja Health Data Hubille tämän järjestämisestä. kilpailu. Erityinen kiitos kaikille yksittäisille patologeille, jotka merkitsivät ja merkitsivät tiedot. Tässä käytetyn kaltaisten tietojoukkojen luominen on arvokas resurssi, joka kerää patologin kollektiivista asiantuntemusta ja mahdollistaa edistymisen lääketieteen tietokonenäkössä.