Badanie klasyfikacji zmian tkanek

Mikroskop był narzędziem dla oka patologa do oglądania tkanek na poziomie komórkowym. Wraz z dojrzewaniem dziedzin głębokiego uczenia się i widzenia komputerowego, patolodzy mają teraz narzędzie uzupełniające ich zestaw umiejętności i pomagające im w klasyfikacji obrazów. Częstym zadaniem patologa jest badanie tkanki z biopsji na poziomie mikroskopowym w celu zdiagnozowania raka. Sprawdzanie szkiełek tkankowych to żmudna, precyzyjna praca, której opanowanie wymaga lat specjalistycznego szkolenia. Wizja komputerowa jest oczywistym narzędziem, które może ułatwić szybszą i dokładniejszą diagnozę. Przydatność widzenia komputerowego w dziedzinie patologii została dodatkowo potwierdzona przez postęp w patologii cyfrowej. Przekazując określone zadania oprogramowaniu do przetwarzania obrazu, patolog może skupić swoją uwagę na procesach wyższego poziomu, w tym na syntezowaniu informacji do interpretacji klinicznej i do podejmowania decyzji.

Opis problemu

Francuski Society of Pathology ( SFP ) było gospodarzem konkursu w dniu DrivenData ,

To wyzwanie koncentruje się na zmianach nabłonkowych szyjki macicy i zawiera unikalną kolekcję tysięcy oznaczonych przez ekspertów WSI pobrane z ośrodków medycznych w całej Francji. Zmiany chorobowe na takich slajdach są najczęściej łagodne (class 0), ale niektóre inne mają niski potencjał złośliwości (class 1) lub wysoki potencjał złośliwy (class 2), a inne mogą już być nowotworami inwazyjnymi (class 3).

do rozwoju opracowany na zamówienie klasyfikator obrazów na szkiełkach mikroskopowych biopsji tkanki szyjki macicy pobranych od populacji francuskiej. SFP i francuskie Health Data Hub dostarczyły zestaw szkoleniowy o pojemności 928 GB oznaczonych pełnych obrazów slajdów, przy czym każdy slajd został sklasyfikowany przez patologów anatomicznych według ciężkości uszkodzenia:

  • 0 Normalne lub podnormalne
  • 1 Płaskonabłonkowe zmiany śródnabłonkowe o niskim stopniu złośliwości
  • 2 Płaskonabłonkowa zmiana śródnabłonkowa wysokiego stopnia
  • 3 Inwazyjny rak płaskonabłonkowy

Całe obrazy slajdów ( WSI: WSI to cyfrowa reprezentacja slajdu mikroskopowego przy dużym powiększeniu) w różnych formatach, chociaż interesował nas piramidalny format TIF. Piramidalne pliki TIF to format o wielu rozdzielczościach, w którym każda rozdzielczość jest przechowywana jako osobna warstwa w pliku TIF. Te obrazy są nieco kompresowane, aby zmniejszyć obciążenie sprzętowe, ale zachowują poziom szczegółowości odpowiedni dla patologów do diagnozowania.

Schemat piramidalnego TIF. Cmglee , CC BY-SA 3.0 , za pośrednictwem Wikimedia Commons

Dane adnotacji zostały również dostarczone do obrazów szkoleniowych. Tutaj patolodzy oznaczyli obszary 300×300 mikronów jako uszkodzone lub normalne tkanki . Obszary z adnotacjami niekoniecznie obejmowały wszystkie uszkodzone / normalne tkanki na szkiełku, a zmiany mogą wykraczać poza granice regionów z adnotacjami.

Ostatecznie naszym celem była klasyfikacja na poziomie szkiełka, a nie poziom opisu. Na przykład obraz oznaczony jako klasa 3 mógłby mieć adnotacje odpowiadające wszystkim klasom 0, 1, 2 i 3, ale przynajmniej jeden region zawierałby zmianę klasy 3.

Metodologia

Obrazy całych slajdów w tym zestawie danych mogą mieć ogromne rozmiary w najwyższej rozdzielczości (100 000 x 100 000 pikseli lub więcej). Wiele slajdów zawiera również znaczne ilości tła pozbawionego tkanki, różne artefakty i rozmyte obszary.

Niska rozdzielczość WSI z kandydatami z filtrowanej tkanki

W celu analizy WSI dzielimy obraz na wiele kandydatów na tkanki o wymiarach 300×300 mikronów. W tym celu zastosowaliśmy niestandardowy filtr maski tkankowej, który wyodrębnia nienakładające się obszary WSI. Uruchamiamy ten filtr w niskiej rozdzielczości, co pozwala na niezwykle szybką segmentację tkanek, ale daje pewną dokładność tej szybkości.

Gdy mamy zestaw kandydatów na tkanki, przewidujemy etykietę dla każdej z nich i skompilować je w zbiór kandydatów na WSI. Problem dotyczy teraz wystąpienia uczenia się wielu instancji , w którym musimy przewidzieć pojedynczą etykietę z zbioru oznaczonych kandydatów.Ze względu na ograniczenia czasowe zdecydowaliśmy się na bardzo prostą metodę przewidywania z użyciem progu kwantylowego. Aby to zrobić, tworzymy rozkład kandydujących etykiet i wybieramy wartość, która występuje w 70. percentylu. Wartość ta sprawdziła się w praktyce, mimo że istnieją bardziej rygorystyczne metody.

W naszym modelu klasyfikacji kandydatów wykorzystaliśmy standardową architekturę CNN w stylu ResNet. Model został wytrenowany na obrazach 300×300 mikronów oznaczonych przez patologów.

Schemat blokowy przetwarzania WSI

Do treningu naszego CNN użyliśmy jednego stacjonarnego Titana RTX, Ryzena 2700x i 64 GB pamięci RAM.

Wyniki

Wydajność oceniano zgodnie z miernikiem opracowanym przez panel patologów. Każda klasyfikacja została oceniona jako 1 minus błąd, a łączny wynik był średnią ze wszystkich prognoz.

Ze względu na naturę problemu krytyczne jest uzyskanie poprawnej prognozy; jednak nie wszystkie błędne klasyfikacje są równoważne. Znacznie gorzej jest sklasyfikować slajd jako normalny, gdy obecny jest rak inwazyjny, co może mieć znacznie większy minus niż scenariusz odwrotny.

W ciągu jednego tygodnia pracy byliśmy w stanie zebrać system, który uzyskał wynik 0,8933. Stanowi to średni błąd ~ 0,1, co odpowiada średniej prognozie, która jest w granicach 1 etykiety od prawdy.

Dziękujemy DrivenData, Francuskiemu Towarzystwu Patologicznemu i Centrum Danych Zdrowia za zorganizowanie tego konkurencja. Specjalne podziękowania dla wszystkich poszczególnych patologów, którzy oznakowali i opatrzyli adnotacjami dane. Tworzenie zbiorów danych, takich jak ten użyty tutaj, jest cennym zasobem, który zawiera zbiorową wiedzę patologa i pozwala na postęp w medycznej wizji komputerowej.