조직 병변 분류 탐색

현미경은 병리학 자의 눈이 세포 수준에서 조직을 볼 수있는 도구였습니다. 딥 러닝 및 컴퓨터 비전 분야가 성숙함에 따라 병리학자는 이제 기술을 보완하고 이미지 분류를 지원하는 도구를 갖게되었습니다. 병리학 자의 일반적인 작업은 암을 진단하기 위해 현미경 수준에서 생검 조직을 검사하는 것입니다. 조직 슬라이드 검사는 수년간의 전문 교육을 마스터해야하는 힘들고 정확한 작업입니다. 컴퓨터 비전은보다 빠르고 정확한 진단을 가능하게하는 확실한 도구입니다. 특히 병리학 분야에서 컴퓨터 비전의 유용성은 디지털 병리학의 발전에 의해 더욱 확립되었습니다. 특정 작업을 컴퓨터 비전 소프트웨어에 위임함으로써 병리학자는 임상 해석 및 의사 결정 목적을위한 정보 합성을 포함하여 더 높은 수준의 프로세스에주의를 집중할 수 있습니다.

문제 설명

The French 병리 학회 ( SFP )는 DrivenData ,

이 과제는 자궁 경부의 상피 병변에 중점을두고 있으며 전문가가 라벨을 지정한 수천 개의 고유 한 컬렉션을 제공합니다. 프랑스 전역의 의료 센터에서 수집 한 WSI. 이와 같은 슬라이드의 병변은 대부분 양성이지만 (class 0) 다른 일부는 악성 가능성이 낮거나 (class 1) 악성 가능성이 높습니다. (class 2), 다른 사람들은 이미 침습성 암일 수 있습니다 (class 3).

프랑스 인구에서 수집 한 자궁 경부 조직 생검의 현미경 슬라이드의 맞춤형 이미지 분류기. SFP와 프랑스의 Health Data Hub 는 병변 심각도에 따라 해부학 적 병리학자가 분류 한 각 슬라이드와 함께 레이블이 지정된 전체 슬라이드 이미지의 928GB 교육 세트를 제공했습니다.

  • 0 정상 또는 비정상
  • 1 저 등급 편평 상피내 병변
  • 2 고급 편평 상피내 병변
  • 3 침습성 편평 암종

전체 슬라이드 이미지 ( WSI : WSI는 높은 수준의 배율로 현미경 슬라이드를 디지털로 표현한 것입니다.) 피라미드 형 TIF 형식에 관심이 있었지만 다양한 형식으로 피라미드 TIF는 각 해상도가 TIF 파일에 별도의 레이어로 저장되는 다중 해상도 형식입니다. 이러한 이미지는 하드웨어 집약적이지 않도록 약간 압축되지만 병리학자가 진단에 사용할 수있는 적절한 수준의 세부 정보를 유지합니다.

피라미드 TIF의 개략도. Cmglee , CC BY-SA 3.0 , Wikimedia Commons를 통해

학습 이미지에 대한 주석 데이터도 제공되었습니다. 여기에서 병리학 자들은 300×300 마이크론 영역을 병변 또는 정상 조직 으로 표시했습니다. 주석이 달린 영역은 슬라이드의 모든 병변 / 정상 조직을 반드시 포함하지는 않았고, 병변은 주석이 달린 영역의 경계를 넘어 확장 될 수 있습니다.

궁극적으로 우리의 목표는 슬라이드 수준에서 분류하는 것이 아니라 슬라이드 수준에서 분류하는 것이 었습니다. 주석 수준. 예를 들어 등급 3으로 라벨이 지정된 이미지에는 등급 0, 1, 2, 3 모두에 해당하는 주석이있을 수 있지만 적어도 하나의 영역에는 등급 3 병변이 포함됩니다.

방법론

이 데이터 세트의 전체 슬라이드 이미지는 가장 높은 해상도 (100,000 x 100,000 픽셀 이상)에서 크기가 방대 할 수 있습니다. 또한 대부분의 슬라이드에는 조직이없는 배경, 다양한 인공물 및 흐린 영역이 포함되어 있습니다.

필터링 된 조직 후보가있는 저해상도 WSI

WSI를 분석하기 위해 이미지를 300×300 미크론 조직 후보로 나눕니다. 이를 위해 WSI의 겹치지 않는 영역을 추출하는 사용자 지정 조직 마스크 필터를 사용했습니다. 우리는이 필터를 낮은 해상도로 실행하여 매우 빠른 조직 분할을 허용하지만이 속도에 대해 약간의 정확도를 제공합니다.

조직 후보 세트가 있으면 각각에 대한 레이블을 예측하고 이들을 WSI 후보로 모으십시오. 문제는 이제 다중 인스턴스 학습 의 인스턴스입니다. 여기에서 레이블이 지정된 후보의 백에서 단일 레이블을 예측해야합니다.시간 제약으로 인해 분위수 임계 값을 사용하는 매우 간단한 예측 방법을 결정했습니다. 이를 위해 후보 레이블의 분포를 구축하고 70 번째 백분위 수에서 발생하는 값을 선택합니다. 이 값은 더 엄격한 방법이 있음에도 불구하고 실제로 잘 작동했습니다.

후보 분류 모델의 경우 표준 ResNet 스타일의 CNN 아키텍처를 사용했습니다. 이 모델은 병리학자가 라벨을 지정한 300×300 미크론 이미지로 학습되었습니다.

WSI 처리 순서도

CNN 학습을 위해 단일 데스크톱 Titan RTX, Ryzen 2700x, 64GB RAM을 사용했습니다.

결과

h2>

성능은 병리학 자 패널이 고안 한 메트릭에 따라 평가되었습니다. 각 분류는 1에서 오류를 뺀 점수로 평가되었으며 총 점수는 모든 예측의 평균이었습니다.

문제의 특성으로 인해 정확한 예측을 얻는 것이 중요합니다. 그러나 모든 오 분류가 동일하지는 않습니다. 침습성 암종이있는 경우 슬라이드를 정상으로 분류하는 것이 훨씬 더 나쁩니다. 반대 시나리오보다 훨씬 더 큰 단점이 될 가능성이 있습니다.

일주일 만에 우리는 0.8933 점을 획득 한 시스템. 이것은 ~ 0.1의 평균 오류를 나타내며, 이는 진실로부터 1 레이블 이내의 평균 예측에 해당합니다.

이를 구성 해 주신 DrivenData, French Pathology Society 및 Health Data Hub에 감사드립니다. 경쟁. 데이터에 라벨을 붙이고 주석을 달 았던 모든 개별 병리학 자에게 특별히 감사드립니다. 여기에 사용 된 것과 같은 데이터 세트 생성은 병리학 자의 집단적 전문성을 포착하고 의료용 컴퓨터 비전의 발전을 가능하게하는 귀중한 리소스입니다.