견고함과 데이터

소식

홈페이지홈페이지 / 소식 / 견고함과 데이터

Jun 05, 2023

견고함과 데이터

자연의생명공학과

Nature Biomedical Engineering (2023)이 기사 인용

32 알트메트릭

측정항목 세부정보

의료 작업을 위한 기계 학습 모델은 임상 전문가의 성능과 동등하거나 능가할 수 있습니다. 그러나 훈련 데이터 세트와 다른 설정에서는 모델 성능이 크게 저하될 수 있습니다. 여기에서는 이러한 '배포 외' 성능 문제를 완화하고 모델 견고성과 교육 효율성을 향상시키는 의료 영상 작업에 적용되는 기계 학습 모델에 대한 표현 학습 전략을 보고합니다. REMEDIS('자체 감독을 통한 강력하고 효율적인 의료 영상')라고 명명된 이 전략은 자연 이미지에 대한 대규모 지도 전이 학습과 의료 이미지에 대한 중간 대비 자기 지도 학습을 결합하고 최소한의 작업별 맞춤화가 필요합니다. 우리는 6개의 이미징 도메인과 15개의 테스트 데이터 세트를 포괄하고 세 가지 현실적인 배포 외 시나리오를 시뮬레이션하여 다양한 진단 이미징 작업에서 REMEDIS의 유용성을 보여줍니다. REMEDIS는 강력한 지도 기준 모델과 관련하여 분포 내 진단 정확도를 최대 11.5% 향상시켰으며, 분포 외 설정에서는 사용 가능한 모든 데이터를 사용하여 재교육된 지도 모델의 성능과 일치하도록 재교육하는 데 데이터의 1~33%만 필요했습니다. . REMEDIS는 의료 영상용 기계 학습 모델의 개발 수명주기를 가속화할 수 있습니다.

구독 콘텐츠의 미리보기입니다. 기관을 통해 액세스하세요.

Nature 및 기타 54개 Nature 포트폴리오 저널에 액세스하세요.

최고의 가치를 지닌 온라인 액세스 구독인 Nature+를 받으세요

$29.99 / 30일

언제든지 취소하세요

이 저널을 구독하세요

12개의 디지털 발행물과 기사에 대한 온라인 액세스를 받습니다.

연간 $79.00

호당 단 $6.58

이 기사를 대여하거나 구매하세요

필요한 만큼 이 기사를 받아보세요.

$39.95

가격에는 결제 시 계산되는 지방세가 적용될 수 있습니다.

Northwestern Medicine과 Apollo Hospitals의 데이터 세트는 현재 연구에 대한 라이선스에 따라 사용되었으며 공개적으로 사용할 수 없습니다. Optimam 데이터베이스에 대한 액세스 신청은 이 웹 양식을 사용하여 작성할 수 있습니다. 본 연구에 사용된 비식별 원격피부과 데이터는 데이터 공유 계약의 제한으로 인해 공개적으로 사용할 수 없습니다. DME 분류에 사용되는 레이블이 없는 데이터 세트는 EyePACS Inc.의 식별되지 않은 데이터입니다. 관심 있는 연구자는 [email protected]에 연락하여 EyePACS 데이터에 대한 액세스에 대해 문의하고 연구 개발 부서에 연락하여 VA 데이터에 대한 액세스에 대해 문의해야 합니다. ID 및 OOD DME 분류 작업에 대한 주석이 달린 나머지 데이터는 태국 라자비티 병원과 라이온스 안구 연구소에서 수집되었으며 데이터 공유 계약의 제한으로 인해 공개적으로 사용할 수 없습니다. MIMIC-CXR, CheXpert 및 ChestX-ray 14를 포함하여 흉부 X선 상태 분류의 평가 및 사전 훈련에 사용되는 데이터는 공개적으로 제공됩니다. ID 미세 조정 및 전이 감지 평가에 사용되는 데이터는 CAMELYON 챌린지 웹사이트에서 공개적으로 제공됩니다. 병리학 기반 전이 감지 및 생존 예측 작업에 대한 사전 훈련에 사용되는 TCGA 데이터는 NIH 웹 사이트를 통해 제공됩니다. 병리학 작업에 사용되는 나머지 데이터는 데이터 공유 계약의 제한으로 인해 공개적으로 사용할 수 없습니다. 또한 기준 지도 모델의 사전 학습에 사용되는 ImageNet-1K(ILSVRC-2012)68과 BiT-M 모델의 사전 학습에 사용되는 ImageNet-21K는 ImageNet 웹 사이트를 통해 공개적으로 제공됩니다. JFT-300M54 데이터 세트에서 훈련된 BiT-L 모델은 데이터 공유 계약의 제한으로 인해 공개적으로 사용할 수 없습니다.

작업의 여러 주요 구성 요소는 T 라이브러리와 같은 오픈 소스 저장소에서 사용할 수 있습니다. 자기 지도 사전 학습에 사용되는 코드 기반 및 사전 학습된 가중치는 S에서 확인할 수 있습니다. BiT 모델의 코드 기반 및 사전 학습된 가중치는 B에서 확인할 수 있습니다. 모든 실험 및 구현 세부 사항은 지원을 위한 방법 및 보충 정보에 충분히 자세히 설명되어 있습니다. 비독점 라이브러리를 사용한 복제. ResNet-RS와의 비교에 사용된 코드 베이스는 R을 기반으로 했습니다. REMEDIS를 통해 생성된 여러 체크포인트와 모델은 연구원이 P를 통해 쉽게 액세스할 수 있습니다. 또한 GitHub의 Foundation Medical ML 리포지토리는 다음을 수행할 수 있는 코드에 대한 액세스를 제공합니다. REMEDIS 기반 모델을 훈련하는 데 사용됩니다.