医学人工智能周刊6|模态无关的学习方法在医学影像以及生理信号中的评测
摘要 #
目的:建立基准测试BenchMD,用于测试模型无关的方法包括架构和训练技术(例如自监督学习、预训练)在临床相关的医疗任务上的表现。简言之,就是测试最新一些通用人工智能方法在医疗任务上的表现。
BenchMD包括19个公开数据集,7种医疗数据模态,1维传感器数据、2维图片、3维扫描数据。
结果表明,没有一种与模态无关的技术在所有模态上都能实现强大的性能,基准模型有充足的改进空间。
引言 #
背景:Transformers模型和自监督学习(SSL)对标签数据需求小、能灵活运用到多种模态的数据。
问题:衡量这些进展在领域内的效果需要制定具有广度和深度的评测,以捕捉应用和模式的多样性,并通过让专家参与评测过程来确保外部有效性。
当前医疗AI领域应用时针对具体问题,通过试验选择不同的架构以及自监督学习方法,期望发展一种灵活、与模态无关无需定制化就能应用到各类问题的方法。
解决:BenchMD针对每种模态构建标准化、临床有效的评估方法,并通过专家验证;同时探索了基准数据标签不足情况和数据偏移情况下的表现;
同时,为了让BenchMD更加容易使用:
- 易用性:新架构和任务即插即用
- 易复现:全部使用公开数据集
结果显示医疗AI领域通用、泛化性强方法仍需继续研究。
相关工作 #
- 模态无关的技术:SSL
- 掩码建模
- 对比学习
- 模态无关的医学人工智能
- 在医学图像上自监督MAE比ImageNet上预训练要好
- 医学影像有无监督预训练加上监督学习表现好
- 现有多种模态的基准测试
模态和数据集 #
整理了一系列高影响模态数据以及精心挑选的数据源和目标数据集,用于评估分布外 (OOD) 性能。
12-lead ECGs #
利用5秒采样频率为500Hz的12导心电数据进行7分类:正常、传导障碍、心肌肥厚、心肌梗死、缺血性ST-T改变、心房颤动/心房扑动及其他。
数据包括:
- PTB-XL (18k) 1989-1996
- Chapman-Shaoxing (10k) 2020
- Georgia 12-Lead ECG Challenge (10k) 2020
- China Physiological Signal Challenge (6.8k) 2018
EEG #
30秒单导EEG睡眠分期任务。使用AASM睡眠分期标准:觉醒、快速眼动、非快速眼动I期、非快速眼动2期、非快速眼动3期。
数据包括:
- SHHS (5.8k) 1995-1998
- includes 5,804 adults aged 40 and older
- BioLINCC: Sleep Heart Health Study (SHHS)
- ISRUC-Sleep(0.1k)2009-2013
- collected from subjects in hospital whose ages range from 20 years old to 85 years old, with an average age of 51
- ISRUC-SLEEP Dataset | A comprehensive public dataset for sleep researchers
Chest X-Rays #
使用2D灰度胸片进行单标签分类任务,包括肺不张、心脏扩大、实变、水肿和胸腔积液。
数据包括:
- MIMIC-CXR (227k) 2011-2016
- a large publicly available dataset of chest radiographs in DICOM format with free-text radiology reports.
- MIMIC-CXR Database v2.0.0
- CheXpert (65k) 2002-2017...
剩余内容已隐藏