图片: | |
---|---|
名称: | |
描述: | |
深度学习框架有很多种,自编码器(Autoencoder, AE)、深度置信网络(Deep Belief Network, DBN)以及卷积神经网络(Convolution Neural Network, CNN)等。其中,CNN在癌症检测中最为常用,其次是AE和DBN。它们或被用于分析医学图像,如X光片、CT图像等,或用于分析分子层面的数据,如基因突变、基因表达数据等。目前,深度学习技术还不能应用在所有类型的癌症上,因此现有研究一般将肺癌、乳腺癌等常见癌症,作为检测目标。
CNN是一个多层神经网络框架,旨在通过卷积处理来学习数据中的高位信息。它包含三种神经元层:卷积层(Convolutional Layer)、池化层(Pooling Layer)和全连通层(Fully Connected Layer)。其中,卷积层能够从数据中提取特征,池化层一般用于降低数据的维度(复杂度),而全连通层则利用前两层学习的信息进行分类。基于这种精密的设计,CNN十分擅长图片识别,这也是它近几年声名鹊起的原因,所以研究人员多用它来分析医学图像,以检测癌症。不过,图片识别并不是CNN的唯一应用,CNN还很适合用来做文本分析。我们知道,生物体的基因组信息储存在碱基序列中,这些信息在计算机中的表示就是文本,所以,CNN也很适合分析引起癌症的基因组数据。
在医学图像分析上,CNN可以说是深度学习在医疗诊断领域最成功的应用之一。2015年,中科院和南佛罗里达大学的学者使用CNN的变种之一——多层卷积神经网络(Multi-scale Convolution Neural Network),使计算机能从胸部CT扫描图像识别出肺结节(肺结节是诊断肺癌的依据之一),其准确度高达86.84%。不过,使用肺部细胞纤维图像,Teramoto训练的CNN成功检测肺癌的准确率却只有71%。
除肺癌之外,CNN也能成功检测出乳腺癌。Kooi使用超过45000张乳房X光图片训练CNN,使诊断准确度达到人类专家的水平。当然还有文章开头提到的谷歌,他们的CNN能够自动从100万像素的组织显微图像中,检测并定位出100×100像素的肿瘤,灵敏度达到92.4%,而每张图片平均只有8个假阳性结果,是当下检测乳腺癌最好的人工智能系统。另一种十分常见的癌症——胰腺癌,由华中科技大学的学者用CNN实现了自动化识别,且获得了89.85%的灵敏度与95.83%的特异度。不同于之前的研究,他们的CNN可直接使用原图片作为输入,而不需要预先对图片进行剪辑等预处理。
而对于肠癌,大肠息肉的检测对早期诊断十分关键,因为肠息肉很有可能恶化为癌症。2017年,Korbar实现了从肠道组织染色图鉴别可能致癌的肠道息肉的CNN,精确度达到93%。同年,Lequan Yu则设计了3D-CNN,使计算机能够分析结肠镜拍摄到的视频来找到肠息肉。除了这些癌症种类之外,CNN还被设计来分析不同的医学图像,以检测骨肉瘤、头颈癌、膀胱癌、脑癌和口腔癌等癌症。