近年来,深度学习在医学领域慢慢的火热了起来。在图像领域,经典的各种任务包括但不限于:图像分类、目标检测、全连接网络。在医学领域,主要是将上述方式应用于医学领域中,例如:用图像分类去判断X照肺部图片判断是否出现病变(图像分类)、图片中出现的细胞与背景区分(全连接层)等等,在医学图像中使用深度学习的方法前提条件便是知道经典网络的任务。
什么是深度学习
1.深度学习模型
深度学习在医学中的应用旨在以更快、更准的效率,最终使人类目前执行的任务实现自动化。其中分类任务是否代表了实际的临床工作流程等问题值得讨论。
深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
深度学习的概念由Hinton等人于2006年提出。基于深度置信网络(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。
深度学习是机器学习中一种基于对数据进行表征学习的方法。观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。
同机器学习方法一样,深度机器学习方法也有监督学习与无监督学习之分.不同的学习框架下建立的学习模型很是不同.例如,卷积神经网络(Convolutional neural networks,简称CNNs)就是一种深度的监督学习下的机器学习模型,而深度置信网(Deep Belief Nets,简称DBNs)就是一种无监督学习下的机器学习模型。
2.深度学习架构与模型评估
深度学习架构的选择会极大地影响模型的性能。大多数图像分类任务使用CNN,原因在于其学习图像特征的能力在这类任务中表现特别好。目前有几种标准体系结构可用,它们的网络深度和连接模式不同,对图像施加了不同的先验。目前流行的体系结构包括ResNet和Inception,它们捕获了从计算机科学中吸取的经验教训,并使用深度学习算法代表了图像分类的最新技术水平。
当所用体系结构未被明确描述时,我们可能难以理解基础算法或尝试复制它。例如,McKinney等人旨在使用深度学习模型根据乳腺x射线摄影图像预测活检证实的乳腺癌。然而,该模型被描述为三个不同模型的集合,其细节未被完全描述,也未被描述集合中每个模型的性能贡献。将机器学习应用于医学的一个主要问题是,当更简单或更小的模型也可以做到时,存在过度工程化。一般而言,如果在一篇论文中使用了新的体系结构,则应该与标准基准进行比较,以帮助证明使用新体系结构的合理性。
而了解如何评估模型对于了解模型在现实世界中的应用非常重要。一个在训练数据中表现良好但在测试数据中表现较差的模型可能会存在过度拟合。评价机器学习算法的指标包括灵敏度、特异性和阳性预测值。在研究中,应根据独立测试集上模型的性能计算评估指标。通常,该独立测试集是回顾性的;然而,为了真正验证深度学习算法在临床任务上的普遍性,考虑到真实世界数据和回顾性数据之间的差异,需要进行前瞻性应用和评价。医学干预疗效的金标准是随机对照试验(RCT),目前已经制定了使用AI的RCT指南。迄今为止,已有一些使用AI算法的RCT研究,结肠镜检查期间的腺瘤检出率(ADR)被用作结肠镜检查的质量指标;尽管它是重要的临床结局的替代临床指标-减少结肠癌的数量。
此外,最近的随机对照试验证明了另一个重要的现实——在大多数情况下,真正的临床评价将需要使用AI工具而不是AI工具来替代医生。临床医学总是存在一定水平的不确定性,一个临床病例可能不会整齐地落入AI算法预测的类别。鉴于临床护理的复杂性和训练数据的局限性,创建一个完全取代医生临床工作流程的AI工具目前并不可行。
深度学习如何应用于医疗领域
1.成果
医学影像是医生判断疾病的一个重要手段,放射科、病理科等擅长读图的医生增长率和诊断效率急需提升,成为很多医疗机构的心病。医疗领域深度学习团队Airdoc,目前已经掌握了世界领先的图像识别能力,结合数学、医学知识和深度学习深度学习算法后,在人类医学专家的帮助下,在心血管、肿瘤、神内、五官等领域建立了多个精准深度学习医学辅助诊断模型,取得了良好的进展。
以糖尿病性视网膜病变判断为例,国际上将糖尿病视网膜病变从正常到严重分成了5类。Airdoc在眼科专家的帮助下,通过让深度学习算法学习远超人类医生一生接诊量的的患者眼底照片,训练了一个检测糖尿病视网膜病变的深度神经网络,该算法在有明显症状和无明显症状二分方面准确性与三甲资深眼科医生持平,对眼科专家不足的地域和广大基层医疗机构开展筛查具有现实意义。同时,该算法在眼底照片国际标准5分类方面准确性也不逊于专业眼科医生。类似的高可靠医学影像深度学习算法,还被Airdoc引入到DR、CT、核磁与病理影像辅助诊断中,这些深度学习算法在我国推进家庭医生签约和增强基层医疗机构服务能力等领域都有广阔应用。
2.现存问题
但也有人提出疑问,深度学习能代替医生吗?我认为在我们有生之年完全替代这是不可能的,虽然深度学习辅助诊断系统能够辅助医生诊断诸多疾病,但是深度学习并不能替代人类医生,而只是在诊疗的部分环节帮助医生快速判断帮助医生提供建议。深度学习算法在深入了解病人感受层面相较人类医生有诸多弱势,在分析判断客观数据如检查化验影像领域较为擅长。目前,Airdoc已经是临床医生做判断的有力助手,在提高医生效率和诊断准确率方面建树颇多,但疾病诊断治疗还有很多社会人文因素,不能单纯依赖技术环节完成诊疗服务。
Airdoc对自己的定位就是深度学习时代的听诊器、显微镜、血压计,只是医生的好工具,并不能替代医生,最终的诊断决策还是需要医生做出。医生诊疗病人已经几千年,不会因为一两个技术出现而变化。
按照医学技术区分,深度学习辅助诊断系统可以为两类医生提供帮助:一类是可以准确判断疾病的医生,深度学习辅助诊断系统可以帮他们快速筛查分诊疾病,并且不会疲惫,可以辅助这类医生提高工作效率;另一类是尚不能精准判断疾病的医生。近期,新乡医学院管理学院院长孟勇教授发布了对6766名农村居民、2983名城乡医生、4400名患者进行的调研报告,基层医生能力不足是阻碍基层医疗正常运转的主要因素。深度学习辅助诊断系统可以辅助基层医生诊断疾病,从而让预防保障体系的“神经末梢”正常运转起来。
尽管深度学习医疗已经能够解决很多医学上的难题,但是落地的时候依然会面临很多问题。
首先,就是数据质量问题。机器学习所用到的数据其实是训练学习模型的教材,教材的质量最终决定了学习的成果,如何获取高质量的教材是大部分深度学习医疗企业共同面临的问题,临床数据质量不容乐观。
其次,病人的隐私问题。在训练模型和数据预处理之前,患者隐私保护需要每个行业参与者高度重视。美国国会1996年即颁布了《健康保险便利及责任法案》(Health Insurance Privacy and Portability Act,简称HIPPA),该法案要求各机构必须采取适当措施保护病人信息的私密性。遵守《健康保险便利及责任法案》意味着需要制订一系列安全标准,就保健计划、供应商以及结算中心如何以电子文件的形式来传送、访问和存储受保护的健康信息做出详细的规定。《健康保险便利及责任法案》关于隐私的规定要求对个人医疗信息的使用必须限定在实施治疗所必需的最小范围内。Airdoc也在和国内相关主管部门沟通建言推出类似HIPPA的信息保护法案。
第三,还有观念问题。基于人文伦理的传统观念影响,接受深度学习医疗这一事实的过程可能比想象的要长。
第四,监管问题。目前对于深度学习健康医疗大数据和算法的使用监管,我国的法规较美国、英国、澳大利亚等国家而言,还有一些差距需要补足,我国既要利用好后发优势,又要确保患者安全。
第五,跨机构数据模型验证和支付问题同样需要解决。
即便面临诸多挑战,但深度学习发展的趋势已经势不可挡,正如CES主办方消费技术协会的首席经济学家肖恩·杜布拉瓦茨所说,深度学习正在融入人类生活的各个领域,今后还将在更深更广的程度融合。
评论(0)