Science:自学习式人工智能可协助预测心脏病发作

发布时间:2017-05-15

  每年有近2000 万人死于心脑血管疾病,包括心脏病、脑溢血、阻塞性动脉和其他循环系统功能性障碍。为了预测这些疾病,许多医师使用和美国心脏病学会/美国心脏协会(ACC/AHA)相似的指导方针。这些方针都是基于包括年龄、胆固醇水平和血压在内的八个风险因素,这些因素是医生不断积累起来的。

  但是这些方针太单一以至于无法解释患者服用的许多药物,或者其他疾病和生活因素。英国诺丁汉大学流行病学家Stephen Weng 说:"生物系统中有很多相互作用。这些相互作用是违反直觉的,在某些情况下,身体大量的脂肪实际上可防止心脏病发作。〃Weng 说:"这是人类身体的真实情况,计算机科学可帮助我们探索这些因素之间的关联。〃

  在一项新研究中,Weng 和其同事对比了ACC/AHA 指导方针和4 个机器学习算法:随机森林(random forest)、logistic 回归(logistic regression)、梯度提升(gradient boosting)以及神经网络(neural networks)。为了在没有人类指示的情况下得出预测工具,所有这4 项技术分析了大量数据,被分析的数据来自英国378256 名患者的电子医疗记录,目标是在与心血管疾病有关的记录之中找出发病模式。

  首先,人工智能(AI)算法必须自我训练。模型使用78% 的数据(约295267 条记录)来搜索模式并构建它们自己的内部"指导方针〃。然后使用剩余的记录对自己进行测试。在使用2005 年的可用记录数据后,系统能预测在未来十年内哪些患者会首次发生心脑血管疾病,然后再使用2015 年的记录检查预测结果。与ACC/AHA 指导方针不同,机器学习方法可考虑超过22 个的特征,包括民族、关节炎和肾脏疾病等。

  所有4 种人工智能方法的表现都优于ACC/AHA 指导方针。我们使用AUC(其中1.0 表示100% 的精确度)的统计量,ACC/AHA 指导方针达到0.728,而4 种人工智能方法的精确度在0.745 到0.764 之间,Weng 的团队4月在 PLOS ONE报告了这一成果。最好的神经网络方法的精确与测量不仅比ACC/AHA 指导方针多出7.6%,同时还减少了1.6% 的错误预警。在大约有83000 条记录的测试样本中,这相当于多挽救了355 名额外的患者。Weng 说,这是因为预警通常就会导致患者通过服用降低胆固醇的药物或改变饮食进行预防。

  ACC/AHA 指导方针并不包含被机器学习算法认定为最强预测因子的几个风险因素,比如拥有严重的心理疾病和服用皮质类固醇(corticosteroid)。同时,没有一个机器学习算法认为ACC/AHA 列表上的糖尿病是10 大预测因子之一。Weng 继而希望计算机算法能涵盖其他生活因素和遗传因素而提升其精确度。Kontopantelis 注意到了这项研究工作的一个局限性:机器学习算法就像黑箱,你可以看到输入数据和输出结果,却无从得知黑箱之中发生了什么。这使得人类难以调整算法,算法也无法泛化到新场景中的预测。

来源:搜狐

相关新闻:Self-taught artificial intelligence beats doctors at predicting heart attacks(发表时间:2017.4.14)