在临床研究领域,机器学习已被广泛用于优化脑影像数据分析和建立预测模型来对精神分裂症患者进行分类。评估泛化性是对预测模型性能评价的重要步骤,然而对该方面问题进行探讨的临床研究却很少。
为了解决这一问题,中国科学院心理健康重点实验室神经心理和应用认知神经科学(NACN)实验室的陈楚侨研究员与国际合作者开展了一项专门基于静息态磁共振成像对精神分裂症患者机器学习分类泛化性的探讨。其中,研究者们采用内部验证法和外部验证法来分别用于评估中心内和跨中心的泛化性。
该研究招募了51名精神分裂症患者和51名健康对照组作为主要数据集,34位精神分裂症患者和27名健康对照组作为验证集,并且采集了所有被试的静息态磁共振成像数据和结构像数据。
首先,研究者们在主要数据库中评估中心内的泛化性,得到了0.73的正确率。接着,将主要数据库作为训练集,考察在训练集中得到的预测模型跨中心泛化到验证集中表现,得到了0.56的正确率(经置换检验不显著)。
最后,考虑到跨中心泛化性的表现较差,研究者基于额外未标签数据对非监督学习算法进行更新,得到了0.70的正确率(经置换检验显著)。
研究发现指出,未来需要更多研究的推进来促进跨多数据库机器学习的应用。同时,在该研究中发现迁移学习优化分类的结果,强调了在建立跨样本和中心预测模型时纳入样本相关因素的重要性。总之,该研究提示当前对于基于单个机器学习分类研究的结果应当谨慎解读。
本研究受国家重点研究发展规划项目、国家自然科学基金、北京市科学与技术领*人才项目和中科院心理所心理健康重点实验室的支持。
文章已在线发表于HumanBrainMapping