一种机器学习方法发现了人们语言中隐藏的线索,可以预测精神病发作
发表在《npjSchizophrenia》(npj精神分裂症)杂志上的一篇论文公布了埃默里大学和哈佛大学的科学家们的研究结果显示一种机器学习方法揭示了人们语言中隐藏的线索,可以预测精神病的后期表现:与声音有关的词的频繁使用。他们的结果表明,自动分析这两种语言变量可以预测一个有风险的人以后是否会患上精神病,准确率高达93%,这里面变量包括较常使用与声音有关的词,语意密度低或含糊不清。
隐藏详细信息
训练有素的临床医生没有注意到,与普通人相比,有精神病风险的人使用更多与声音相关的词汇,尽管异常的听觉感知是一种临床前症状。
试图在与人交谈时听到这些细微的差别,就像试图用眼睛看到微小的细菌一样。
后面的数据
研究人员首先使用机器学习来建立会话语言的“规范”。他们给一个电脑软件程序输入了红迪网(Reddit)3万名用户的在线对话。红迪网是一个流行的社交媒体平台,人们在这里就各种各样的话题进行非正式讨论。该软件程序名为Word2Vec,利用一种算法将单个单词转换为向量,并根据其含义在语义空间中为每个单词分配一个位置。具有相似含义的词比具有不同含义的词放在一起的位置更近。
他们还开发了一个计算机程序来执行“矢量分解”,即分析单词使用的语义密度。之前的研究测量了句子之间的语义一致性。向量分解使研究人员能够量化每个句子中包含了多少信息。在生成了“正常”数据的基线后,研究人员将训练有素的临床医生对40名参与者进行的诊断性访谈应用了相同的技术。作为北美前驱症状纵向研究(NAPLS)的一部分,由美国国立卫生研究院资助。
向量分解使研究人员能够量化每个句子中包含了多少信息。
然后将参与者样本的自动分析与正常基线样本和参与者是否转变为精神病的纵向数据进行比较。
“这项研究之所以有趣,不仅因为它有可能揭示更多关于精神疾病的信息,还因为它有助于理解大脑是如何工作的,”艾莫利大学(Emory)心理学教授、资深作者菲利普沃尔夫(PhillipWolff)总结说。