近日,一款名为“智能声音识别”的小程序出现在社交平台。点击进入小程序,会有新冠肺炎检测的选项。录音结束后自动识别,有“正常”和“疑似新冠肺炎”两种结果。小程序有新冠肺炎声音采集和多病种声音采集两个选项。
那么,有人要问了,听咳嗽声识别新冠肺炎,靠谱吗?“听音识新冠”技术依据是什么?“听音识新冠”准确率有多高?目前是否有应用?
实际上,肺部和呼吸道的物理结构会随着呼吸道感染而改变。通过对新冠肺炎引起的呼吸系统病理形态学改变的分析表明,新冠肺炎以一种独特的方式感染呼吸系统,这些改变与其他常见的非新冠肺炎呼吸系统疾病不同。
国际上自2020年10月已有多个基于咳嗽声诊断新冠肺炎的相关研究报道和学术文章。美国麻省理工学院(MIT)、英国曼彻斯特大学等研究机构的科研人员均对基于咳嗽声进行新冠肺炎诊断进行了探索,并建立了用于研究的咳嗽声数据库。MIT从肌肉疲劳(Muscular Degradation)、声带变化(Vocal cords)、认知和情绪变化(Sentiment/mood)、肺部和呼吸道结构变化(Lungs and respiratory tract)等四个方面研究了与新冠肺炎的关系。研究中所使用的 AI 模型提取了咳嗽记录的音频特征(梅尔频率倒谱系数),并将它输入到神经网络(卷积神经网络,CNN)中,学习新冠病毒患者与健康人之间的咳嗽差异。
该研究成果发表在《IEEE 医学和生物学工程杂志》上,并得到了广泛的关注。结果表明,利用咳嗽声可高精度发现无症状患者,检测精度高达100%(16.8%假阳性)。目前已和多家医院合作进行临床实验,并和Fortune 100公司签署合作协议,进入其新冠管理实践。
2021年,国际语音通信协会ISCA组织的INTERSPEECH举办了DiCOVA新冠声音信号检测挑战赛,吸引了来自亚洲、欧洲和美洲的29个队伍参加,包括芝加哥大学,新加坡国立大学,德国奥格斯堡大学等机构,比赛结果在敏感性和特异性上均超过80%。2022年,IEEE电气电子工程师学会主办的信号处理领域的顶级国际会议 ICASSP再一次举办了DiCOVA新冠声音信号检测挑战赛。
2022年10月,辉瑞公司以1.16亿美元完成了对澳大利亚数字健康初创公司ResAPP的收购,ResApp是一款手机移动应用程序,主要利用咳嗽音进行新冠、哮喘等疾病的智能诊断。
目前咳嗽音检测新冠肺炎微信小程序在实际环境录制数据集上测试结果为敏感性60.4%,特异性85.6%。由于新冠毒株变异快、种类多、传播性强,特别是针对无症状的奥密克戎变异株的检测较难。我们现有新冠毒株咳嗽音样本库少、覆盖面窄,与国外差距较大(麻省理工学院MIT有20万人样本,我们有约8万人样本)。因此,要推动检测性能的提升,需要进一步采集相关的数据。
中国科学院声学研究所在2020年初开始研发该项技术,2021年4月得到北京市科委(医药处)的项目支持,并于2022年4月通过验收。相关技术在首都医科大学附属北京地坛医院和辽宁省新冠肺炎救治中心开展了验证。
2020年初以来,新冠肺炎疫情席卷全球,迄今为止,全球确诊人数已累计超过6亿。受全球新冠肺炎疫情影响,我国境外输入压力大,本土疫情此起彼伏,防控形势严峻,目前随着国家政策的调整,老百姓买药难、医疗资源紧张,开发简便、快速的新冠肺炎早期筛查与预警技术,对于流行性传染病防控工作具有重要意义。一个新的技术从开始到落地实际应用需要有一个过程,目前识别结果离完美尚有距离,希望大家有更包容和开放的心态去帮助技术的进步。
(中国科学院声学研究所研究员、博士生导师颜永红)