充分利用人工智能推进老年语言学研究

2019年03月05日 09:42 来源:中国社会科学网-中国社会科学报 作者:黄立鹤

  研究老年人语言蚀失的现象、规律及机制的学问,被称为“老年语言学”(Gerontolinguistics),研究内容包括描述并阐释老年人在语音、词汇、语法、语义、语用、修辞等语言层级上的表现,以及第二或第三语言能力的退化等;在应用上,包括外语学习与成功老龄、老年看护沟通、临终关怀与丧慰等方面。

  老年语言学研究具有跨学科属性,涉及语言学、认知科学与脑科学等多个领域,也与人工智能密切相关。正常老年人及罹患神经退行性疾病老年人语言能力衰退的神经机制、疾病病理、治疗康复等问题,属于从分子、细胞及行为水平研究人脑机理的脑科学范畴;语言与感知、记忆、思维、情感、意识等紧密相关,言语理解与产出研究及言语治疗等问题,属于认知科学范畴;如何利用现代科技,对人脑的语言功能进行模仿,对语言能力衰退及其干预进行辅助,属于人工智能研究及应用范畴。在该范畴中,相关研发可在“认识脑”的基础上通过计算机模拟达到“重建脑”“模拟脑”之目的,结合脑认知衰老、语言能力蚀失及重大疾病研究,实现相关疾病的风险预测、智能诊断、早期干预、远程医疗、个性化治疗方案与智能康复等,这些应用是服务老龄事业的重要方面。

  目前,人工智能已成为新一轮科技革命和产业变革的重要驱动力量。在全球人口老龄化趋势日益显著的背景下,如何基于人工智能技术服务认知衰老及老年语言学研究,服务于老年人从健康老龄、积极老龄再到活跃老龄的转变,是亟待思考的重要问题。

  基于人工智能的老年语言学研究及老龄服务应用至少包括三个领域,即老年语言学基础研究、衰老与疾病检测以及老龄语言认知康复。

老年语言学基础研究人工智能技术的跨学科考察

  老年人语言能力退化体现在言语链的各个层级,且与感官、记忆、认知加工等多个方面相关,研究范围大、产生数据多,包含了海量的结构化、半结构化及非结构化数据。包括大数据计算、模式识别等在内的技术,可为老龄化与语言蚀失研究提供强大的计算基础。

  除老年人言语表现研究外,还可对其日常行为、医学生理等其他方面进行数据提取与研究,采用声学、眼动、脑电、核磁、视频等多模态技术手段,挖掘语言学、医学、心理学、行为学等多维数据。这就涉及大规模多模态数据采集与加工,包括数据结构化、形式化表达,相关性挖掘、特征分析、跨模态检索与计算、语义挖掘等大数据处理及人工智能技术。

  在进行数据分析的基础上,融合现有认知障碍评估量表的语言指标与日常行为观测指标,基于多模态语料库技术与模式识别技术,综合人工智能专家意见条目遴选与基于模式识别的特征自动提取;探索面向阿尔茨海默症检测的语音预处理与声学特征、面部表情特征提取及识别方法,基于分类模型生成最终特征值,集合人工智能专家意见确定常模的基本指标体系,最终构建汉语为母语的正常老年人言语行为常模。常模的构建有利于进行面向临床阿尔茨海默症(Dementia of the Alzheimer’s Type,简称DAT)老人的言语行为能力评估及预警,并改进现有汉语DAT老人言语能力的相关测试量表。

  除此之外,研究者还可对老龄化与认知功能衰退、言语理解与产出进行计算模型构建,为脑老化的历时研究提供参照性的数据模型;进行以神经退行性疾病及语言认知衰退为核心的生物医疗数据工程研究,建成包含多模态数据、可预测计算模型等,可共享领域知识的网络平台数据库。

衰老与疾病检测基于人工智能的数据建设

  实现疾病的智能检测与干预是智慧医疗的核心内容之一。针对DAT等脑神经退行性疾病而言,人工智能技术至少还可在以下几个方面提供协助。

  一是将现有的纸质认知能力检测方式自动化。对受试者检测过程中的多维数据进行采集,例如时间的起始与停顿、声音、表情、身姿、手部轨迹等;还可基于自然语言处理技术进行简单题分数判定,提高筛选效率。例如,科大讯飞与MIT已开发可记录受试者多维度信息的画钟测验。

  二是开发面向语言认知衰老队列研究的自动电话外呼及数据采集分析系统。该系统可基于自然语言处理技术,对通过电话采访进行的队列研究老年人话语进行初步分析与归类。

  三是基于多模态数据优化现有认知能力检测量表,提升特异性、敏感性语言指标在认知评估中的地位。基于国外现有文献及队列研究中的数据采集,进行语音、语法、语义、语用等多层次的语言特征提取,结合医学诊断,形成标签化的大数据库。在实际评估中,利用计算机数据采集系统,将诱导数据与自然话语结合,以言语表现为突破口,在DAT前期尽早实现阳性发现。

  四是建设基于证据链的神经退行性疾病及老龄化知识库及专家系统。开展基于脑成像的DAT早期预警与诊断方法的研究,包括基于3D卷积神经网络的影像建模与分类方法、单期影像输入的脑疾病诊断方法以及多期影像输入的特征与判决融合方法的研究等;采用循证医学准则,将罹患神经退行性疾病及其他老龄疾病风险值评估作为决策的类别标识,结合脑神经损伤、语言认知衰退及老年疾病智能仿真系统(数字人),整合学科知识、医学影像、生化报告、病例档案、访谈记录等数据,建设本体知识库;在此基础上,不断对神经网络进行深度学习训练,增强其稳定性与鲁棒性,促使其成长为专家系统,协助医生给出可靠的诊断报告与治疗方案。同时,基于人口学数据、队列研究及已有认知量表检测结果,可进行某地区老年人认知功能衰退的计算机模拟预测。

老龄语言认知康复提升人工智能服务养老环境

  无论是老龄化与语言蚀失的基础性研究,还是衰老与疾病的检测等应用,最终目的都是服务人口老龄化趋势日益严峻背景下的养老。智慧养老是指以人工智能相关技术为依托,结合智慧医疗技术和服务模式创新,智能灵活地为老年人提供包括人身安全监护、物质保障及生活照料、医疗与康复、教育与社交等各方面的符合个性化需求的老龄服务。

  例如,与同济大学老龄语言与看护研究中心合作的养老机构普陀区长寿西沙综合为老服务中心就基于人工智能技术实现了智能养老环境构建,包括:语音控制智能家电系统、电子病历及远程会诊系统、可穿戴智能体征测量及分析系统、夜间生命体征监测系统、实时监测及安全监护系统、智能生活服务预约系统。这些智能系统涉及物联网、移动互联网、云储存、大数据、人机交互等各类重要技术,能为典型及非典型老化的老龄语言研究提供多源异构数据,拓展研究维度。

  神经影像学证据表明,认知训练可诱导大脑高级网络产生神经功能链接的改变。对老年人实施包括促进言语交际、记忆力训练等在内的多模态认知干预方案,将提升语言认知训练的有效性,实现积极老龄化。例如,基于人工智能虚拟现实及增强现实技术实现生活历程场景再现的语言认知训练系统,可达到激活DAT老年人的失去记忆之目的。已有研究发现,人脑对时间记忆较为模糊,但对空间、地点的记忆是自动的、精准的。对DAT老年人进行过往情景再现,促进环境和经验交互作用共同建构的认知神经表征,是认知干预的重要方面。

  目前,世界各国及科技公司巨头均加紧研发智能医疗系统,服务老龄化社会。例如,医疗人工智能领域的探路者IBM Watson系统,以及Google DeepMind Health团队研发的Streams移动端应用程序等;国内科大讯飞公司开发的智能导诊导医系统“晓医”,包括人工智能医学影像辅助诊断系统、门诊语音电子病历、口腔/超声语音助理等,也逐步开始在临床得以应用。国内一些高校及研发机构,依托综合性、多学科优势,围绕老龄化与语言认知衰老的各个方面开展研究。从老年语言学的学科角度看,笔者认为今后应当在以下几个方面持续用力:典型及非典型老龄化的言语特征研究、老年人言语理解与产出的神经机制研究、老年患者就医会话互动研究、老年人言语障碍康复与治疗研究、基于人工智能的脑疾病早期预警机制研究等。

  总之,基于人工智能的老年语言学研究及老龄服务应用是一个需要包括语言学、医学、社会学、人工智能等多学科专家协同研发的领域,相关基础性研究及应用性研发将为老龄事业发展提供重要支撑。

 (本文系中央高校基本科研业务费专项资金(学科交叉类)项目“面向认知障碍评估的老年人言语行为多模态研究及常模构建”(22120180079)阶段性成果)

  (作者单位:同济大学老龄语言与看护研究中心)