语言智能研究渐成热点

周建设 吕学强 史金生 张凯 中国社会科学报 2017年02月08日02版

  语言智能(Language Intelligence),是语言信息的智能化,是运用计算机信息技术模仿人类的智能,分析和处理人类语言的过程。作为人工智能范畴的专门术语“语言智能”,由首都师范大学教授周建设2013年在北京语言智能协同研究院成立大会上首次正式提出。

  2016年人工智能得到飞速发展,震惊世界的AlphaGo再度引起世人对人工智能的关注。作为人工智能的重要组成部分及人机交互认知的重要基础和手段,语言智能研究在2016年也取得了令人瞩目的成就。

机器翻译

  在“互联网+”时代,资讯在不同语言之间即时翻译转换成为越来越迫切的需求。机器翻译运用计算机程序,快速实现大规模的一对一、一对多、多对一和多对多等不同语言之间的互译。目前,谷歌翻译能支持103种语言之间的互译。2016年9月底,谷歌推出“神经机器翻译系统”,标志着机器翻译领域取得又一重大技术突破,大大提升了翻译的准确率。目前国内有包括百度在内的多家公司和高校科研团队致力于机器翻译研究,并在中文相关翻译上取得一定的领先优势。深度神经网络(DNN)的运用,极大提升了机器学习的质量。积极探索DNN的软件“神经元”效能,为多语种机器翻译提供策略保障。我国机器翻译当务之急是要建设高质量的以汉语为中间语言的多语言平行语料库,重点建设文化、经济、政治等重点领域的数据库,同时构建相应的句法、语义、语用的模型,加强对模糊结构和语义的识别能力,提高翻译质量。

语音识别与语音合成

  语音识别和语音合成是实现人机语音通信、建立有听说能力的口语系统所必需的两项关键技术。科大讯飞公司已经掌握了世界顶级的相关技术,并连续多年在诸多全球顶级专业赛事中证明了自己的过硬实力。语音智能核心技术不仅在中文语音识别方面保持绝对领先,在英语语音识别方面同样达到国际领先水平。目前,科大讯飞已推出多种产品,可以满足从大型电信级应用到小型嵌入式应用、从电信金融等行业到企业和家庭用户、从PC到手机到MP3/MP4/PMP等不同应用环境。智能语音系统的另一个重要组成部分——语音评测技术,是通过机器自动对发音进行评价,对发音偏误进行定位和分析的软件系统。科大讯飞的语音评测系统是目前业界唯一一个通过国家语委鉴定并达到实用水平的语音评测系统,已经运用于普通话水平测试和英语四六级口语测试,对提高汉英口语教学水平发挥了重要作用。

智能批改

  20世纪末,基于统计和人工智能的英语作文自动批改技术在自动评改系统中得到应用,其中E-rater技术更是广泛运用于美国的GRE、TOEFL等大型考试以及中小学作文测试,在信度和效度方面取得了长足的进步,在某些方面可以比人工评阅做得更好,效率更高,更客观。北京语言智能协同研究院主导开发的英语作文批改系统,以全国大中小学学生英语作文为评测对象,截至2016年12月已批改英语作文2.83亿篇,服务6000多所学校,1300余万学生。

  2016年12月11日,中国语言智能研究中心推出了自主研制的汉语作文智能测评系统和汉语写作教学综合智能训练系统。汉语作文智能测评系统具有“打分、评级、纠错、范例”四大功能,坚持“规则+统计”的交互式作文自动批改和反馈,针对国内小学生汉语作文、海外华裔学生汉语作文和留学生汉语作文进行自动批改。汉语写作教学综合智能训练系统高度重视写作教学过程中的师生交互,重视写作过程的管理、监测和指导。自动批改系统客观高效、不受时空限制,既适用于辅助教师教学,也适用于学生自主学习。

智能写作

  智能写作是利用人工智能技术,由机器创造性地生成自然语言的过程。从2014年开始,包括美联社在内的美国多家媒体已经开始采用智能机器人自动写作的新闻稿件。2015年9月,腾讯财经、新华社股票新闻等也陆续上线发布“机器人写手”的文章。首都师范大学中国语言智能研究中心于2016年5月发布了自主研发的汉语智能写作系统。该系统能够自动收集大数据文档,并进行整理、提取、过滤、筛选、组装,最后生成相关文章,可以完成NBA体育赛事新闻、运动会开幕词和高校学术活动总结等受限语体写作。未来汉语智能写作将向金融新闻、多种类型应用文书及中小学生辅助写作等领域扩展延伸,成为语言智能领域的“新高地”。

智能问答

  智能问答系统是应用信息检索和自然语言处理技术自动分析用户提问、辨识用户意图并提供精准答案的系统,是对使用搜索引擎通过输入关键词进行搜索的传统方式的突破。智能问答系统需要多项自然语言理解技术,从问题分类到需求解析,从网页检索到知识库查询,从信息抽取到答案排序,每一个环节都需要达到很高的精度,才能使得最终搭建起来的问答系统准确地理解问题并给出答案。

  IBM研发的问答机器人Watson在美国智力竞赛节目Jeopardy中战胜人类选手,苹果公司研发的Siri系统在智能手机中的应用取得了良好效果。近年来,以智能问答技术为核心的智能聊天机器人发展得如火如荼,除了已面世的微软公司的“小冰”、百度公司的“度秘”和华为公司的“小诺”等问答系统外,其延伸产品也研发成功,如陪读机器人、陪聊机器人等。

  中国语言智能研究中心已完成支撑智能问答的理论和技术的研究并运用于产品研发,2016年10月发布了儿童陪伴教育智能机器人“薄言豆豆”,自主研发的语义解析技术让豆豆能够准确理解对话意图,实现情景对话和知识问答融合的多轮对话。

  语言智能已经成为人机交互的重要手段,有力地促进了语言教学、语言学习的智能化。语言智能拓展了语言学研究的新领域,在未来科技、教育发展中将发挥越来越重要的作用。

 (作者单位:首都师范大学中国语言智能研究中心)