首页
通知公告
项目动态
管理文件
文件下载
社科成果
社科动态
人才巡展
高校社科
图片新闻
相关链接
智能时代的学习辞书功能探析
发布时间:2018-01-23 11:07:00

  在发展人工智能技术已纳入国家战略的时代,我们应该抓住机遇、迎接挑战,积极促进人工智能技术和学习辞书的深度结合,研发新型智能型学习辞书。

  国务院于2017年7月20日发布了《新一代人工智能发展规划》,强调建设安全便捷的智能社会,发展便捷高效的智能服务。智能教育是重要的智能服务之一。人工智能技术已经同许多领域相结合,产生了革命性的智能产品和服务,改变着人类的生产与生活。但是,目前人工智能技术与用于学习的辞书的结合有待进一步加强。随着人工智能技术的大力推进,学习辞书的智能化是必然趋势。学习辞书应该具有什么样的展示形式、交互方式和使用方式?学习辞书如何借助人工智能技术提供更加个性化、精准、便捷的使用功能?传统的学习辞书如何进化为智能学习辞书,以升级学习、教育、科研服务?本文试图对这些问题进行初步探讨。

  “三多”的辞书形式

  “三多”是多媒体、多模态和多环境的简称,智能学习辞书应该具有多媒体、多模态、多环境的形式。

  智能学习辞书除使用文字外,也可以使用图形、图像、动画、音频、视频等多种媒体形式展示词语信息。与使用纯文字描述相比,通过动画来展示汉字的笔画笔顺则更为直观,通过音频展示诸如“隆隆”等拟声词则更为形象,通过视频展示诸如“秧歌”等描绘场景和活动等的词则更为生动。

  智能学习辞书与使用者之间应该有多种交互方式,即多模态的交互方式。使用者既可以使用键盘录入词语,使用鼠标选择文稿中的词语,也可以通过语音讲出词语、通过镜头捕捉词语。智能学习辞书可以借助语音识别、文字识别等人工智能技术扩展使用者查询词语的方式。

  智能学习辞书应该提供多种使用环境。使用者使用智能学习辞书不再受时空的限制,可以随时随地通过多种设备访问。比如,使用者可以在教室通过平板电脑使用,可以在公交车上通过手机使用,也可以在家里通过智能音响使用。

  词语查询的个性化

  传统的纸质辞书在立项编纂之前需要事先明确使用人群,然后依据使用人群的特点设计辞书的收词量、编纂体例以及编纂细则。纸质辞书由于版面的限制,在体例和内容上只能有所取舍,只能满足特定使用人群的需要。纸质辞书电子化、网络化以后,有的体例、内容维持不变,有的则融合了更多的体例、内容。后者往往罗列过多的体例、内容,却不加取舍,需要使用者自己从中选取需要的内容,反而增加了使用者的负担。

  智能学习辞书应该体例全面、内容丰富,可以根据使用者的不同情况定制或智能选择合适的体例、恰当的内容。也就是说,智能学习辞书可以提供个性化的词语查询功能。

  为了提供个性化的词语查询,智能学习辞书应该建立用户系统。使用者可以填写自己的国籍、地区、省份等地域信息,以及自己的母语、专业、学习年级、汉语水平、正在使用的汉语教材等语言学习背景信息。基于这些信息,使用者查询一个词语时,智能学习辞书可以为不同身份背景的使用者提供不同的词语解释。比如,对于成语典故,智能学习系统可以自动为小学生提供通俗易懂的故事解说,为语言学专业的大学生提供源流演变的历史信息,为留学生提供针对应用场景相对细致的使用讲解。

  智能学习辞书建立用户系统后,可以记录使用者的使用日志。利用大数据技术对日志进行分析,可以挖掘更多使用者的使用偏好,这些隐藏在后台的信息也可以用于提供个性化的词语查询。

  词语查询的精准化、便捷化

  智能辞书的查询结果应该便于使用者阅读,将使用者最期望的结果优先展示,即让使用者最先看到的恰好是他最期望看到的内容。

  以多义词的查询为例。多义词有多个义项,在纸质辞书中查询多义词含义,需要先查找词语所在的页码和页内位置,浏览词语所有义项,最后找出恰当的义项。电子辞书、网络辞书不再需要定位词语所在页码和页内位置,只需输入或选择待查词语即可,节省了查找词语的时间,简化了词语查询的过程。使用者为找出所需的释义,依然需要浏览词语的所有义项。由于现有辞书的义项排列均是固定不变的,所以使用者只有阅读完所有义项才能找到最恰当的一个。智能学习辞书可以支持词语义项的动态排序,将使用者最期望的义项排列在前。词语义项的动态排序看似天方夜谭,但其实利用人工智能技术完全可以实现。查询传统辞书时,词语义项采用固定的顺序,而智能学习辞书还可以获取该词语的上下文信息。智能学习辞书在查询句子中某词的含义时,可以通过语言信息分析处理技术得知它的词性,使词性符合的义项先于其他义项得到优先显示。

  除词性外,智能学习辞书还可以获取有关词语使用环境的信息和其他有用信息,比如词语所在的语句、所属篇章的类别、使用者所处的时空环境等。人工智能技术可以利用这些信息进行运算分析,借助词义排歧(又称歧义消解)技术,更加准确地判断词语含义,按照义项概率的大小对词语义项进行动态排序。此时,词语的多个义项顺序不再固定。理想情况下,使用者每次查询时排在前列的义项恰好是使用者本次查询最期望的结果。

  辞书功能的服务化

  现有辞书只能提供词语查询功能。使用者查询词语,是为了学习词语的释义和用法。使用者是否已经掌握词语的用法?是否需要进一步巩固学习?不同的学习者或者学习群体间掌握词语的情况有何差异?使用者经常查询的词语是否已经收录?词语的释义是否还可以继续改进?传统辞书由于编纂、出版、教学、研究往往相对独立,无法系统地解决这些问题。智能学习辞书可以关联所有上述环节,将辞书从单纯的查检工具书升级为词语学习、教学、科研服务平台。为了解决上述问题,智能学习辞书至少需要提供以下服务或支持。

  提供词语智能学习服务。智能学习辞书显示词语查询结果时,应该提供更丰富的学习手段、学习场景,为使用者推荐关联词语,让使用者可以举一反三。与此同时,智能学习辞书还应该做好使用记录,分析使用者掌握词语的情况;借鉴艾宾浩斯记忆遗忘曲线等记忆学成果以及先进的学习方法,为不同的使用者量身定制科学的学习计划。最后,智能学习辞书可以提供个人词语学习报表,让使用者实时掌握自己的词语学习情况和需要进一步改进的地方。

  提供词语智能教学支持。许多学习辞书的使用者来自学校或培训机构。所以智能学习辞书除了需要建立用户系统外,还需要建立灵活的群组系统,比如班级、年级、学校以及学习小组等。单个使用者可以不属于任何群组,也可以同时属于某几个群组。智能学习辞书一方面可以提供群组间词语教学资源和教学经验交流,另一方面也可以提供不同使用者、不同群组的词语习得对比情况。这些信息可以为辞书编纂人员提供编纂依据,为教学提供参考,也可以为教育管理者提供量化数据。

  提供词语智能测试服务。许多汉语学习辞书的使用者要参加各种类型的考试。智能学习辞书应该了解不同类型考试对词语掌握的要求,分析不同考试类型的常考知识点和拓扑学习序列。根据使用者设定的不同考试类型,智能辞书系统可以提供针对性的练习和测验。汉语教师也可以借助智能学习辞书完成测试安排、智能批改等工作。

  提供词语研究大数据支持。传统纸质辞书无法记录使用者的查询记录、学习记录以及测试记录,因此很难为词语研究提供直接的支持。此外,传统纸质辞书由于出版周期的限制,词语的最新研究成果以及新词热词等,都无法及时地在辞书中得到反映。基于使用者产生的大数据,智能学习辞书可以为词语研究人员开辟更多的研究方向。研究人员的最新研究成果也可以被及时地试用、吸收,最终降低试错成本,加快科研成果转化,稳定提高辞书质量。

  不可否认,人工智能技术依然存在许多局限,智能学习辞书不能仅仅依靠人工智能技术专家实现,它还需要人工智能技术专家与语言学家、辞书编纂专家以及一线教师的密切合作。在发展人工智能技术已纳入国家战略的时代,我们应该抓住机遇、迎接挑战,积极促进人工智能技术和学习辞书的深度结合,研发新型智能型学习辞书。

  (作者单位:中国社会科学院语言研究所、中国社会科学院辞书编纂研究中心)

来源:中国社会科学报   作者:张永伟   编辑:蔡阳艳