孙道功,1977年生,山东日照人,语言学博士,现为南京师范大学文学院副教授。目前正主持国家社科基金青年项目“基于大规模语义知识库的‘句法—语义’接口研究”(12CYY052)。
自然语言处理研究进入句处理阶段以后,无论是基于规则还是基于统计的策略,都面临“句法—语义”接口问题。“句法—语义”接口是句法结构生成的关键,也是语言信息处理的难题。但目前有关接口的研究,大都在题元结构层面分析句法成分和语义角色及其对应关系,尚未触及词汇单位与语义范畴尤其是角色范畴的衔接问题;在研究方法上主要还是内省式的理论探讨或部分性的简单统计,尚未与大规模的语义知识库相结合。该项目基于大规模的语义知识库,从词汇语义和句法语义两个维度,〖JP2〗把句法范畴义征对词汇单位角色实现的制约和词汇语义对语义角色句法实现的选择两条主线结合起来,进行“句法—语义”接口研究,以揭示词汇单位—语义范畴的衔接机制、语义范畴的排序机制和句法实现机制,实现“词汇语义—句法语义”的一体化描写。〖JP〗
该项目的具体研究内容包括:(1)基于语义知识库的典型动核义场,利用句法范畴义征知识库信息,考察词汇单位凭借句法范畴义征实现为语义范畴尤其是语义角色的机制。(2)基于语义知识库的标注语料,提取语义范畴信息,抽取语义范畴配列模型,归纳基干类型,进而根据模型配列特点求出语义范畴的排序机制和匹配概率,考察语义范畴对应词汇义类的特点,揭示词汇语义对范畴排序的制约机制。(3)基于标注语料库,统计语义范畴的句法配位规律,归纳句法配位的频度序列,考察句法实现与语义制约的互动关系,寻找语义角色句法实现位置与充当该角色词汇的语义关联,并结合语用原则归纳和揭示语义范畴句法实现的选择和制约机制。(4)基于语义知识库的统计数据和研究结论,构建服务于汉语信息处理研究的层级接口模型。
通过研究,孙道功认为:(1)“句法—语义”接口是通过“词汇单位—角色转化—范畴排序—句法实现”逐层实现的。(2)“句法—语义”接口中词汇—语义范畴衔接机制是相同的范畴义征决定相同的句法表现,相异的词汇义征制约具体的组合对象。(3)语义范畴的排序受动核词汇语义的制约,所形成的序列具有若干核心模型,而其他类型是基于核心模型的角色位置调整或递归实现的。(4)语义范畴的句法实现具有多样性、原型性和序列性,受到语用规则的制约。(5)基于大规模语义知识库构建的接口模型可以应用于句法结构的生成研究,为“句法—语义”接口研究提供操作模型,为构建汉语句处理系统提供基础,同时大规模语义知识库的构建也可为语言信息处理提供语言资源。
孙道功的主要研究领域为“句法—语义”接口和语言知识库建设。近年来,他还主持完成教育部人文社会科学研究基金项目1项、江苏省社科基金项目1项,参与完成国家社科基金项目1项;在《语言文字应用》、《语言教学与研究》等期刊上发表学术论文二十多篇;出版《词汇—句法语义的衔接研究》(世界图书出版公司2011年版)专著1部。