(1)复杂特征集和合一语法;
(2)语言学研究中的词汇主义;
(3)语料库方法和统计语言模型。
这三个成果将继续对语言学、计算语言学和NLP的研究产生深远影响。为了理解这些成果的意义,先介绍一下两个相关事实。
自然语言处理中识别句子句法结构的句法分析的全过程:
(1)把句子中的词一个一个地切分出来;
(2)查词典,给句子中的每个词指派一个合适的词性(part of speech);
(3)用句法规则把句子里包含的句法成分,如名词短语、动词短语、小句等,逐个地识别出来。
(4)判断每个短语的句法功能,如主语、谓语、宾语等,及其语义角色,最终得到句子的意义表示,如逻辑语义表达式。