历史百科网

通用语法分析程序

[拼音]:tongyong yufa fenxi chengxu

[外文]:general syntactic processor

综合不同语法分析技术的形式特征并建立统一的数据结构,以模拟各种自然语言处理技术的实验性软件支援系统,又称通用语法处理程序,英文缩写 GSP,它是1973年R.卡普兰为了研究语法分析和响应生成的需要提出的。

图表(chart)是通用语法处理程序的核心部分,用来表示语法和输入语句的一种单一的数据结构。图表实质上是语法树的一种修正形式。在语法树中每一条有向弧都代表弧线射出节点和弧线进入节点之间的“父子”关系。如果从一个节点射出若干条弧线分别通向不同的子节点,那么这些子节点自左至右地形成一种“兄弟”关系。但是在语法树中,节点之间的父子关系是用有向弧显式表出的,而兄弟关系只是一种隐含关系,并没有用弧线连接。从每一语法树构造其对应的图表须遵循两条规则:

(1)将所有表示父子关系的弧线删除,但保留父节点到其长子节点的弧线,同时将所有兄弟节点用有向弧从兄到弟地(即从左到右方向)连接起来;

(2)节点与弧线标号互换,原来的节点标号变成了弧线标号,原来弧线没有标号,现在则是节点没有标号。图1是名词短语的语法树及其对应的分析图表。

用图表还可以有效地表示“森林”──由若干棵不连的树组成的有序 。图2表示由名词短语和动词的语法树形成的森林及其对应的图表。图3表明用图表还可以简明有效地表示词或短语的多义现象(称为歧义性)。通用语法处理程序除了建立图表分析技术外,还在递归、回溯和指针移动等方面有较完善的控制策略。系统还有程序协同功能,各程序(过程)能挂起暂停或继续运行。图表是表示自然语言句法的适用数据结构,运用图表技术有利于将语法中较小组成部分集结为较大组成部分以便分析,因而在自然语言处理系统的研制中受到重视。

参考书目R.Rustin,ed.,Natural Language Processing,Algorithmics Press, New York,1973.

严正声明:本文由历史百科网注册或游客用户灵武 自行上传发布关于» 通用语法分析程序的内容,本站只提供存储,展示,不对用户发布信息内容的原创度和真实性等负责。请读者自行斟酌。同时如内容侵犯您的版权或其他权益,请留言并加以说明。站长审查之后若情况属实会及时为您删除。同时遵循 CC 4.0 BY-SA 版权协议,尊重和保护作者的劳动成果,转载请标明出处链接和本声明内容:作者:灵武;本文链接:https://www.freedefine.cn/wenzhan/27238.html

赞 ()
我是一个广告位
留言与评论(共有 0 条评论)
   
验证码: