是现在WordNet的名词文件中只实现了部分义,在描述性形容词和表示恰当的属性的名词synsets之间有指针,尚未实现从名词到动词的功能指针。名词间也有反义,但它不是WordNet中名词的基本组织方法。只有同义、下位义才是WordNet中名词的基本组织方法。WordNet中的名词词库分为25个主题文件,每个主题处理一个不同的基础语义成分。传统的词典或一般的机器词典(尤其是一部好的词典)里存储了大量的信息(比如拼写、发音、词形变化和衍生的形式、词源、词性、定义、用法示例、同义词和反义词、特殊用法说明甚至图示),但缺憾的是:(1)缺少与其上位项的联系,例如tree(树),其上位项是plant(植物),但tree的定义中并没有指明plant的哪一个意思才是正确的上位义;(2)缺少有关同位项的信息,例如要想找到tree的同位项是很费事的;(3)缺少有关下位项的联系,要想知道tree有多少种类是很难的;(4)缺少有关部件(或部分义)的信息以及有关属性和功能的信息。而WordNet则力图避免这些缺憾或改进(至少是前三项),它通过上下位关系形成一个分层次的语义体系结构(一个词汇继承系统),通过上下位项链及列表形式来使tree与其上位项和同位项、下位项联系起来,继承上位(乃至上位的上位等)的属性,并且与部分义也联系着。部分义一般被称为“是……的一部分”(也有的称为partof关系),常常被拿来和“是一种……”(亦称ISA关系)关系作比较:两种都是反对称的和(有保留地)传递性的。一共
有多少种部分义呢?有的说有六部分部分义:部件/物体(树枝/树),成员/全集(树/森林),部分/整个(块/蛋糕),物质/物体(铝/飞机),物征/活动(付钱/购物),以及地方/区域(Princeton/NewJersey)。有人再加入第七种:状态/过程(青春期/成长)。WordNet中只编写了这些部分义类型中的三种:(1)Wm#p->Wh表示Wm是Wh的一个组成部分;(2)Wm#m->Wh表示Wm是Wh的一个成员;而(3)Wm#s->Wh表示Wm是制造Wh所用的物质。WordNet如何将下位义与上位义联系起来呢?是通过上位义标识指针"@"和下位义标识指针“~”来联系起来的。例如一个tree的条目的synsets看起来是这样:{tree,plant,@conifer(针叶树),~alder(桤木),~…}此处的“…”被很多的指向下位义的指针填满。在数据库中,指向上位义plant的指针"@"会被一个相反的指向plant的synsets中的tree的指针“~”所反射;那个指针被符号“~”标出为“下位义”:{plant,flora,organism,@tree,~…}前面提到同义、下位义才是WordNet中名词的基本组织方法,而反义即语义上的对立不是名词之间的基本组织关系,但它确实存在并在WordNet中理所当然地获得了它自己的表示,例如,男人和女人的syns-ets会包含:(此处用"!"指针表示反义){[man,woman,!],person,@…(一个
上一篇:
VisualC__NET平台上GPS串行通信的实现
下一篇:
马原:环境保护与可持续发展论文(word)