《WordNet简介》PPT课件
- 格式:ppt
- 大小:203.05 KB
- 文档页数:24
WordNet:概念知识库WordNet 是美国 Princeton 大学研发的一个英语词汇语义知识库,或者概念知识库。
本 wiki 只介绍 WordNet 里的名词和动词概念,及其概念间的主要关系。
对形容词和副词概念感兴趣的读者,可以参阅 WordNet 的手册或相关论文。
WordNet 的研发历经近二十年,目前的版本是 3.0,FreeBSD 中有它的 port。
WordNet 最初的研发者是 Princeton 大学的一些心理学家。
后来,由于计算语言学(或自然语言处理)的需求,WordNet 成为语义学研究最权威的知识库之一。
概念的表达或构建要通过自然语言完成,不同的文化和历史可能导致概念的差异,进而导致不同语言的词汇语义之间不是一一对应的。
例如,中文中“叔叔”、“伯父”、“姨夫”、“舅舅”等概念在英文中没有具体的对应,英文中只有 uncle。
虽然如此,人类的概念在很大程度上是共享的,那些小的差异可以忽略。
加上英语是世界语,这也是 WordNet 在全球得以流行的原因吧。
WordNet 里的概念所谓“概念”,在 WordNet 里抽象为一个同义词集合,它是 WordNet 的基本单位,也是 WordNet 所要描述的基本对象。
例如,“computer”有两个语义,分别是“计算机”和“计算者”。
IOU@~$ wn "computer" -synsnSynonyms/Hypernyms (Ordered by Estimated Frequency) of noun computer2 senses of computerSense 1computer, computing machine, computing device, data processor,electronic computer, information processing system=> machineSense 2calculator, reckoner, figurer, estimator, computer=> expert概念的上下位关系名词和动词概念(即同义词集合)之间有两个基本的关系,上位关系和下位关系。