- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
同义关系(构成Synsets) 反义关系(指针!) 上位关系(指针@) 下位关系(指针~) 整体关系(名词、指针#m/#s/#p) 部分关系(名词、指针%m/%s/%p) 蕴含关系(动词、指针*) 因果关系(动词、指针>) 近似关系(形容词、指针&)
Note: 形容词如果是 动词分词,用 指针(<)指 向该动词; 副词如果由形 容词的派生而 来,用指针 (\)指向。
地球饶着太阳转,自然会有寒来暑往的四季交替 自然奥秘 {自然、必然、一定、必定} {自然、天然}
Example
WordNet中的词汇组织关系
• 语义关系
– 语义关系由指针标出 – WordNet按语义关系(词义之间的关系)组织 – 词义可用同义词集合表示
语义关系看做同义词集合之间的一些指针
– 语义关系是双向的 – 语义关系的名称承担双重角色
WordNet中的词汇组织关系
• 同义关系
– WordNet 用同义词集表示概念,最重要的关系就 是同义关系。 – 如果两种表达方式在语言文本中相互替代而不改变 其意义,则着两种表达就是同义的。
{heavy, weighty, ponderous} 重的
{light, weightless, airy}
WordNet中的词汇组织关系
• WordNet的名词
– 名词的语义元素
• 25个起始概念:一般性概念,作为独立的层次结构 • 各领域的名次数量不等,互不排斥 • 大体覆盖了明确的概念和词汇范围
{act, action, activity} {natural object} {natural phenomenon} {artifact} {attribute, property} {plant, flora} {possession} {cognition, knowledge} {communication} {quantity, amount} {relation} {feeling, emotion} {food} {state, condition} {substance} {location, place} {time} {animal, fauna} {person, human being} {body, corpus} {process} {event, happening} {shape} {group, collection} {motive}
如:词义{x1,x2,…}和{y1,y2,…}有一种语义关系R 则1.词义{y1,y2,…}和{x1,x2,…}有一种语义关系R’ 2.R也被用来标明属于这两个同义词集合的单个词之间的关系
WordNet中的词汇组织关系
• 主要的词汇关系
{}
– [] – – – . . – – . – – [] –
1991年 WordNet1.0 正式公布
/
WordNet概述
• WordNet的心理语言学假设
可分离性假设 语言的词汇 成分可以被 离析出来并 专门针对它 加以研究。 可模式化假设
一个人不可能掌 握他运用一种语 言所需的所有词 汇,除非他能够 利用词义之间存 在的系统的模式 和关系。
Example
WordNet中的词汇组织关系
• 上下位关系
– 上下位关系是词汇之间的语义关系。 – 上下位关系也称为从属/上属关系,子集/超集关系。 – 上下位关系不是一种对称关系,通常一个同义词集 只有唯一的上位,而下位却很多。 – 这种方法为WordNet中的名词提供了一种核心的组 织原则。
{枫树} 是 {树} 的下位词 {树} 是 {植物} 的下位词
Robert Chapmand (1977) 《罗杰斯同义词词林》
美国海军研究与发展中心的Fred Chang的词表,15%的重合词语
已有词表
Ralph Grishman和他在纽约大 学的同事的一个词表,包含 39143个词,这个词表实际上包 含在著名的COMLEX词典中。 WordNet当时词表与该词表重合 率为74%(1993年)。
WordNet中的词汇组织关系• WoFra bibliotekdNet的动词
– WordNet动词的15个基本语义类 – 蕴含关系(类似名词中的整体-部分关系)
• 例如“打鼾”蕴含了“睡觉”
– 下位关系(To V1 is to V2 in some particular manner. )
• 例如fight的下位词有battle, war, tourney, joust, duel , feud 等,这些词都是从不同角度更具体地来刻画一个fight。
WordNet中的词汇组织关系
• WordNet的形容词
– 形容词的反义关系
• 描述性形容词的语义组织方式与名词完全不同,采用N维 超空间结构,而不是树形的层次结构。 • 描述性形容词的基本语义关系是反义关系。
– 例如:
• ponderous 的语义近似于(similar to)heavy • 直接反义词对(light/heavy)
WordNet概述
• WordNet的对象和关系
• compound(复合词)
• phrasal verb(短语动词)
描述的对象
• collocation(搭配词) • idiomatic phrase(成语) • word(单词) • 同义反义关系(synonymy,antonymy)
对象之间的 语义关系
• 同义词集(Sysnsets)
– WordNet将n. v. adj. adv. 组织为synsets – 每一个synset表示一个基本的词汇概念 – 这些概念之间建立了多种语义关系
• • • • 同义关系(synonymy) 反义关系(antonymy) 上下位关系(hypernymy&hyponymy) 部分关系(meronymy)
Example
WordNet中的词汇组织关系
• WordNet的名词
– 名词的上下位关系
• 名词的组织依照上下位关系构造名词语义树 • 名词的继承系统,构成一种层次关系(hierarchies) • 例如,橡树@--->树@--->植物@--->生物 • 下位词汇的词条继承了他们上位词汇的所有属性 (attributes)
• 上下位关系(hyponymy,hypernym,
troponymy)
• 部分整体关系(entailment,meronymy) • 简单的动词基本句式信息(Verb Sentence
部分句法信息
Frames)
WordNet概述
• WordNet的核心概念
– synonym set(同义词集) – lexical matrix(词汇矩阵)
Motion/动作 Change/变化 Stative/状态 Perception/ 感知 Cognition/ 感知 Possession/ 领有 Contact/联 系 Consumptio n/创造 Body/身体动 作 Communica tion/通信 Creation/创 造 Social/社会 行为 Competition /竞争 Emotion/情 绪 Weather/天 气动词
广泛性假设
计算语言学如 果希望能像人 那样处理自然 语言,就需要 像人那样储存 尽可能多的词 汇知识。
WordNet概述
• WordNet词汇来源
Brown语料库
语料库
WordNet
词汇
Laurence Urdang (1978) 《同义反义小词典》 Urdang(1978) 《 Rodale同义词词典》
基于语义相似度的服务匹配
• 计算方法
– 概念间的语义相似度的计算方法有很多,一般根据概 念之间的语义距离、层次关系及概念的属性集来计算 ,语义相似度以数值表示,越大表示概念越相似 – 根据概念间的语义相似度分别计算Web服务与请求服 务之间的输入参数相似度、输出参数相似度等各种带
有语义信息项的相似度,并最终得出Web服务与请求
为:
Sim n1, n2 2dmax shortestP n1, n2
dmax为本体的最大深度
基于语义相似度的服务匹配
轻的
Example
WordNet中的词汇组织关系
• 反义关系
– 反义关系不是WordNet的基本组织关系。 – 反义关系是一种词形关系,不是概念之间的语义关 系。 – 反义关系为WordNet中的形容词和副词提供了一种 中心组织原则。 男人/女人 上升/下降 heavy/light 升高/下落 weighty/weightless
WordNet的工作重点 是在词义集合中建立词 义间的语义关系模式。
F1和F2为同义词;F2是多义词 词义 (meaning) M1 M2 M3 F1 E1,1 F2 E1,2 E2,2 E3,3 Em,n 词形(form) F3 … … Fn
表:词汇矩阵概念示意
…
Mm
WordNet中的词汇组织关系
• WordNet发展概况
1986年 Bienkowski用LISP 语言写了Grinder的 第一个版本 1989年 WordNet:词 典浏览器->自足 的词汇数据库
1978年Miller “自动化词典”
WordNet 3.0
1985年 WordNet开 始实际运作
20世纪70— 90年代添加词 表并对词进行 分类
sere
WordNet词库与查询软件的设计与实施
• WordNet系统在Sun-4工作站网络环境中开发的
– 编程环境是C语言、Unix工具、外部命令解释脚本等
– 目前为止,WordNet已经可以在如下计算机环境下运行:Sun-3,
DEXstation, NeXT,IBM PC及兼容机,Macintosh