截词符
截词方式有多种。 按截断的位臵分:后截断、前截断、中间截断。 按截断的字符数量分:有限截断和无限截断。
后截断,是将截词符号放在一个字符串的 右方,满足截词符左方所有字符的记录都 为命中记录。从性质上讲,这是一种前方 一致的检索。 前截断,是将截词符放在一个字符串的左 方,表示其右的有限或无限个字符不影响 该字符串的检索,或者说这是一种后方一 致检索,对汉语中的复合词组的检索非常 方便。 中间截断,前截断和后截断可以结合使用 , 中间一致 。
优先算符
优先算符用()表示,在含有多个运算的 检索式中,可以用()将需要优先运算的 部分括上,系统会优先运算()中的部分, 然后在按照not, and, or的顺序进行运 算。如: (计算机 or 电脑) and 病毒
禁用词
在数据库中,下列九个词不能作为检索词使用, 这些词称为禁用词。 禁用词有: AN、AND、BY、FOR、FROM、OF、TO、 THE、WITH
6.信息检索基本技术
逻辑算符 位臵算符 截词符 基本索引字段标识符 优先算符
布尔逻辑算符
定义:表达检索提问的各概念之间的逻辑关系。 逻辑算符有三种: AND (与)、OR(或)、NOT(非)。 三种算符可同时在一个检索式中使用,也可单独使 用。 使用逻辑算符时应注意的事项: ①逻辑算符的优先级为:NOT、AND、OR,可用括号 来改变优先顺序。 ②在逻辑组配时,算符的两侧必须各留有一个空格。
(4)全文数据库
(5)图像数据库 (6)多媒体数据库
电子期刊数据库 电子图书数据库 检索数据库 学位论文数据库 专利标准数据库 会议论文数据库 学习考试平台 视频数据库 试用数据库
5、计算机检索原理
1.计算机检索的原理就是利用计算机将用户所提出 的检索标识与检索系统中的标引标识进行比较, 并将匹配的文献提出作为命中。 2.标引标识是在信息加工过程中产生的。标引就是 将信息中的具有检索特征的词语或标志抽出并按 照一定的规范制成索引的过程。 3.检索标识是检索者根据对课题的分析,制定出的 既能反映课题的要求,又符合计算机检索要求的 检索语言,其中包括适当的检索词,以及合适的 逻辑算符和位臵算符。