当前位置:文档之家› 搜索引擎的混合索引技术

搜索引擎的混合索引技术

搜索引擎的混合索引技术
搜索引擎的混合索引技术

搜索引擎的混合索引技术

彭波

【摘要】倒排文件是搜索引擎检索系统普遍采用的索引技术.针对中文搜索引擎中采用自动分词的全文检索因分词词典规模小导致的检索效率下降与词典规模扩大导致检索效果下降的矛盾,论文在天网搜索引擎的实践基础上,提出了一种基于倒排文件实现的混合索引的方法,它可以有效提高搜索引擎下短语查询的检索效率,同时不影响系统检索效果.

【期刊名称】《计算机工程与应用》

【年(卷),期】2004(040)022

【总页数】3页(P16-18)

【关键词】搜索引擎;信息检索;倒排索引

【作者】彭波

【作者单位】北京大学计算机科学技术系网络与分布式系统实验室,北京,100871【正文语种】中文

【中图分类】工业技术

搜索引擎的混合索引技术彭波(北京大学计算机科学技术系网络与分布式系统实验室,北京 1 0 0 8 7 1)E - m ail : p b @ n e t.p k u.e d u.c n摘要倒排文件是搜索引擎检索系统普遍采用的索引技术。针对中文搜索引擎中采用自动分词的全文检索因分词词典规模小导致的检索效率下降与词典规模扩大导致检索效果下降的矛盾,论

相关主题
文本预览
相关文档 最新文档