当前位置:文档之家› 全文搜索引擎的设计与实现-文献综述

全文搜索引擎的设计与实现-文献综述

全文搜索引擎的设计与实现-文献综述
全文搜索引擎的设计与实现-文献综述

江汉大学毕业论文(设计)

文献综述

综述名称全文搜索引擎的设计与实现

姓名cccc

学号200708202137

2013年4月8日

一、绪论

目前定制和维护搜索引擎的需求越来越大,对于处理庞大的网络数据,如何有效的去存储它并访问到我们需要的信息,变得尤为重要。Web搜索引擎能有很好的帮助我们解决这一问题。

本文阐述了一个全文搜索引擎的原理及其设计和实现过程。该系统采用B/S 模式的Java Web平台架构实现,采用Nutch相关框架,包括Nutch,Solr,Hadoop,以及Nutch的基础框架Lucene对全网信息的采集和检索。文中阐述了Nutch相关框架的背景,基础原理和应用。

Nutch相关框架的出现,使得在java平台上构建个性化搜索引擎成为一件简单又可靠的事情。Nutch 致力于让每个人能很容易, 同时花费很少就可以配置世界一流的Web搜索引擎。目前国内有很多大公司,比如百度、雅虎,都在使用Nutch相关框架。由于Nutch是开源的,阅读其源代码,可以让我们对搜索引擎实现有更加深刻的感受,并且能够更加深度的定制需要的搜索引擎实现细节。

本文首先介绍了课题研究背景,然后对系统涉及到的理论知识,框架的相关理论做了详细说明,最后按照软件工程的开发方法逐步实现系统功能。

二、文献研究

2.1 Nutch技术

Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。

尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降。并且这很有可能进一步演变成为一个公司垄断了几乎所有的web搜索为其谋取商业利益.这显然不利于广大Internet用户。

Nutch为我们提供了这样一个不同的选择. 相对于那些商用的搜索引擎, Nutch作为开放源代码搜索引擎将会更加透明, 从而更值得大家信赖. 现在所有主要的搜索引擎都采用私有的排序算法, 而不会解释为什么一个网页会排在一个特定的位置。除此之外, 有的搜索引擎依照网站所付的费用, 而不是根据它们本身的价值进行排序. 与它们不同, Nucth没有什么需要隐瞒, 也没有动

机去扭曲搜索的结果。

Nutch将尽自己最大的努力为用户提供最好的搜索结果。Nutch 致力于让每个人能很容易, 同时花费很少就可以配置世界一流的Web搜索引擎。

2.1.1 特色和缺点

特色:

1、透明度:Nutch是开放源代码的,因此任何人都可以查看他的排序算法是如何工作的。商业的搜索引擎排序算法都是保密的,我们无法知道为什么搜索出来的排序结果是如何算出来的。更进一步,一些搜索引擎允许竞价排名,比如百度,这样的索引结果并不是和站点内容相关的。因此 Nutch 对学术搜索和政府类站点的搜索来说,是个好选择。因为一个公平的排序结果是非常重要的。

2、对搜索引擎的理解:我们并没有google的源代码,因此学习搜索引擎Nutch是个不错的选择。了解一个大型分布式的搜索引擎如何工作是一件让人很受益的事情。在写Nutch的过程中,从学院派和工业派借鉴了很多知识:比如:Nutch的核心部分目前已经被重新用 Map Reduce 实现了。看过开复演讲的人都知道 Map Reduce 的一点知识吧。Map Reduce 是一个分布式的处理模型,最先是从 Google 实验室提出来的。你也可以从下面获得更多的消息。

https://www.doczj.com/doc/c41023731.html,/bbs/list.asp?boardid=29

https://www.doczj.com/doc/c41023731.html,/bbs/list.asp?boardid=29

并且 Nutch 也吸引了很多研究者,他们非常乐于尝试新的搜索算法,因为对Nutch 来说,这是非常容易实现扩展的。

3、扩展性你是不是不喜欢其他的搜索引擎展现结果的方式呢?那就用Nutch 写你自己的搜索引擎吧。 Nutch 是非常灵活的:他可以被很好的客户订制并集成到你的应用程序中:使用Nutch 的插件机制,Nutch 可以作为一个搜索不同信息载体的搜索平台。当然,最简单的就是集成Nutch到你的站点,为你的用户提供搜索服务。

缺点:

1.Nutch是通用的网路爬虫,这是优点也是缺点。缺点是不适应垂直搜索

平台。

2.Nutch是机遇Java平台的,虽然架构很清爽,但是使用起来,速度还是

比其他语言平台的应用要慢一些。

3.Nutch目前配套的资料较少,学习起来困难度较大。

4.

最新版本:

Nutch可以在官方网站上获得https://www.doczj.com/doc/c41023731.html,/目前Nutch的最新版为:Apache Nutch v2.1 Release。由于Nutch目前官方只是在Linux系统上对其进行了测试,所以在选择开发环境的时候,最好选用Linux系统。

2.2 Solr技术

Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service 的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML 文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。

2.2.1 特色和缺点

特色:

1. Solr集成了搜索引擎中的所要建立和查询,能够很好地集成其他Nutch 相关平台。

2. Solr使用方便,灵活性强,效率和稳定性能也较其他框架好。

3. Solr支持多种配置方式的运行,比如分词器,可以集成我们自定义的分词,对分词做到个性化配置。

缺点:

虽然Solr效率较高,但是毕竟是基于Java平台,运行速度上还是有待提高。

最新版本:

Solr可以在官方网站上获得https://www.doczj.com/doc/c41023731.html,/dyn/closer.cgi/lucene/solr/,目前Nutch的最新版为:solr-4.3.0。由于Solr目前官方只是在Linux系统上对其进行了测试,所

以在选择开发环境的时候,最好选用Linux系统。

三、总结

本全文搜索引擎的设计与实现正是利用以上技术,使得系统执行效率更高,满足用户的需求,由于模块之间相互独立,能够满足系统功能的扩展需求,不会影响系统基本功能的实现,能够适应系统的不断变化和发展,对设计功能强大的网上应用程序具有理论与现实意义,再结合基本网页设计对系统进行布局和美化,最后提供给用户界面简洁,功能强大的搜索引擎引用。对于此系统的研究和设计,能够将所学知识应用到实际操作中,深刻理解整个开发流程。

参考文献

[1] https://www.doczj.com/doc/c41023731.html,/nutch/NutchTutorial

[2] https://www.doczj.com/doc/c41023731.html,/solr/4_2_0/tutorial.html

[3] https://www.doczj.com/doc/c41023731.html,/nutch/OldHadoopTutorial

[4] https://www.doczj.com/doc/c41023731.html,/

[5] 李晓明闫宏飞王继民.搜索引擎—原理、技术与系统.科学出版社,2004

[6] 易剑(Hadoop 技术论坛).Hadoop开发者入门专刊.https://www.doczj.com/doc/c41023731.html,

[8] Rafa? Ku?.Apache Solr 3.1 Cookbook.Packt Publishing Ltd,2011

[9] 董宇.一个 Java 搜索引擎的实现

https://www.doczj.com/doc/c41023731.html,/developerworks/cn/java/j-lo-dyse1/index.html,2010

[10] 杨尚川.Nutch相关框架安装使用最佳指南.

https://www.doczj.com/doc/c41023731.html,/281032878?ptlang=2052#!app=2&via=QZ.HashRefresh&po s=1362131478

本科毕业设计文献综述范例(1)

###大学 本科毕业设计(论文)文献综述 课题名称: 学院(系): 年级专业: 学生姓名: 指导教师: 完成日期:

燕山大学本科生毕业设计(论文) 一、课题国内外现状 中厚板轧机是用于轧制中厚度钢板的轧钢设备。在国民经济的各个部门中广泛的采用中板。它主要用于制造交通运输工具(如汽车、拖拉机、传播、铁路车辆及航空机械等)、钢机构件(如各种贮存容器、锅炉、桥梁及其他工业结构件)、焊管及一般机械制品等[1~3]。 1 世界中厚板轧机的发展概况 19世纪五十年代,美国用采用二辊可逆式轧机生产中板。轧机前后设置传动滚道,用机械化操作实现来回轧制,而且辊身长度已增加到2m以上,轧机是靠蒸汽机传动的。1864年美国创建了世界上第一套三辊劳特式中板轧机,当时盛行一时,推广于世界。1918年卢肯斯钢铁公司科茨维尔厂为了满足军舰用板的需求,建成了一套5230mm四辊式轧机,这是世界上第一套5m以上的轧机。1907年美国钢铁公司南厂为了轧边,首次创建了万能式厚板轧机,于1931年又建成了世界上第一套连续式中厚板轧机。欧洲国家中厚板生产也是较早的。1910年,捷克斯洛伐克投产了一套4500mm二辊式厚板轧机。1940年,德国建成了一套5000mm四辊式厚板轧机。1937年,英国投产了一套3810mm中厚板轧机。1939年,法国建成了一套4700mm 四辊式厚板轧机。这些轧机都是用于生产机器和兵器用的钢板,多数是为了二次世界大战备战的需要。1941年日本投产了一套5280mm四辊式厚板轧机,主要用于满足海军用板的需要。20世纪50年代,掌握了中厚板生产的计算机控制。20世纪80年代,由于中厚板的使用部门萧条,许多主要产钢国家的中厚板产量都有所下降,西欧国家、日本和美国关闭了一批中厚板轧机(宽度一般在3、4米以下)。国外除了大的厚板轧机以外,其他大型的轧机已很少再建。1984年底,法国东北方钢铁联营敦刻尔克厂在4300mm轧机后面增加一架5000mm宽厚板轧机,增加了产量,且扩大了品种。1984年底,苏联伊尔诺斯克厂新建了一套5000mm宽厚板轧机,年产量达100万t。1985年初,德国迪林冶金公司迪林根厂将4320mm轧机换成4800mm 轧机,并在前面增加一架特宽得5500mm轧机。1985年12月日本钢管公司福山厂新型制造了一套4700mmHCW型轧机,替换下原有得轧机,更有效地控制板形,以提高钢板的质量。 - 2 -

第四代搜索引擎前沿综述

第四代搜索引擎前沿综述 刁轶夫3061401080 2010年5月 1.介绍 随着因特网的普及,网上信息的发展呈现两个基本的趋势:规模的爆炸性增长,覆盖领域的不断扩大。如何在海量,非结构化信息中,提取对用户有用的信息是信息时代的核心课题。搜索引擎正是通过对信息的自动搜集,索引,在用户发出请求时经过实时排序,为用户呈现其最有价值的信息。 由搜索引擎衍生而来的关键词广告产生了巨大的商业价值,并造就了谷歌、百度等互联网巨头。但同时,谷歌以pagerank为核心的第三代搜索引擎已经不能满足日益增长的需求,数据量的增长和数据覆盖范围的增加迫切呼唤第四代搜索引擎。 我认为,第四代搜索将把个性化信息及人际推荐关系叠加到链接分析上,大大改善搜索结果排序效果;同时,跨媒体搜索将实现诸如用图片搜索图片等功能,打通文字,图片,视频,声音的界限,颠覆现在全部基于关键字的搜索方法,为用户带来更加直观的搜索体验。 2.搜索引擎发展历史及趋势 2.1 搜索引擎发展历史 从Lycos和Yahoo的时代到现在,搜索引擎的发展已经经过了三代。Andrei[1]的文章中对前三代搜索引擎的特征做了描述: Google经过改进Pagerank和一系列技术,演化至第三代,而第四代搜索引擎有大量公司如Cuil,Quora探索,但还未形成成熟的产品。 下图援引自Google创始人论文[2],说明第二代,第三代搜索引擎的主要原理: 首先搜索引擎通过爬虫技术(Crawler),根据网页链接爬取互联网内容;然后建立倒排索引(Inverted Index);同时通过Pagerank技术,基于random walk的思想计算出每个网页的Pagerank。前面几步都是独立于用户查询进行的。当用户提交查询关键词后,搜索

基于JAVA技术搜索引擎的设计与实现

龙源期刊网 https://www.doczj.com/doc/c41023731.html, 基于JAVA技术搜索引擎的设计与实现 作者:刘智勇 来源:《数字技术与应用》2017年第05期 摘要:随着科技的进步与发展,互联网成为21世纪的宠儿,网络信息也复杂多样。这些繁杂的网络信息在给我们带来便利的同时也产生了极大的问题,比如如何在这海量的信息里面找到自己所需要的内容,成为当前互联网技术的热门领域。互联网信息复杂多样,因此想要迅速、快捷的找到所需要的信息内容,就需要搜索引擎来帮忙实现。本文就对搜索引擎的工作原理,组成和数据结构等方面进行分析,对搜索引擎未来的发展方向进行探索。众所周知,智能化是未来的一个大的趋势,想要实现搜索引擎的智能化,就需要使搜索引擎具备自我学习的能力,适应用户的查询需求。 关键词:搜索引擎;智能化;信息检索 中图分类号:TP391.3 文献标识码:A 文章编号:1007-9416(2017)05-0205-01 1 搜索引擎概述 随着信息时代的来临,互联网的迅速普及应用,已经成为我们正常生活中不可或缺的一部分。因为互联网信息具备共享等多种特性,使得网络信息成倍的增加。谷歌公司所收录的网页信息都已经过亿,而且每天还在不断的攀升,想要在这么多数据里面,选取对自己有用的信息,就需要借助搜索引擎来进行实现。 搜索引擎是从1994年诞生,随着互联网的信息日益增多,搜索引擎也在不断的发展,从1994年到现在历经三个阶段。搜索引擎的第一个阶段就是1994年到1996年,这个阶段的搜索引擎以集中式检索为主。当时网络信息并没有很多,一般都是少于百万的网页,也没有索引,检索速度也非常慢。也是采用网络、数据库等关键技术来实现。第二个阶段是1996年到1998年,这个期间,搜索引擎采用分布式检索方案,使用多个微型计算机来协同工作,其目的是为了提高数据规模和响应速度。一般可以响应千万次的用户检索请求。第三代搜索引擎,就当前所使用的搜索引擎,也是搜索引擎极为繁荣的时期。它拥有完整的索引数据库,除了一般的搜索,还有主题搜索和地域搜索。但是这些搜索结果反馈给用户的数据量较大,检索结果的相关度又成为研究的核心。 我们通常所用的搜索引擎也分为多种,按照信息的搜集方法和服务提供方式的不同进行区分,常用的有三类,第一,目录式搜索引擎。它是以人工方式进行信息的搜集,由编辑员进行审查并制作成信息摘要,将其进行分类置入架构中去。这类搜索方式的搜索结果准确,信息质量高,但是需要大量的人工成本,信息更新不及时,维护量大。第二,机器人搜索引擎。就是我们常说的网络爬虫,是由一个网络蜘蛛的机器人程序以某种策略自动地在互联网中搜集和发现信息,这种信息查询方式是由索引器完成的。索引器为搜集到的信息建立一个完整的索引,

毕业设计文献综述范文

四川理工学院毕业设计(文献综述)红外遥控电动玩具车的设计 学生:程非 学号:10021020402 专业:电子信息工程 班级:2010.4 指导教师:王秀碧 四川理工学院自动化与电子信息学院 二○一四年三月

1前言 1.1 研究方向 随着科技的发展,越来越多的现代化电器走进了普通老百姓的家庭,而这些家用电器大都由红外遥控器操控,过多不同遥控器的混合使用带来了诸多不便。因此,设计一种智能化的学习型遥控器,学习各种家用电器的遥控编码,实现用一个遥控器控制所有家电,已成为迫切需求。首先对红外遥控接收及发射原理进行分析,通过对红外编码理论的学习,设计以MSP430单片机为核心的智能遥控器。其各个模块设计如下:红外遥控信号接收,红外接收器把接收到的红外信号经光电二极管转化成电信号,再对电信号进行解调,恢复为带有一定功能指令码的脉冲编码;接着是红外编码学习,利用单片机的输入捕捉功能捕捉载波的跳变沿,并通过定时器计时记下载波的周期和红外信号的波形特征,进行实时编码;存储电路设计,采用I2C总线的串行E2PROM(24C256)作为片外存储器,其存储容量为8192个字节,能够满足所需要的存取需求;最后是红外发射电路的设计,当从存储模块中获取某红外编码指令后,提取红外信号的波形特征信息并进行波形还原;将其调制到38KHZ的载波信号上,通过三极管放大电路驱动红外发光二极管发射红外信号,达到红外控制的目的。目前,国外进口的万能遥控器价格比较昂贵,还不能真正走进普通老百姓的家中。本文在总结和分析国外设计的基础上,设计一款以MSP430单片机为核心的智能型遥控器,通过对电视机和空调的遥控编码进行学习,能够达到预期的目的,具有一定的现实意义。 1.2 发展历史 红外遥控由来已久,但是进入90年代,这一技术又有新的发张,应用范围更加广泛。红外遥控是一种无线、非接触控制技术,具有抗干扰能力强,信息传输可靠,功耗低,成本低,易实现等显著优点,被诸多电子设备特别是家用电器广泛采用,并越来越多的应用到计算机系统中。 60年代初,一些发达国家开始研究民用产品的遥控技术,单由于受当时技术条件限制,遥控技术发展很缓慢,70年代末,随着大规模集成电路和计算机技术的发展,遥控技术得到快速发展。在遥控方式上大体经理了从有线到无限的超声波,从振动子到红外线,再到使用总线的微机红外遥控这样几个阶段。无论采用何种方式,准确无误传输新信号,最终达到满意的控制效果是非常重要的。最初的无线遥控装置采用的是电磁波传输信号,由于电磁波容易产生干扰,也易受干扰,因此逐渐采用超声波和红外线媒介来传输信号。与红外线相比,超声传感器频带窄,所能携带的信息量少扰而引起误动作。较为理想的是光控方式,逐渐采用红外线的遥控方式取代了超声波遥控方式,出现了红外线多功能遥控器,成为当今时代的主流。 1.3 当前现状 红外线在频谱上居于可见光之外,所以抗干扰性强,具有光波的直线传播特性,不易产生相互间的干扰,是很好的信息传输媒体。信息可以直接对红外光进行调制传输,例如,信息直接调制红外光的强弱进行传输,也可以用红外线产生一定频率的载波,再用信息对载波进调制,接收端再去掉载波,取到信息。从信

本科毕业设计(论文)文献综述的写作指导及综述模板(格式)

本科毕业设计(论文)文献综述的写作指导 为了促使学生熟悉更多的专业文献资料,进一步强化学生搜集文献资料的能力,提高对文献资料的归纳、分析、综合运用能力及独立开展科研活动的能力,现对本科学生的毕业设计(论文)中文献综述的写作提出一些指导,供教员和学生参考。 一、文献综述的概念 文献综述是针对某一研究领域或专题搜集大量文献资料的基础上,就国内外在该领域或专题的主要研究成果、最新进展、研究动态、前沿问题等进行综合分析而写成的,能比较全面地反映相关领域或专题历史背景、前人工作、争论焦点、研究现状和发展前景等内容的综述性文章,是高度浓缩的文献产品。“综”是要求对文献资料进行综合分析、归纳整理,使材料更精练明确、更有逻辑层次;“述”就是要求对综合整理后的文献进行比较专门的、全面的、深入的、系统的评述。 文献综述根据其涉及的内容范围不同,综述可分为综合性综述和专题性综述两种类型。所谓综合性综述是以一个学科或专业为对象的,而专题性综述则是以一个论题为对象的。本科毕业设计(论文)文献综述主要为专题性综述。 二、撰写文献综述的基本要求 文献综述主要用以介绍与主题有关的详细资料、动态、进展、展望以及对以上方面的评述。除综述题目外,其内容一般包含前言、主题、总结、参考文献四个部分,撰写文献综述时可按这四部分拟写提纲,再根据提纲进行撰写工作。 前言部分,主要说明写作的目的,介绍有关的概念、定义以及综述的范围,扼要说明有关主题的现状或争论焦点,使读者对全文要叙述的问题有一个初步的轮廓。 主题部分,是综述的主体,其写法多样,没有固定的格式。可按年代顺序综述,也可按不同的问题进行综述,还可按不同的观点进行比较综述,不管用那一种格式综述,都要将所搜集到的文献资料进行归纳、整理和分析比较,阐明有关主题的历史背景、现状、发展方向以及对这些问题的评述。主题部分应特别注意代表性强、具有科学性和创造性文献的引用和评述。 总结部分,将全文主题进行扼要总结,提出自己的见解并对进一步的发展方向做出预测。

全文搜索引擎的设计与实现(文献综述)

全文搜索引擎的设计与实现 前言 面对海量的数字化信息,搜索引擎技术帮助我们在其中发现有价值的信息与资源。我们可以通过google、百度这样的搜索引擎服务提供商帮助我们在Internet上搜索我们需要的信息。但是在一些没有或不便于连入Internet的内部网络或者是拥有海量数据存储的主机,想要通过搜索来发现有价值的信息和资源却不太容易。所以开发一个小型全文搜索引擎,实现以上两种情况下的信息高效检索是十分有必要的。本设计着眼于全文搜索引擎的设计与实现,利用Java ee结合Struts,Spring,Hibernates以及Ajax等框架技术,实现基于apache软件基金会开源搜索引擎框架Lucene下的一个全文搜索引擎。 正文 搜索引擎技术起源1990年,蒙特利尔大学学生Alan Emtage、Peter Deutsch和Bill Wheelan出于个人兴趣,发明了用于检索、查询分布在各个FTP主机中的文件Archie,当时他们的目的仅仅是为了在查询文件时的方便,他们未曾预料到他们的这一创造会成就日后互联网最的广阔市场,他们发明的小程序将进化成网络时代不可或缺的工具——搜索引擎。1991年,在美国CERFnet、PSInet及Alternet网络组成了CIEA (商用Internet 协会)宣布用户可以把它们的Internet子网用于商业用途,开始了Internet商业化的序幕。商业化意味着互联网技术不再为科研和军事领域独享,商业化意味着有更多人可以接触互联网,商业化更意味着潜在的市场和巨大的商机。1994年,Michael Mauldin推出了最早的现代意义上的搜索引擎Lycos,互联网进入了搜索技术的应用和搜索引擎快速发展时期。以上是国际互联网和搜索引擎发展历史上的几个重要日子。互联网从出现至今不过15年左右时间,搜索引擎商业化运作也就10年左右。就在这短短的10年时间里,互联网发生了翻天覆地的变化,呈爆炸性增长。于此同时也成就了google、百度这样的互联网巨头。今天,当我们想要在这片广阔的信息海洋中及时获得想要查找的信息时,已经离不开搜索引擎了。 相关技术

一个小型搜索引擎的设计与实现

一个小型搜索引擎的设计与实现 摘要 随着互联网和宽带上网的普及,搜索引擎在中国异军突起,并日益渗透到人们的日常生活中,在互联网普及之前,人们查阅资料首先想到的是拥有大量书籍的资料的图书馆。但是今天很多人都会选择一种更方便、快捷、全面、准确的查阅方式--互联网。而帮助我们在整个互联网上快速地查找到目标信息的就是越来越被重视的搜索引擎。 本文通过分析国内外搜索引擎的发展现状,提出了一种功能强大,操作简单,通用性强,可以满足用户对信息搜索需要,利用ASP技术实现的一个B/S体系结构的搜索引擎系统方案。文中着重论述了该系统的功能与实现、数据流程与存储、后台管理等。并对关键的有关技术作了较详细的介绍。论文在撰写过程中,力求将理论与系统应用相结合,对各种理论进行阐述的同时配合系统从实际应用和操作技巧上加以说明,希望能够更充分地体现到这些知识与技术在本系统中的应用与实现。 关键词:搜索引擎;ASP;B/S;关键字

The Design and Implementation of a Small Search Engine Abstract With the popularization of the Internet and surfing the Net broadband search engine likes a dark horse in China, going to people?s daily life day by day. Before this, when people consult materials the first thought is the library that has a large number of books. Now, more and more people will choose Internet to search for information. It?s more convenient, and accurate for searching information. The search engine that helps us in the whole Internet to quickly identify target information is played more and more attention to. Through analyzing the current development of search engine in domestic and international, this paper gives a plan that achieves the formidable function, simply operating, stronger versatility and satisfies the users to the information search need, and realizes a systematic scheme of search engine of B/S system structure with the technology of ASP. This paper mainly describes the function and realization of this system, data procedure and storing, back-stage management, etc. And also introduces to the key relevant technology in detail. During this period, I?ve made a lot effort to union the theory and practice, and coordinates with system to explain from practical application and operation skill while explaining various kinds of theories, hope to more fully reflect the knowledge and application in this system of technology and realize. Key words:Search Engine; ASP; B/S; Keyword

毕业设计文献综述(土木工程)

办公楼的建筑与结构设计 满足建筑物的功能要求,为人们的生产和生活活动创造良好的环境是建筑设计的首要任务。 建筑平面是表示建筑物在水平方向房屋各部分的组合关系,从组合平面各部分面积的使用性质来分析,可分为使用部分和交通连系部分。使用部分是指主要使用活动和辅助使用的面积。交通联系部分是建筑物中各个房间之间,楼层之间和房间内外之间联系通行的面积。 早期的高层建筑功能上几乎只是单件的办公楼。在办公以外,不过附带一些辅助办公从业人员生活的所谓办公辅助商业设施。然而,现在高层办公建筑与其他功能复合化的情况很多,可与商业设施、住宅、文化设施、宾馆、车站等公共设施复合。综合大楼是指一个建筑物中同时拥有多种功能的办公楼。在这种设计中,重要的是要设定整体的概念,决定如何将不同的用途综合在一起。 决定建筑物在用地中的位置时,重点要考虑的是标准层的平面设计,同一层流线处理的整体性。必须对一层的主流线和物业管理以及服务流线进行整理。在办公楼内,除了白天人和物的出入外,还必须明确夜间和休息如等8小时工作以外的流线和进出的管理方法。 一、平面构成 办公楼的平面构成其基本形式取决于标准层的思维方式。在考虑标准层时要将以下两方面放在一起进行考虑:一是作为单一空间的办公室空间,另一是被称为核心筒的部分,它集中了如电梯间、楼梯、洗手间和设施等垂直方向重复通用的要素。在决定办公楼的空间时,除了受核心筒类型的影响外,其大致框架也受到办公室的进深尺寸,同标准模数有着密切关系的柱间隔尺寸,以及吊顶的高度的限制。 办公室的进深一般都在12~18m,因为它和标准的对称式办公室容易取得一致。在进行避难流线设计时,要尽量同日常人流设计的一致,并容易识别,以避免在发生火灾等避难疏散时造成混乱,并且为了保证避难通道在火焰和烟雾中的安全。设计要做到火灾发生时,能将过廊和楼梯间同其他部分明确分开。具有使用方式的办公楼,一般情况

[基于,搜索引擎,SIVA]基于搜索引擎的“SIVA”网络营销理论模型的应用研究

基于搜索引擎的“SIVA”网络营销理论模型的应用研究 基于搜索引擎的“SIVA”网络营销理论模型的应用研究 信息技术的到来改变了营销环境,需要建立一种新的由消费者主导的交互市场营销体系。传统的以线性的输出营销系统,都是基于内部驱动的品牌传播方法,而现在,消费者决策体系已由线性变成网状,选择由单一的点变成立体的面,因此,必须建立一种全新的以消费者为核心的交互式的营销模型来适应当今的大数据时代。 一、前言 回顾过去几十年营销理论的发展,从当年的4P理论到逐渐意识要与消费者沟通的4C、4R理论的发展,表明了营销体系的不断推进,消费者的地位不断被提升。要以消费者为中心,要了解消费者真正的需求,要实现与消费者对话,营销者就要不断努力地接近消费者, 改变营销策略,从说服转为倾听,希望能从消费者口中找到营销的最佳时机。 互联网的发展,特别是搜索引擎的出现,让越来越多的企业真正从消费者的心声中发现了商机。LANCOME兰蔻于1935年诞生于法国,兰蔻品牌已发展成为全法国第一和全世界第二 的世界知名化妆品牌。兰蔻以聚集了中国95%以上网民的百度搜索营销平台为基础,将关 键字投放、品牌专区、关联广告、精准广告等不同营销形式有机地整合在一起,各个营销环节层层相扣,全方位开展了网络营销活动。如若有消费者在百度搜索上敲下“兰蔻”两个字搜索关键词栏目即出现包含“兰蔻”的若干主题词。这些主题词与兰蔻产品或品牌的相关性极高,消费者可以从这些主题词的链接中找到自己想要的信息和解决方案。 而在当今的大数据时代,消费者的信息与需求源源不断地涌向互联网这个大口袋里,为企业品牌提供了巨大的机会与便利。消费者与企业双方依托搜索平台进行对接,期待最契合的连接点,相互得到满足。 二、搜索引擎 中国现在有5.64亿网民,4.2亿手机用户,每天在百度上的搜索请求超过50亿次《中国互 联网发展状况统计报告》(2013年1月,第31次)。根据全球最大的网络调查公司CyberAt las的调查表明,网站75%的流量都是来自于搜索引擎。 1.搜索引擎的定义 搜索引擎是指一种基于Internet上的信息查询系统,包括信息存取、信息管理和信息检索。搜索引擎便于网民获取有效信息,成为网民最喜爱的网络信息采集渠道,同时也有利于企业以较低的成本获得较高的信息传播效率,成为企业产品和服务推广的主要手段。 2.搜索引擎的营销功能 (1)对潜在客户的精准定位

毕业设计文献综述格式+范文

广师天河学院 毕业设计文献综述 目: 机电工程系 学生姓名: 指导教师: 业设计文献综述 业: 机械设计制造及其自动化 系: 学号:

结合毕业设计课题情况,根据所查阅的文献资料,每人撰写2500字以上的文献综述,文后应列出所查阅的文献资料。 标题用4号黑体,正文用小4号宋体,1.5倍行距。 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXX .............. 。

毕业设计文献综述(样板,供参考) 结合毕业设计(论文)课题情况,根据所查阅的文献资料,每人撰写2500 字以上的文献综述,文后应列出所查阅的文献资料。

0引言 引水隧洞施工不论是钻爆开挖,还是TBMS进,喷锚支护、压力灌浆、溶洞回填、 止水堵漏都是必不可少的工作环节,工作量也相当繁重。要确保工程质量和施工工期, 应具有功能良好的回填施工设备。混凝土喷射机就是一种施工设备,它广泛应用于地下工程,岩土工程,市政工程等领域,它利用压缩空气或其它动力,将一定比例配合的拌和料通过管道输送并高速喷射到受喷面上凝结硬化,从而形成混凝土支护层,近处来,喷射混凝土技术以其简便的工艺,独特的效应,经济的造价和广泛的用途,在各种建筑领域内显示出旺盛的生命力⑴。目前,国内主要是以干式混凝土喷射机为主, 施工作业粉尘浓度高、回弹量大、喷射混凝土强度不高,不适合于地下工程。为了解决干式混凝土喷射机所存在的问题,各种湿喷技术开始逐渐推行。所谓湿喷,其基本原理是将加水搅拌好的混凝土加入湿式喷射机,输送至喷嘴处,经掺加速凝剂后形成料束喷至施工面⑵。开发一台新型混凝土喷射机,如果采用传统的方法,周期长、成本高,但如果采用虚拟样机技术,它可以代替物理样机对产品进行创新设计、测试和评估,可以缩短开发周期,降低成本,改进产品设计质量。 对湿式混凝土喷射机进行模态仿真分析,可以识别出机体的模态参数(如固有频率、固有振型、模态质量、刚度和阻尼等模态参数)进而了解机体的动态特性,有助于分析各零部件及整机的振动和噪声特性,建立起结构的动态模型,使人们比较直观地了解零件各阶模态的频率及其振动的规律(振型),并从中找出产品结构刚度薄弱环节及其结构的不合理之处,从而为其结构的动态特性改进提供可靠理论参考,为实验模态提供理论依据,同时利用分析结果还可以对有限元模型进行修正,为机体的其 它设计改进提供可靠的参考[3,4]0 1虚拟样机技术概念及特点 所谓虚拟样机技术是一种基于产品计算机模型的数字化设计方法,这种技术以计算机仿真和建模技术为支撑,融合了智能化设计技术、并行工程、仿真工程和网络技术等多种先进的制造技术,其最终目标是实现在产品加工前对产品的性能、可制造性 等进行预测,从而对设计方案进行评估和优化,以达到产品的最优化。虚拟样机技术又称为机械系统动态仿真技术,是国际上20世纪80年代随着计算机技术的发展 而迅速发展起来的一项计算机辅助工程(CAE技术,工程师在计算机上建立样机模型, 对模型进行各种动态性能分析,然后改进样机设计方案,用数字化形式代替传统的实物样机试验。运用虚拟样机技术,可以在产品实际加工之前就能够对其性能、特征和可制造性等进行评价,同时可以对制造和使用的全过程进行仿真分析,将制造和使用过程中可能发生的总是提前到设计阶段处理,以达到产品生产的最优目标[5‘6,7]。 在基于虚拟样机技术的现代产品设计中,被广泛应用的是面向实体的模型,即三维模型或实体模型。 利用虚拟样机技术,可以使得产品的仿真结果能够以可视化的、可以运动的图像方式显示。一个实时的图像动态仿真是使用者可以交互进行干涉仿真分析、系统运动分析和动力学分析

百度搜索点击模型简介

百度搜索点击模型简介 用户的搜索点击模型(Click Model)其实是一个非常大的话题,涉及到用户查询满意度的建模和分析。 百度真实网页权重里有一个satisfyScore(满意度打分),所以搜索点击行为不仅是提升点击权重,连带提高满意度权重。 在今天的搜索引擎技术中,通过Click Model 衍生出了众多的功能,包括搜索满意度的自动监控、搜索结果的自动调权调序等。 这里提到了搜索点击模型会自动改变排名。 而这些技术的出发点都是User Behavior(用户行为)数据。 在Session 信息(a search session 一次搜索周期信息)里,用户的点击行为往往能提供丰富的信息: 百度网页搜索一次完整的搜索周期包含大量信息,有查询词,搜索结果的标签,标题,链接,高度、宽度,模版,排名,数据策略ID,点击校验参数,时间戳,官网认证标识,何种搜索结果,随机样本ID,查询ID,付费名,是否百度首页,是否登录百度账号,搜索形式,搜索框位置,字符编码,输入耗时等几十项信息。 1.在搜索结果从上至下被用户浏览的过程中,当被点击的结果中间出现了跳跃,例如 Query1(第1次搜索)对应的自然排序结果是Result1(第1个结果), Result2(第2个结果), Result3(第3个结果)…,但是如果大量用户的点击是Result1, Result3, 则Result2 的相关性可能存在问题;意思是点击第1、3个结果,不但可以提升第1、3个结果的权重,还可以降低第2个结果的权重。所以对付竞争对手快速点击一个办法是大量点击其他结果。 2.另外一种情况是,如果同一个Query 产生了一次点击后,间隔一段时间后再次出现 了对后面结果的点击,则也许说明了之前结果的满足度不够高。 3.一种在搜索结果页降低竞争对手满意度权重的方式,先点击对方的结果,隔段时间 再点自己网站的结果。 4.在同一个Session 里,用户发生主动Query 变换(或称为Query Re-write)也往往能 说明问题,前面的Query 如果搜索结果质量不高,则很多用户会选择修改查询词,此时前面被点击的Title(搜索结果标题)重要程度往往不如后续的Title,等等各类场景很丰富。 5.另一种一石二鸟的办法是先搜索一个竞争对手排名好的关键词,点了之后,更换另 一个自己网站的相关词点击,亦可降低对方网站的满意度。 以上各类的Click Model 思想虽然在实际线上系统中被广泛运用,但竞赛中没有提供更详细的信息,包括点击结果在搜索中的排序(对于分析点击模型至关重要)、点击发生的时间、点击停留间隔、用户的Cookieid/Userid(暂存用户信息ID/用户ID)等,限制了

主题搜索引擎的设计与实现

第四代搜索引擎—— 主题搜索引擎的设计与实现 Design and Implementation of Focused Search Engine, 4th Generation Search Engine 北京大学计算机科学技术系计算机软件专业 九七级学士毕业论文 指导教师:李晓明王建勇 作者:罗昶 学号:09708136 2001年6月

指导老师对论文工作的评语 “面向主题的搜索引擎”,是我们“天网”搜索引擎下一步发展的重要方向之一。罗昶同学的毕业论文,是这一新方向的良好开端。 论文从系统实现的角度,较全面的阐述了实现一个高质量主题搜索引擎系统的各个方面,着重分析了导向词、特征提取、权威和中心网页、超链分析以及网页评分等多种搜集策略的运用,并提出了“主题度”的概念,用以衡量主题搜索引擎的质量,意在指明一个搜索引擎在一个主题下的主题度越高,则它越贴近这个主题,用户就越容易找到跟这个主题相关的资料。特别地,将上述认识用于实践中,高质量地完成了一个面向影视主题的搜索引擎系统,搜集了十多万影视信息,在影视信息方面提供着比“天网”通用搜索引擎更有效的服务;论文内容丰富,所涉及的工作量很大,且有较强的系统性,是一篇很有参考价值的论文,为“天网”的发展做出了贡献。 老师签名:__________

论文摘要 互联网上的信息每天都以指数量级的速度爆炸性增长,面对如此浩瀚的资源,搜索引擎为所有网上冲浪的用户提供了一个入口,毫不夸张的说,所有的用户都可以从搜索引擎出发到达自己想去的网上任何一个地方。因此它也成为除了电子邮件以外最多人使用的网上服务。 但是,随着信息多元化的增长,千篇一律的给所有用户提供同一个入口显然已经不能满足特定用户更深入的查询需求。同时,这样的通用搜索引擎在目前的硬件条件下,要及时更新以得到互联网上较全面的信息是不太可能的。针对这种情况,我们需要一个分类细致精确、对硬件要求低,数据全面深入、更新及时的面向主题的搜索引擎。由于主题搜索运用了人工分类以及特征提取等智能化策略,因此它比前三代的搜索引擎将更加有效和准确,我们将这类完善的主题搜索引擎称为第四代搜索引擎。 本文阐述了第四代搜索引擎天网主题搜索引擎的设计与实现,并着重分析了导向词、特征提取、权威和中心网页、超链分析以及网页评分等多种搜集策略的运用。论文最后定义了独创的“主题度”来衡量主题搜索引擎的性能,一个搜索引擎在一个主题下的主题度越高,证明这个搜索引擎越贴近这个主题,用户就越容易找到跟这个主题相关的资料。有了“主题度”,就可以很容易的比较使用多种搜集策略以后的天网主题搜索引擎与原天网通用搜索引擎的差别,说明了前者在特定的主题下要比后者更准确贴切。 关键词:互联网、万维网、搜索引擎、数据发掘、主题搜索、主题度

毕业设计开题报告及文献综述

毕业设计开题报告及 文献综述 Revised on November 25, 2020

华北电力大学 毕业设计(论文)开题报告 学生姓名:宗均恺班级:建环13K2 所在院系:动力工程系 所在专业:建筑环境与能源应用工程 设计(论文)题目:石家庄某接待中心中央空调系统设计指导教师:刘志坚 2017年 3月 5 日 毕业设计(论文)开题报告

保定某中型商场暖通空调系统设计 1 选题背景及意义 暖通空调(HVAC)技术发展概况和前景[8] 建筑是人们生活与工作的场所。现代人类大约有五分之四的时间在建筑中度过。人们已经逐渐认识到,建筑对人类寿命、工作效率、产品质量起到极为重要的作用。人类在从穴居到居住现代环境的漫长发展道路上,始终不懈的改善室内环境,以满足人类自身生活、工作对环境的要求和生产、科学实验对环境的要求。人们对建筑的要求不只有挡风遮雨的功能,而且还应是一个温湿度怡人、空气清新、光照柔和、宁静舒适分环境。生产与科学是经验对环境提出了更为严苛的条件,如计算室或标准量具生产环境要求温度恒定,纺织车间要求湿度恒定,有些合成纤维的生产要求恒温恒湿,半导体期间、磁头、磁鼓生产要求对环境的灰尘有严格的控制,抗菌素生产与分装、大输液生产、无菌试

验动物饲养等要求无菌环境,等等。这些人类自身对环境的要求和生产、科学实验对环境的要求导致了建筑环境的控制计术的产生与发展,并且已形成了一门独立的学科。建筑按环境学指出,建筑环境由热湿环境、室内空气品质、室内光环境和声环境组成。采暖通风与空气调节是控制建筑热湿环境和室内空气品质的技术,同时也包含对系统本身所产生的噪声的控制。 随着时代的发展,人们对生产生活的建筑环境提出了越来越高的要求,同时由于能源紧缺,环境污染严重等问题也对建筑提出了节能减排的要求。等等这些问题就要求我们暖通人把握自身专业,顺应潮流发展,在未来利用所学成就自我成就暖通这个行业。 现代中大型接待中心的空调设计探讨 随着改革开放及经济建设的发展,我国商业建筑大量兴建,招待所、宾馆的数量也与日俱增。我国早期建起的招待所以及宾馆普遍存在着忽略室内环境品质或者夏季空调不足、能耗过大、室内空气品质差等问题。近年来,由于人们对居住品质的高要求以及旅游业的带动和宾馆产业的发展,大型宾馆,连锁旅店得到了迅速的发展,同时对宾馆环境提出了更高要求。 宾馆、酒店不同于商场等场所,它具有它自身的特点; 1)宾馆是由大厅和客房组成,由于大厅和多功能厅和客房的使用情况不同就对空调系统提出了不同的要求,要分别采用合适其特点的的系统和机组; 2)客房是个相对封闭的环境对新风要求比较高,需要不同于其他建筑的新风品质。 3)由于客房是居住环境以及宾馆品级,对室内温湿度要求比较严格。

船闸毕业设计文献综述模板概要

文献综述模板 一、引言 通过再次阅读《航道工程学》,我对水运规划及其在国民经济的用了更为深刻 的认识,水运(包括内河运输和海洋运输是交通运输业中的一个重要组成部分,它对 现 代工农业的发展,改善人民生活和促进国际经济贸易与文化的交流都起着重要的作 用。现代交通运输业由铁路、公路、水运、航空和管道等运输方式组成。 目前,世界上凡是工农业生产较为发达的国家,其水运也都比较发达。例如美国、德国、荷兰和俄罗斯等国,基本上都已建成一个四通八达的内河航道网。绝大多数天然河流对水运的发展不利,因此河流渠化是促进水运事业发展的必要手段之。 目前世界船闸是使船舶通过航道中有集中水位落差河段的一种通航建筑物。主要由闸室、闸首、输水系统和引航道等组成。采用集中输水系统的船闸,其输水系统设在闸首;采用分散输水系统的船闸,在闸室内设有输水廊道系统。在引航道内设有导航建筑物和靠船建筑物。其工作原理是船闸通过输水系统调整闸室内的水位,使其与上游水位或下游水位齐平,船舶便能从上(下游驶往下(上游。 二、船闸的输水系统 为了充分了解船闸的输水系统以及各项水力计算,查阅了《渠化工程学》、 《航道工程学》、《船闸设计》、《岳池县富流滩电航工程船闸可行性研究报告》、《水力学》等专著的相关部分内容。 船闸输水系统(filling and emptying system of navigation lock是为船闸闸室灌水和泄水的设施;由进水口、输水廊道、阀门段、出水口及消能工等构成。输水系统按灌泄水方式可分为集中输水系统和分散输水系统两大基本类型。输水系统类型的选择主要根据作用在船闸上的水头的大小、要求的输水时间的长短以及其他技术经济指标等因素确定。一般来说,当作用在船闸上的水头较大、要求的输水时间较短时,宜采用分散

搜索引擎的设计与实现

web搜索引擎的设计与实现

摘要 随着网络的迅猛发展。网络成为信息的极其重要的来源地,越来越多的人从网络上获取自己所需要的信息,这就使得像Google[40],百度[39]这样的通用搜索引擎变成了人们寻找信息必不可少的工具。 本文在深入研究了通用搜索引擎基本原理、架构设计和核心技术的基础上,结合小型搜索引擎的需求,参照了天网,lucene等搜索引擎的原理,构建了一个运行稳定,性能良好而且可扩充的小型搜索引擎系统,本文不仅仅完成了对整个系统的设计,并且完成了所有的编码工作。 本文论述了搜索引擎的开发背景以及搜索引擎的历史和发展趋势,分析了小型搜索引擎的需求,对系统开发中的一些问题,都给出了解决方案,并对方案进行详细设计,编码实现。论文的主要工作及创新如下: 1.在深刻理解网络爬虫的工作原理的基础上,使用数据库的来实现爬虫部分。 2.在深刻理解了中文切词原理的基础之上,对lucene的切词算法上做出了改进的基础上设计了自己的算法,对改进后的算法实现,并进行了准确率和效率的测试,证明在效率上确实提高。 3.在理解了排序索引部分的原理之后,设计了实现索引排序部分结构,完成了详细流程图和编码实现,对完成的代码进行测试。 4.在完成搜索部分设计后,觉得效率上还不能够达到系统的要求,于是为了提高系统的搜索效率,采用了缓存搜索页面和对搜索频率较高词语结果缓存的两级缓存原则来提高系统搜索效率。 关键词:搜索引擎,网络爬虫,中文切词,排序索引

ABSTRACT With the rapidly developing of the network. Network became a vital information source, more and more people are obtaining the information that they need from the network,this making web search engine has become essential tool to people when they want to find some information from internet. In this paper, with in-depth study of the basic principles of general search engines, the design and core technology architecture, combining with the needs of small search engine and in the light of the "tianwang", lucene search engine, I build a stable, good performance and can be expanded small-scale search engine system, this article not only completed the design of the entire system, but also basically completed all the coding work. This article describle not only the background of search engines, but also the history of search engine developing and developing trends,and analyse the needs of small search engines and giving solutionsthe to the problems which was found in the development of the system ,and making a detailed program design, coding to achieve. The main thesis of the article and innovation are as follows: 1.with the deep understanding of the working principle of the network spider.I acheived network spider with using database system. 2.with the deep understanding of Chinese segmentation and segmentation algorithm of lucene system,I made my own segmentation algorithm,and give a lot of tests to my segmentation algorithm to provide that my segmentation algorithm is better. 3.with the deep understanding of sorted and index algorithm,I designed my own sorted and index algorithm with the data-struct I designed and coding it ,it was provided available after lots of tests. 4.after design of search part,I foud the efficiency of the part is not very poor,so I designed two-stage cache device to impove the efficiency of the system. Key words: search engine,net spider, Chinese segmentation,sorted and index

相关主题
文本预览
相关文档 最新文档