当前位置:文档之家› 信息检索期末论文

信息检索期末论文

信息检索期末论文
信息检索期末论文

本科生课程论文基于网络爬虫的房产信息平台原型

学生姓名杨宇帆

所在专业信息管理与信息系统

所在班级信管1111

目录

摘要 ................................................................. I 1项目背景.. (1)

1.1收集房东信息 (1)

1.2收集房客信息 (1)

1.3通过房源管理软件查看信息 (1)

1.4方便移动办公查阅 (1)

2平台原型的实现 (1)

2.1信息收集与整理 (2)

2.2数据库设计 (2)

2.2.1概念结构设计 (2)

2.2.2逻辑结构设计 (3)

2.2.3数据库的实施 (3)

2.3下载页面信息到本地计算机 (4)

2.4提取网页信息并保存至数据库 (4)

3总结 (5)

鸣谢 (6)

参考文献 (7)

附录 (8)

摘要

本房产信息平台原型基于网络爬虫技术和数据库技术,模拟了从目标网页采集数据、在本地进行信息提取并分类存入数据库的整个流程,体现了网络爬虫技术在信息收集和资源整合方面的独特优势。

本平台主程序采用Java语言进行编写,选用MySQL作为平台的关系型数据库。

关键词:网络爬虫;房产信息;数据提取

基于网络爬虫的房产信息平台原型

信息管理与信息系统,201111671130,杨宇帆

1项目背景

目前房地产为中国的支柱性产业,买卖房产是人们关注的一个重要问题。中家房产公司为一家立足广州市场的房产中介公司,主营业务为买房、卖房、租房、房东提供房产中介服务。为了能够在激烈的市场竞争中取得长远的发展,目前需要开发一套房产信息综合管理平台,实现以下四项目标:

1.1收集房东信息

从赶集网、58同城、安居客、搜房网四大平台中,搜集整理其中房东发布的出租房屋、出售房屋信息,保存到MySQL数据库(或sqlite数据库)。

1.2收集房客信息

从赶集网、58同城、安居客、搜房网四大平台中,搜集整理其中想购买二手房、租赁房屋的需求,保存到MySQL数据库(或sqlite数据库)。

1.3通过房源管理软件查看信息

需要借助一套房源管理软件,查看保存在MySQL数据库中的房源信息,和购买二手房/租赁房屋的需求,供中介从业人员使用,提高交易量,从而创造更多的利润。

1.4方便移动办公查阅

移动办公已在现今社会的各行各业变得十分普遍。由于中介从业人员经常需要带领客户实地看房,因此为了满足工作人员移动办公的需求,仍需开发一套房源管理的安卓版APP。

2平台原型的实现

基于网络爬虫的房产信息平台原型的实现有4个主要步骤:信息收集与整理、数据库设计与建立、下载页面信息到本地计算机、提取网页信息并保存至数据库。

由于从各大平台中提取信息的做法在很大程度上是相同的,故本论文中的数据来源仅从赶集网进行获取,介绍本房产信息平台的实现。

2.1信息收集与整理

根据项目需求,需要从赶集网、58同城、安居客、搜房网四大平台中,各挑出广州市区的卖房、出租房屋、求购二手房、求租房屋的信息。以赶集网为例,由于借助了网络爬虫(Spider) 模块,我们只需要将各大网站的各类信息的结果列表(图1)记录下来即可,具体的单项信息将由网络爬虫动态获取。

图1:赶集网广州房产新房出售页面

2.2数据库设计

规范化数据库设计分为以下六个设计阶段:需求分析阶段、概念结构设计阶段、逻辑结构设计阶段、物理结构设计阶段、数据库实施阶段、数据库运行和维护阶段。

此步骤中我们设计出卖房房源信息表(SellHouseInfo)、出租房屋信息表(RentHouseInfo)、求购二手房需求表(BuyHouseDemand)、求租房屋需求表(RentHouseDemand)共4个数据表,确定了各表中的字段设置;并通过Navicat for MySQL(一款MySQL数据库管理软件)建立名为House的数据库,将上述数据表的结构建立起来。

下面我们对概念结构设计、逻辑结构设计和数据库实施阶段进行详细说明。

2.2.1概念结构设计

依据需求分析可知,用户最终需要进行查询的信息分为以下4类:

卖房房源信息、出租房屋信息、求购二手房需求信息和求租房屋需求信息,故将此

4类信息分别设计成一个实体,且4个实体之间相互没有联系。

2.2.2逻辑结构设计

根据概念结构与逻辑概念结构的1对1的转换原则,我们把概念结构中的4个实体分别转化为卖房房源信息表(SellHouseInfo)、出租房屋信息表(RentHouseInfo)、求购二手房需求表(BuyHouseDemand)、求租房屋需求表(RentHouseDemand)这4个数据表。各表字段的设置如E-R图(图2)所示。

图2:House数据库E-R图

2.2.3数据库的实施

使用Navicat for MySQL,新建house数据库,设数据库字符集为UTF-8(图3)。并建立数据表,设置其字段名、字段属性和字段长度(图4)。

图3:使用Navicat for MySQL新建数据库

图4:设置数据表字段信息

2.3 下载页面信息到本地计算机

在Eclipse 的Java 工程中,我们引入了开源搜索引擎Lucene 的网络爬虫(Spider )模块(图5)。

借助该模块下的Spider ,初始化我们需要爬取的网页地址(下面简称url )集合;

此时Dispatcher 开始分配器管理url 负责保存着url 池,当Spider 爬取完某个网页的信息后分配其一个新的url ;

然后通过Gather (网页收集器)调用URLClient ,与目 标网站建立HTTP 链接并获取其网页的htmlString ,之

后解析html ;同时调用WebAnalyzer 进行网页的解析和数据的提取;

接下来Gather 将提取出来的数据以文本文档的形式保存到本地RawData 文件夹中,实现了将目标页面的下载到本地计算机的功能。

2.4 提取网页信息并保存至数据库

为了实现JAVA 程序和MySQL 数据库的交互,我们使用了JDBC 的连接方式。

如图6,首先导入MySQL 的JDBC 驱动包;

然后在共用的工具类

com.house.util.DBHelper 中实现加载数据库驱动、建立连接、创建SQL 语句、执行语句等操作(DBHelper 程序见附录1)。

接着,Gather (网页收集器)在以文本文档形式保存网页信息的同时,调用DAO

图5:Spider 模块

图6:在Java 工程内引入MySQL 的

JDBC 驱动包

(数据库访问层)数据库分配器(com.house.ctrl.GanJiCtrl,程序见附录2)。数据库分配器调用DBHelper和com.house.dao.impl包下的方法,最终实现依据信息类型(指买房、出租房、求购二手房、求租房)的不同而将信息存入不同的数据表中(见图7)。

图7:求购二手房需求表中新增的数据

3总结

基于网络爬虫的房产信息平台原型实现了以赶集网为例,从网页进行信息的爬取、在本地进行信息的提取并分类存入数据库的功能,若要完全满足项目需求,仍需进一步的完善和修改。

纵观整个流程,我体会到在搜索引擎中广泛运用的网络爬虫在各行各业的信息采集工作中也起到了极其重要的作用。

这同时启发我们在日后的软件开发中,善于利用爬虫技术和数据库技术,它们不失为一个提取信息、整合网络资源的好方法。

然而,虽然互联网是一个开放的信息平台,但是爬虫技术也不能被不加限制地使用。信息所涉及的隐私和版权问题也需要引起我们足够的重视。

鸣谢

衷心感谢丁又专老师在我最初接触网络爬虫的时候给以耐心的指导和无私的帮助,在课程论文撰写阶段为我提供了格式上的指导与提醒。除了在专业知识方面,丁老师教会了我如何管理时间,培养了我的终生学习的观念,以及更多地以切身行动教诲我们做人之道。最后对老师再次表示衷心的感谢。

参考文献

[1] 吴军.数学之美[M]. 北京:人民邮电出版社,2012.06.

[2] 董宇. dySE:一个 Java 搜索引擎的实现,第 1 部分: 网络爬虫

[CP/OL].

https://https://www.doczj.com/doc/097058127.html,/developerworks/cn/java/j-lo-dyse1, 2010-07-13 [3] java冒烟. HTTPCLIENT抓取网页内容[CP/OL].

https://www.doczj.com/doc/097058127.html,/kf/201307/226636.html, 2013-07-10

[4] 水慕清风. java 获取网页源代码[CP/OL].

https://www.doczj.com/doc/097058127.html,/honglei_zh/article/details/8537394, 2013-01-24 [5] 李勇. 传智播客JDBC视频教程[Z/OL].

https://www.doczj.com/doc/097058127.html,/news/ee7c6ba4/46eb/494f/8656/8327b1d83c0a.shtml, 2012-06

附录附录1:

public class GanJiCtrl {

// 1:购房 2:出租 3:求租 4:求购2手

private int business;

public GanJiCtrl(int business) {

this.business = business;

}

/**

* 描述:通过dao分配器,分配不同的业务存入不同的数据库

*/

public void daoDispatcher (String htmlDoc) {

switch (this.business) {

case 1:

this.storageInSellHouseDB( AnalyzerGanJiUtil.getHtmlGanJiSellBea n(htmlDoc));

break;

case 2:

this.storageInRentHouseDB( AnalyzerGanJiUtil.getHtmlGanJiRentBea n(htmlDoc));

break;

case 3:

this.storageInRentDemandDB( AnalyzerGanJiUtil.getHtmlGanJiDemandB ean(htmlDoc));

break;

case 4:

this.storageInBuyDemandDB( AnalyzerGanJiUtil.getHtmlGanJiDemandB ean(htmlDoc));

break;

}

}

public void

storageInSellHouseDB(List list) {

String sql = "insert into sellhouseinfo("

+ "title ,housing_estate , housing_address , "

+ "total_price ,

unit_price , img_url ,"

+ " family_situation , belongwhere) "

+

"values(?,?,?,?,?,?,?,?);";

DBHelper.clearTableData("sellhouseinf o");

DBHelper.resetAutoIncrement("sellhous einfo");

SellHouseDaoImpl.getInstance().insert IntoSellHouse(sql, list);

}

public void

storageInRentHouseDB(List list) {

String sql = "insert into renthouseinfo("

+ "title ,housing_estate , housing_address , "

+ "rent_price , img_url ,"

+ " family_situation , belongwhere) "

+

"values(?,?,?,?,?,?,?);";

DBHelper.clearTableData("renthouseinf o");

DBHelper.resetAutoIncrement("renthous einfo");

RentHouseDaoImpl.getInstance().insert IntoRentHouse(sql, list);

}

public void storageInRentDemandDB (List list) {

String sql = "insert into renthousedemand("

+

"demandContent ,housing_address ,

price_range, "

+ " publish_time , belongwhere) "

+ "values(?,?,?,?,?);";

DBHelper.clearTableData("renthousedem and");

DBHelper.resetAutoIncrement("renthous edemand");

HouseDemandDaoImpl.getInstance().inse rtIntoHouseDemand(sql, list);

}

public void storageInBuyDemandDB

(List list) {

String sql = "insert into buyhousedemand("

+

"demandContent ,housing_address ,

price_range, "

+ " publish_time , belongwhere) "

+ "values(?,?,?,?,?);";

DBHelper.clearTableData("renthousedem and");

DBHelper.resetAutoIncrement("renthous edemand");

HouseDemandDaoImpl.getInstance().inse rtIntoHouseDemand(sql, list);

}

}

附录2:

public class DBHelper {

private static Connection con = null;

private static PreparedStatement prestmt = null;

private static ResultSet rs = null;

// 连接数据库的参数

private static String url = "";

private static String username = "";

private static String password = "";

private static String driver = "";

private static FileInputStream fis = null;

private static Properties pp = null;

// 加载驱动

static {

try {

pp = new Properties();

try {

String path = ProjectPath.getProjectPath();

fis = new

FileInputStream(path + File.separator + "bin"

+ File.separator + "dbinfo.properties");

} catch(FileNotFoundException e) {

e.printStackTrace();

}

try {

pp.load(fis);

} catch (IOException e) {

e.printStackTrace();

}

url = pp.getProperty("url");

username =

pp.getProperty("username");

password =

pp.getProperty("password");

driver =

pp.getProperty("driver");

Class.forName(driver);

} catch (ClassNotFoundException e) {

e.printStackTrace();

System.out.println("加载驱动失败");

System.exit(0);

} finally {

try {

fis.close();

} catch (IOException e) {

e.printStackTrace();

}

fis = null;

}

}

public static Connection getConnector() {

try {

// 得到数据源

con =

DriverManager.getConnection(url, username, password);

} catch (SQLException e) {

e.printStackTrace();

}

return con;

}

// 查询功能

public static List> executeQuery(String sql) {

List> listRow;

try {

con = getConnector();

listRow = new

ArrayList>();

if (sql.length() != 0)

prestmt =

con.prepareStatement(sql);

rs = prestmt.executeQuery();

while (rs.next()) {

List listCol = new ArrayList();

for (int i = 1; i <=

rs.getMetaData().getColumnCount(); i++) { listCol.add(rs.getString(i));

}

listRow.add(listCol);

}

} catch (Exception e) {

e.printStackTrace();

throw new

RuntimeException(e.getMessage());

} finally {

close(rs, prestmt, con); // 关闭连接

}

return listRow;

}

/**

* 描述:清空表中数据

* @param tableName要清空的表名字

* @return清空成功返回true,否则返回false

*/

public static boolean

clearTableData(String tableName) {

boolean result = true;

try {

con = getConnector();

prestmt =

con.prepareStatement(" SET

foreign_key_checks=0;");

prestmt.execute();

prestmt = con

.prepareStatement(" TRUNCATE TABLE " + tableName + ";");

prestmt.execute();

prestmt =

con.prepareStatement(" SET

foreign_key_checks=1 ;");

prestmt.execute();

} catch (SQLException e) {

System.out.println("清空表的数据时发生错误");

result = false;

e.printStackTrace();

} finally {

close(null, prestmt, con);

}

return result;

}

/**

* 描述:重置autoincrement的序号

* @param tableName要重置的表

* @return成功返回true,否则返回false

*/

public static boolean resetAutoIncrement(String tableName) {

boolean result = true;

try {

con = getConnector();

prestmt =

con.prepareStatement("alter table " + tableName

+ " auto_increment = 1");

prestmt.execute();

} catch (SQLException e) {

result = false;

e.printStackTrace();

} finally {

close(null, prestmt, con);

}

return result;

}

/**

* 可进行增删改操作的函数

* @param sql

* @return操作成功与否的信号

*/

public static boolean updexecute(String sql) {

boolean result = true;

try {

con = getConnector();

if (sql.length() != 0)

prestmt =

con.prepareStatement(sql);

prestmt.executeUpdate();// 执行操作

} catch (Exception e1) {

result = false;

e1.printStackTrace();

} finally {

close(rs, prestmt, con);

}

return result;

}

// 关闭连接

public static void close(ResultSet rs, Statement prestmt, Connection con) {

try {

if (rs != null)

rs.close();

} catch (SQLException e) {

e.printStackTrace();

} finally {

if (con != null)

try {

con.close();

} catch (SQLException e) {

e.printStackTrace();

}

}

}

}

文献检索的方法

文献检索的方法 一、文献检索方法 查找文献的方法分为如下三种: 1. 直接法 直接利用检索工具(系统)检索文献信息的方法,这是文献检索中最常用的一种方法。它又分为顺查法、倒查法和抽查法。 (1)顺查法 按照时间的顺序,由远及近地利用检索系统进行文献信息检索的方法。这种方法能收集到某一课题的系统文献,它适用于较大课题的文献检索。例如,已知某课题的起始年代,现在需要了解其发展的全过程,就可以用顺查法从最初的年代开始,逐渐向近期查找。 (2)倒查法 倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献检索的方法。此法的重点是放在近期文献上。使用这种方法可以最快地获得最新资料。 (3)抽查法 抽查法是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。 2. 追溯法 不利用一般的检索工具,而是利用已经掌握的文献末尾所列的参考文献,进行逐一地追溯查找“引文”的一种最简便的扩大信息来源的方法。它还可以从查到的“引文”中再追溯查找“引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的相关文献。 3. 综合法 综合法又称为循环法,它是把上述两种方法加以综合运用的方法。综合法既要利用检索工具进行常规检索,又要利用文献后所附参考文献进行追溯检索,分期分段地交替使用这两种方法。即先利用检索工具(系统)检到一批文献,再以这些文献末尾的参考目录为线索进行查找,如此循环进行,直到满足要求时为止。 综合法兼有常用法和追溯法的优点,可以查得较为全面而准确的文献,是实际中采用较多的方法。对于查新工作中的文献检索,可以根据查新项目的性质和检索要求将上述检索方法融汇在一起,灵活处理。 二、文献检索途径

文献检索与应用(第3次)

第3次作业 一、填空题(本大题共10 分,共 5小题,每小题2分) 1.客户端 / 服务器模式简称为 ______ 。 2.情报的属性包括 ______ 。 https://www.doczj.com/doc/097058127.html,KI 期刊数据库属于 ______ 次文献。 4.要查找“气门温度场”课题的相关文献,检索式是______ 。 5.著录是 ______ 。 二、名词解释题(本大题共25 分,共 5小题,每小题5分) 1.文献 2.截词检索 3.报道性文摘 4.学位论文 5.会议文献 三、简答题(本大题共30 分,共 5小题,每小题6分) 1.简述电子期刊的概念及常用的外文电子期刊系统。 2.简述印刷型文献 , 并举例说明 3.简述多元搜索引擎 4.简述人工语言和自然语言的概念 , 并对两者进行简单比较 . 5.简述专利的时效性 四、论述题(本大题共35 分,共 5小题,每小题7分) 1.论述信息、知识、情报三者之间的关系 . 2.现有毕业论文的题目定为“国内外印刷技术的发展现状及趋势分析” , 论文初步拟定包括以下 3 部分内容 : 汽车行业的发展现状 ; 汽车行业的应用现状 ; 汽车行业的发展趋势 . 请制订一个文献检索策略 . 3.现有毕业论文的题目定为“国内外焊接技术的发展现状及趋势分析” , 论文初步拟定包括以下 3 部分内容 : 汽车行业的发展现状 ; 汽车行业的应用现状 ; 汽车行业的发展趋势 . 请制订一个文献检索策略 . 4. 现有毕业论文的题目定为“国内外网络教育的发展现状及趋势分析”,请制订 一个文献检索策略。 5.现有毕业论文的题目定为“国内外材料行业的发展现状及趋势分析” , 论文初步拟定包括以下 3 部分内容 : 材料行业的发展现状 , 材料行业的应用现状 , 材料行业的发展趋势 . 请制订一个文献检索策略 . 答案: 一、填空题( 10 分,共 5题,每小题2分)

信息检索论文范本

信息检索结课论文 题目:网络信息资源检索、技巧及问题研究学院:艺术与设计学院 专业:多媒体技术动画 学生姓名:****** 学号:*********** 授课教师:李凤英

收稿日期: 2004-01-12 基金项目:国家自然科学基金项目(2002A1030405) 作者简介: ******(1975-),男,安徽马鞍山人,桂林电子科技大学硕士生,主要研究方向为移动通信理论与技术。 网络信息资源检索、技巧及问题研究 ****** (桂林电子科技大学 艺术与设计学院,广西 桂林 541004) 摘 要 :互联网已经成为全球最大的信息资源库,这对于网络信息资源的检索提出了更高要求从网络信息资源的发展及探讨检索的意义入手,分析网络信息资源检索工具的类型内容和作用,探讨网络信息资源检索的若干技巧,指出网络信息资源在检索过程中存在着诸如信息质量网络检索工具信息用户等方面的问题,并提出了相应的解决对策,重点为网络用户介绍了一些常用的网络信息检索途径方法和技巧。 关键词:网络信息资源;检索途径;检索方法;检索技巧 中图分类号:G354 文献标识码.A Techniques and problems of the network information resources retrieval ****** (College of art and design of Guilin University of Electronic Technology, Guangxi Guilin 541004) Abstract: the Internet has become the world's largest information resource database, theretrievalof network information resources put forward higher requirements from the development of network information resourcesandto explorethe significance ofanalysis of the types of retrieval,content and function of the network information resource retrieval, researches on Techniques of network information resource retrieval, and points out that network information resources in the the retrieval process such as the existence of information quality of network information retrieval tools users and other issues, and the corresponding countermeasures are put forward, mainly introduces the retrieval methods and skills of some commonly used network information for Internet users. Keywords: network information resources; search; retrieval; Search Tips 1.网络信息资源及检索 网络信息资源是指以电子数据形式的文字图像、声音、动画等,以光磁等非纸质为载体存储,通过网络和计算机等方式再现的信息资源。或者说,是网络和计算机交流 利用所有

《文献信息检索》习题答案文献信息检索(答案)

《文献信息检索》习题答案 一、单选题 1、文献是记录有知识的(A) A.载体 B.纸张 C.光盘 D.磁盘 2、如果需要检索某位作者的文献被引用的情况,应该使用(C)检索。 A.分类索引 B.作者索引 C.引文索引 D.主题索引 3、下列哪种文献属于二次文献( D.) A.专利文献 B.学位论文 C.会议文献 D.目录 4、纸质信息源的载体是(D) A.光盘 B.缩微平片 C.感光材料 D.纸张 5、《中国图书馆分类法》(简称《中图法》)将图书分成( A.) A.5大部分22个大类 B.5大部分26个大类 C.6大部分22个大类 D.6大部分26个大类 6、利用文献末尾所附参考文献进行检索的方法是(C) A.倒查法 B.顺查法 C.引文追溯法 D.抽查法 7、广义的信息检索包含两个过程(B) A.检索与利用 B.存储与检索 C.存储与利用 D.检索与报道 8、中国国家标准的代码是(A) A.G B. B.CB. C.ZG D.CG 9、( D )是报道文献出版或收藏信息为主要功能的工具。 A.题录 B.索引 C.文摘 D.目录 10、逻辑运算符包括(D) A.逻辑与 B.逻辑或 C.逻辑非 D.A,B和C 11、记录是对某一实体的全部属性进行描述的结果,在全文数据库中一条记录相当于(C),在书目数据库中,一条记录相当于() A.一条文摘,一篇完整的文献 B.一条文摘,一条题录 C.一篇完整的文献,一条题录或文摘 D.一条题录,一条文摘 12、《中国学术期刊全文数据库》提供的文献内容特征检索途径有(B) A.机构 B.篇名/关键词/摘要 C.中文刊名 D.作者 13、根据反映新内容的程度从大到小,下列文献类型的排序正确的是:(A) A.会议论文,科技期刊,科技报告,科技图书 B.科技图书,科技期刊,科技报告,会议论文 C.科技报告,会议论文,科技图书,科技期刊 D.以上都不对 14、《中国科研机构数据库》、《中国科技名人数据库》属于:(B) A.书目数据库 B.指南数据库 C.全文数据库 D.数值数据库 15、下列检索工具中,主要收录化学与化工类文献的是:(D) A.SCI B.OCLC C.EI

文献信息检索基础知识

文献信息检索基础知识 第一节概论 科学技术的发展,具有连续性和继承性,科学技术的发明创造,需要依靠经验、材料和理论的不断积累,没有科学上的继承和借鉴,就没有提高。任何一个科技工作者,都有赖于在前人已经取得成就的基础上进行不断的研究和探索。在科研选题过程中,要首先了解所研究的学科领域发展现状与趋势,对自己挑选的课题进行查新,以免重复别人的劳动。在课题研究过程中,要借鉴别人已有的成果,比如一些统计、实验数据,可以直接利用,没有必要自己再做一次,节省研究经费与时间;对别人研究没有取得成功的地方,要分析原因,可以避免研究走入歧途。要完成这一切,都离不开科技文献的检索与利用。科技文献是科学技术研究成果的记录,积累了许多有用的事实、数据、理论、方法和科学假设,反映了科学技术研究的进展和水平,是科技信息的主要来源。科技文献数量急剧增长,可以说是“知识爆炸”,在浩如烟海的文献面前,盲目地查找自己所需要的文献很困难,对信息污染难以分辨;专业文献出版分散,如果只注意查找本专业的核心期刊,已看不到专业文献的全貌,仅能了解其中的一小部分而已,因为大量的专业文献分散出版在其它刊物里。文献老化加快,出版种类繁多,我们如果想了解某一数据、某一事件或事实,更如大海捞针,无从下手。要快速、全面、准确地获得所需要的文献信息,就必须掌握科学的文献查找方法,因此就必须学习科技文献检索知识。 掌握了科技文献检索的方法,首先可以节省查找文献的时间,据调查统计,一个科技工作者在其科学研究生涯中花在查找文献上的时间占整个科研时间的40~50%,如果掌握正确的文献检索方法,将缩短查找文献时间,从而延长科研寿命。其次有利于专题文献查全,由于专题文献出版分散特点,使得只从核心期刊上获取专题文献很难查全,掌握文献检索方法,在检索工具或数据库中去检索,就能克服这一不足。再者可以克服自然语言和学科专业语言障碍,由于当今文献语种很多,而一般科技工作者除母语之外仅掌握1~2门外语,这就为了解世界先进技术带来困难。而文摘型检索工具选登的文摘覆盖的语种较多,即使是一个不掌握外语的人也可能通过文摘的阅读,就能了解各语种文献的主要论点、研究方法、结论等,能够广泛了解有关领域的发展趋势。 下面主要是通过介绍科技文献检索的基础知识和典型检索工具的使用方法,引导科技人员掌握检索科技文献的方法。 一、关于信息的几个基本概念 (一)信息 1、信息的定义 信息在我们的生活中随处都能见到,信息化社会、信息时代、信息产业、信息技术……我们的生活和信息紧密联系在一起。那么信息到底是什么呢?作为日常用语,信息就是信息,我们的生活中到处都存在有信息,如手机铃声、上网浏览的网页、电视节目等等。对人类而言,人的五官就是为了感知信息,他们是信息的接收器,它们所感受到的一切都是信息。信息普遍存在于自然界、生物界和人类社会中。根据发生源的不同,信息一般可分为自然信息、生物信息、机器信息和人类信息四大类。湖光山色、刮风下雨是自然信息;细胞染色体的遗传基因是生物信息;电讯系统中的电流脉冲、计算机中使用的“0”与“1”的二进制代码是机器信息;人类社会活动中的各种语言、文字、图形符号是人类信息。

信息检索技术论文

期末课程论文 论文标题:基于音频的信息检索 课程名称:信息检索技术 课程编号:1220500 学生姓名:潘国伟 学生学号:1100310220 所在学院:计算机科学与工程学院 学习专业:计算机科学与技术 课程教师:王冲 2013年7月3 日

引言: 进入知识经济时代,知识管理、知识服务的理念得到广泛认同,信息检索技术也由基于关键词的信息检索逐步转向针对内容的基于知识的信息检索。较之前者,其检索结果更准确,更贴近用户需求。信息检索是将信息按照一定的规律组织起来,找到所需信息的过程和技术,简单的说,就是信息的有序化识别和查找。信息检索效率就是实施识别和查找过程的效率。信息检索效率不仅是影响信息检索工具价值的重要因素,也是评价信息检索技术发展的重要指标。目前一些基于文本的Web引擎,如Google,Baidu,功能已非常强大,但还缺乏比较实用的音频搜索引擎。Internet上的多媒体流非常巨大,需要一些高效的搜索引擎从浩如烟海的数据中找出需要的信息。另外,音频检索在辅助视频检索和卡拉OK检索系统以及军事、刑侦领域方面都有巨大的应用价值和广阔的研究前景。 基于内容的音频检基索关键技术 问题: 传统的方法,其主要缺点有: 一是当数据量越来越多时,人工注释的工作量加大; 二是人对音频的感知有时难以用文字注释表达清楚,人工注释存在不完整性和主观性; 三是不能支持实时音频数据流的检索。 这里主要综述了音频检索方法,讨论了一些音频检索中的关键技术:音频特征提取、音频分类、语音识别技术等。 总体介绍:

语音识别技术概述 语音识别技术,也被称为自动语音识别(Automatic Speech Recognition, ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。 语音识别技术是以语音信号处理为研究对象,让机器接收并识别、理解语音信号,并将其转换为相应数字信号的技术。让机器听懂人类的语言,这是人们长期以来梦寐以求的事情,而语音识别是一门非常复杂的交叉性学科,它涉及语音语言学、计算机科学、信号处理学、生理学、心理学等一系列学科,是模式识别的重要分支。50年代,是语音识别研究工作的开始时期,它以贝尔实验室研制成功可识别十个数字的Audry系统为标志。20世纪80年代语言识别研究进一步走向深入,基于特定人孤立语音技术的系统研制成功。在过去的30年里,隐马尔可夫模型和人工神经元网络在语音识别中得到了成功的应用。 语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。并通过算法和计算机技术相结合的方式来实现。目前,这样的系统能够做到识别理解数十万条词汇的连续语音信号。这种现代模式识别系统除了在语音领域的应用外,还可以广泛应用于信号处理和模式识别的其他领域。语音识别一般分为两个步骤:

(完整版)文献信息检索试题及答案

文献信息检索 一、填空题 1、文献的级次分为零次文献、一次文献、二次文献、三次文献。 2、按内容可将计算机检索系统的数据库类型分为:文献书目型数据库、事实型数据库、数值型数据库和全文型数据库。 4、我国标准可分为国家标准、部标准和企业标准三大类。 5、在实际检索中,文献的检索方法主要有:直查法、追溯法、工具法和综合法。 6、信息检索常用的方法有:引文追溯法、工具法和循环法。 7. 构成文献的三要素是知识、载体和记录。 8. 标准文献的主体是标准。 9. 期刊论文的文献出处包括期刊名称、年卷期和起止页码。 10. 所需信息被检出程度的信息量指标为查全率。 二、选择题 1. 文献是记录有知识的( A ) A 载体 B 纸张 C 光盘 D 磁盘 2. 下列哪种文献属于一次文献( A ) A 期刊论文 B 百科全书 C 综述 D 文摘 3. 下列哪种文献属于二次文献( D ) A 专利文献 B 学位论文 C 会议文献 D 目录 4. 下列哪种文献属于三次文献( C ) A 标准文献 B 学位论文 C 综述 D 文摘 5. 下列选项中属于连续出版物类型的选项有( C ) A 图书 B 学位论文 C 科技期刊 D 会议文献 6. 下列选项中属于特种文献类型的有( D ) A 报纸 B 图书 C 科技期刊 D 标准文献 7. 纸质信息源的载体是( D ) A 光盘 B 缩微平片 C 感光材料 D 纸张

8. 以刊载新闻和评论为主的文献是( B ) A 图书 B 报纸 C 期刊 D 会议文献 9. 使用分类语言对信息进行描述和标引,主要是可以把( B )的信息集中在一起。 A 同一作者 B 同一学科 C 同一主题 D A+B+C 10.《中国图书馆分类法》(简称《中图法》)将图书分成( A ) A 5大部分22个大类 B 5大部分26个大类 C 6大部分22个大类 D 6大部分26个大类 11.《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在( A )类目下查找。 A S类目 B Q类目 C T 类目 D R类目 12. 利用文献末尾所附参考文献进行检索的 方法是( C ) A 倒查法 B 顺查法 C 引文追溯法 D 抽查法 13. 至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合,称为( A ) A 数据库 B 记录 C 字段 D 文档 14. 广义的信息检索包含两个过程( B ) A 检索与利用 B 存储与检索 C 存储与利用 D 检索与报道 15. 狭义的专利文献是指( C ) A 专利公报 B 专利目录 C 专利说明书 D 专利索引 三、判断题 1. 1948年,美国数学家、信息论的创始人维纳在题为《通讯的数学理论》的论文中指出:“信息是用来消除随机不定性的东西”。 ( × ) 2. 从文献检索的角度来看,一次文献是检索对象,二次文献是检索手段。(×)----从文献检索的角度来看,一次文献是检索的对象,二次文献是用于检索的主要手段和工具。 3. 《中国图书馆分类法》是按知识门类的学科体系的逻辑次序进行分类。(√)

信息检索与利用论文

信息检索与利用 本学期我很荣幸地选修了信息组织这门课,因为通过这门课的学习,我学会了如何利用网络这个无尽的资源库快速便捷地找到自己所需要的信息,这便是信息检索。这是一门让我受益匪浅的课程。 当今时代,被誉为信息爆炸的时代,各种各样的信息已各种各样的形式充斥在人们的学习生活工作中。而随着科学技术的不断发展网络更是其中提供信息的佼佼者。她的信息之广泛之于传统的工具书给了当今人们全然不同的体验,她让人们能更加快速便捷地接受到各种不同的信息,给人们带来了很多方便。但网络中同时也充斥着很多的垃圾信息,需要人们经过删选才能为之所用,如果方法不正确的话,这样也同样会很费时费力不能达到事半功倍的目的。而且很多专业性很强的学术性的信息通过一般的途径都是需要付费的,这也给我们的学习工作带来很大的不便。因此,网络中的信息检索与利用变得尤为重要。 什么是信息检索呢?我通过百度搜索在“百度百科”可得到以下答案:信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek)。总的来说,信息检索就是用一定的方式找到用户所需要的信息(此处通过百度查询信息检索的定义也是一种方法)。那么该如何快速便捷的找到这些我们所需要的信息呢?信息检索与利用也就是帮我们解决这个问题。下面我就以如何获取我所学的的专业知识这个例子具体讲解改怎样利用信息检索。 例如我所学的专业是信息管理与信息系统,我需要自己设计一个起泡排序程序。对于这个程序,我们首先有一个大致的认识,即第一步是选定排序方法,第二步是设置起泡排序的过程。这是一个发散型的实验,这就可以借助网络这个信息平台,以获得我们所需要的信息。首先,我们要知道如何进行实验的第一步,即决定排序方法。我们平时习惯先用百度或者Google这些门户网站搜索。此处利用百度搜索的结果是:将被排序的记录数组R[1..n]垂直排列,每个记录R[i]看作是重量为R[i].key的气泡。根据轻气泡不能在重气泡之下的原则,从下往上扫描数组R:凡扫描到违反本原则的轻气泡,就使其向上"飘浮"。如此反复进行,直到最后任何两个气泡都是轻者在上,重者在下为止。对于一般的查找来说只要这样的结果基本上就能满足要求,但是实验方法这种要求比较专业的情况来说,我们往往会借助专业网站进行相关论文搜索,从相关论文中查找的对应的方法或借助他人的学习经验,初步设定解决方案,这种专业的网站使用得比较多比较普遍的有万方数据库(偏于理科)、中国期刊网(偏于文科)等。这些网站提供的都是一些很前沿而且都是经过发表的学术类文章,能够为我们提供很好的信息服务。但这些网站的一般都是要付费的,需要注册登录才能下载相关文章,一般大学图书馆都会每年购买这些网站,为我们的学习研究带来很多方便。在我们的信息组织课上,老师提到,如果不能享用这些服务,可以使用一些特殊的搜索方法,比如在Google中,在搜索栏中输入“index of/cnki”再按搜索键就可以找到许多图书馆的CNKI、VIP、超星等数据库的入口。进入这些网站后,在一般检索中输入关键词“起泡排序算法”搜索,即可找到相关论文,点击就可以免费下载,但应该下载一个PFD 阅读器才能打开查看。通过这样的方法,可以在任何时间任何地点便捷地找到自己所需的专业信息,可以让你没有顾忌的找到自己所需要的材料为你所用。

《文献检索》课程论文

《文献检索》课程论文 《文献检索》课程结束了,本门课让我学到了不少知识,也打开了文献检索的新方式,惊讶于原来信息可以这么查,跟本科时候的《文献检索》课程还是不一样的。之前对文献的了解只是去学校的图书馆官网查一些中文、外文文献,搜索关键词,经过老师的知道,现在对检索有了进一步的认识。 一、文献检索的认识 顾名思义,文献信息检索,是以科学的方法,利用检索工具和检索系统,从有序的文献集合中检出所需的信息的一种方法。它在科学交流中是传递信息的一种重要手段,是人类为了合理地分发情报和充分地利用情报而采取的一种重要的交流方式。文献信息检索不仅能够促进信息资源的迅速开发和利用,而且能够帮助科研人员继承和借鉴前人的成果,避免重复研究,少走弯路;节省查找文献的时间,从而加速地质调查研究工作的进程。 文献检索方法是为实现检索目的而采取的具体操作方法或手段。检索信息的方法主要有两种,即直接检索和间接检索。事实上,现在的许多图书馆仍然在使用这样的分类层次来对收藏的资料进行分类。现在,计算机技术的发展使得自动构建大型索引成为可能。也就产生了两种不同的检索策略,既以计算机为中心的和以人为中心的信息检索。在现在人们的生活中,计算机已是普遍,人们用计算机网络检索的多些。 二、学习文献检索的意义 2.1提高学习和工作效率 学习信息检索可以更好地继承前人经验,加快学习进度的步伐。我们阅读的科技文献学习的教材内容,往往是几年、几十年前的发现或研究成果。虽然这些成果对我们现在的研究往往有着不可忽视的作用,但是我们也要注意吸收最新的研究成果。而且学习学习信息检索,可以避免学习研究工作的重复劳动,使自己的成果始终建立在最新成果的基础上。 2.2开阔视野、拓宽知识面 当今,信息呈爆炸式增长,不仅如此,信息载体也发生了巨大的变化,除传统纸介质信息外,每天都有大量的磁载体信息、电子版信息及各类网上信息涌现出来,这些浩如烟海的信息的多样性、离散性与无序性及其复杂的检索界面和使用方法,増加了信息利用的难度,极大地影响了人们获取信息的质量与效率。信息是促进社会经济、科学技术以及人类生活向前发展的重要因素。一个国家的科技进步和社会发展越来越取决于对信息的开发与利用,谁能充分开发和有效地利用信息资源,谁就能抢占科学技术发展的制高点。一个国家是这样,一个人也是这样。谁能充分掌握时讯,把握住时代的脉搏,谁就能站在高点。 2.3促进学生的自学能力和研究能力 联合国一位官员曾经预言,“未来的文盲,不再是不识字的人,而是没有学会学习方法的人。”文献检索教育可以有效地解决学习技能和方法问题,因此在这一点上,其意义重大。随着社会的发展,人类文明成果在迅速积累和扩充。终生教育思想的核心就是持续不断地自学和独立研究。以培养大学生自学和独立研究能力为重要目标之一的文献检索教育,作为一门课程,彰显了其这方面的重要作用 2.4提高对图书馆现有文献资源的使用率 我国高校图书馆目前藏书总共大约2亿册。只有学会检索资料,才能树立了情报意识,就有可能通过切实认真的而不是一般性的调查研究,充分了解国内和国外过去和现在、前人和今人所从事的研究及其所达到的水平,研究目前尚未解决的问题,才能做出新贡献。三、Endnote的使用 本门课程,老师重点讲述了Endnote的使用。Endnote是一款用于海量文献管理和批量参考文献管理的工具软件,自问世起就成为科研界的必备武器。在前Endnote时代,文献复习阶段从各大数据库中搜集到的文献往往千头万绪、或重复或遗漏,难以管理,阅读所作的

信息检索论文

信息检索结课论文 题目:国内外学术期刊数据库信息检索系统及其方法学院:计算机科学与工程学院 专业:计算机技术 学生姓名:张所滨 学号:G140301013 授课教师:李凤英

国内外学术期刊数据库信息检索系统及其方法 张所滨 (桂林电子科技大计算机科学与工程学院,广西桂林541004) 摘要:为了让科技工作者对数字期刊的信息检索有一个总括的了解,简述了国内外比较重要和常用的数据库检索系统,如中国知网、中科院文献情报中心的电子期刊服务系统、中国高校人文社会科学文献中心、重庆维普咨讯公司外文科技期刊数据库、国家科技图书文献中心、Springer LINK、Web of Science等,并简单介绍了其检索方法。掌握全面的数据检索系统,正确运用数据信息检索,可帮助科研工作者快速、有效地拓展其知识面,提高自身的学术水平。 关键词:学术期刊;数据库;信息检索 中图分类号:G250.73文献标志码:A 文章编号: Domestic and foreign academic journals database information retrieval system and method Zhang Suobin (School of Computer Science and Engineering, Guilin University of Electronic Technology, Guilin 541004, China) Abstract:In order to make the scientific and technical workers of digital journals information retrieval has ageneral understanding, this paper briefly summarizes the important and common database retrieval system, such as Chinese HowNet, Chinese Academy of Sciences of Centre for Documentation and Information electronic periodical service, China College of Humanities and social science literaturecenter, Chongqing VIP advisory company of foreign science and technology periodical database, the national science and Technology Library Document Center, Springer LINK, Web of Science, and introduces its retrieval method. Master data retrieval system, the correct use of data information retrieval, can help researchers to rapidly, effectively expand their knowledge, improve their academiclevel. Key words:academic journal; database; information search 随着互联网和计算机技术的快速发展,期刊数字化趋势也随之快速增长,越来越多的传统期刊,特别是学术期刊,都积极加入到数字化期刊的队伍中来。数字化期刊的好处是:可以缩短出版周期,编辑部编校好的期刊文章不需要经过制版、印刷过程即可在线出版,节约了成本和时间;因通过互联网传播,所以不需要流通环节即可到达读者面前,世界各地的读者只需通过计算机即可下载或在线阅读,方便、快速、节时。因此,期刊数字化已是传统期刊拓展发行渠道、强化期刊影响力必须要走的过程。但随着数字化期刊的快速发展,中外文数字化学术期刊的种类和数目也越来越多,这给读者、作者检索学术期刊信息带来了困难。因此,不论是图书情报信息服务机构还是用户自身,只有掌握和使用各种信息检索工具,才能方便、快捷地获取各种期刊信息[1]。 1 国内重要期刊数据库检索系统 1.1中国知网 CNKI工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,由清华大学、清华同方发起,始建于1999年6月。采用自主开发并具有国际领先水平的数字图书馆技术,建成了世界上全文信息量规模最大的“CNKI数字图书馆”,并正式启动建设《中国知识资源总库》及CNKI网格资源共享平台,通过产业化运作,为全社会知识资源高效共享提供最丰富的知识信息资源和最有效的知识传播与数字化学习平台。《中国期刊全文数据库》包括有《中国学术期刊网络出版总库》、《中国高等教育期刊文献总库》、《中国基础教育期刊文献总库》、《中国精品科普期刊文献库》、《中国党建期刊文献总库》、《中国政报公报期刊文献总库》、《中国经济信息期刊文献总库》、《中国精品文化期刊文献库》、《中国精品文艺作品期刊文献库》九大类期刊数据库。选择出版中国大陆各类学术及非学术期刊共计8000余种,最早收录年代回溯至各刊创刊,是目前世界上最大的连续动态更新的中国期刊全文数据库,在国内外高等院校、科研院所、公共图书馆等各行各业得到了广泛普及和应用。 1.2 中科院文献情报中心的电子期刊服务系统[2-3] 中科院文献情报中心的电子期刊报务系统集成了Elsevier、Springer、Blackwell等众多著名全文电子期

文献检索论文

文献检索结课论文 浅谈中药材的浸提技术 院(系)理学院 专业生物制药 年级生物10-2班 姓名张佳美学号10054232

浅谈中药材的浸提技术 摘要:随着现代工业的飞速发展,中药工程技术也不断发展,我国中药生产状况大有改进,近年应用于中药提取分离中的高新技术有:超临界流体萃取法、膜分离技术、超微粉碎技术、中药絮凝分离技术、半仿生提取法、超声提取法、旋流提取法、加压逆流提取法、酶法、大孔树脂吸附法、超滤法、分子蒸馏法。本文综述了近年来中药有效成分提取分离技术的最新进展。 关键字:中药;萃取;分离 1 传统提取方法 1.1 乙醇提取法 其基本原理与热水浸提法相同,不同之处是用乙醇作溶剂浸出中药有效成分,该法可以有效减少药材中水溶性杂质如淀粉、蛋白质、粘液质等的浸出,对于这类杂质含量较多的药材尤为适宜。乙醇浸提法分为冷浸法(渗漏法)和热提法(回流法)两种[1]。由于采用乙醇作为溶剂进行提取,某些溶解于乙醇中的杂质,如树脂、油脂、色素等也被提取出来。对于这些杂质,可从醇提取液中回收乙醇,加水搅拌,冷藏一段时间,待完全沉淀后过滤除去。冷浸法一般用于提取热敏性成分,但乙醇用量较多,回收溶剂量大,生产周期长。热提生产周期短,但杂质含量相对较高,给后继的分离工序增加了成本。 2 传统提取方法的物理场强化 2.1 功率超声强化技术 一般认为,功率超声对提取过程的强化作用来源于超声空化[2]。当适宜频率和强度的超声波在提取溶剂中传播时,超声空化效应能在空化泡周围产生瞬时高温高压,增加了溶剂进入中药细胞的渗透性,加强了传质过程;超声空化效应在溶剂内部产生强烈冲击波和速度极快的微射流,能有效地使提取系统中的固液边界层减薄,增大传质速率;而冲击波或微射流产生的强大剪切力能使植物类中草药的细胞壁破裂,使细胞放出内含物。此外,超声波的机械效应和热效应也能加速有效组分的扩散释放,并充分与溶剂混合,利于提取。因此,应用功率超声能显著强化和改善中药有效成分的提取过程,提高药物有效成分的溶出速度和溶出次数,与常规的热水浸提法和乙醇浸提法相比,具有提取时间短(〈30min)、浸出率高(增大2-3倍)等优点,而且,功率超声强化提取过程可以控制在较低温度下进行,能有效的保护中药中热敏性的有效成分。有报道称,将当归流浸膏制备工艺中冷浸法改进为采用工作频率26.5kHz、输出功率250W的超声波在45摄氏度的低温下浸提,能有效提高浸提效率,缩短生产周期,提高总固形物及阿魏酸的含量。此外,超声强化提取也应用于生产水杨酸、氯仿黄连素、岩白菜宁等药物成分。岩白菜宁的提取通常在80摄氏度下采用酒精回流法,倘若采用超声作用下的酒精提取法,在40摄氏度下只需一半的提取时间就可以获得比原提取

信息检索与应用论文范文

信息检索与应用论文 姓名:XXX 学号:XXXXX 班级:XXXXXXXX 摘要:文章主要研究了信息检索的重要性,信息检索的含义和要素,以及常见的信息检索方法的介绍和信息检索过程中应当注意的问题以及解决方法这几个方面,采用有文献法、个案法、统计法、比较法、行动研究法、调查法和经验总结法等研究方法,来阐述信息检索及其应用。详细全面的介绍,可以让部分不了解信息检索的人能通俗易懂的了解并应用一些常见的信息检索工具。从事实和实际出发,有力的论证了信息检索的重要性以及它的实用性。 关键字:信息;检索;信息检索;事实检索;检索语言;文献语言 通过学习信息检索这门课,我学会了如何利用web这个庞大的资源库快速便捷地找到自己所需要的信息。信息检索与应用涉及的领域广阔,从中文数据库搜索的介绍到外文数据库搜索的介绍,在这个快速发展的21世纪,各种信息数据在不断的增加,怎样更快速便捷的查找到我们需要的信息,显得日益重要。 我们为什么要进行信息检索呢?通过什么方法进行快速的检索来应用检索显得日益重要。 我们为什么要进行信息检索呢?一方面,信息检索是获取知识的捷径。美国普林斯顿大学物理系一个年轻大学生名叫约瀚·菲利普,在图书馆里借阅有关公开资料,仅用四个月时间,就画出一张制造原子弹的设计图。他设计的原子弹,体积小(棒球大小)、重量轻(7.5公斤)、威力大(相当广岛原子弹3/4的威力),造价低(当时仅需两千美元),致使一些国家(法国、巴基斯坦等)纷纷致函美国大使馆,争相购买他的设计拷贝。另一方面,信息检索是科学研究的向导。美国在实施“阿波罗登月计划”中,对阿波罗飞船的燃料箱进行压力实验时,发现甲醇会引起钛应力腐蚀,为此付出了数百万美元来研究解决这一问题,事后查明,早在十多年前,就有人研究出来了,方法非常简单,只需在甲醇中加入2%的水即可,检索这篇文献的时间是10多分钟。在科研开发领域里,重复劳动在世界各国都不同程度地存在。据统计,美国每年由于重复研究所造成的损失,约占全年研究经费的38%,达20亿美元之巨。日本有关化学化工方面的研究课题与国外重复的,大学占40%、民间占47%、国家研究机构占40%,平均重复率在40%以上;我国的重复率则更高。此外,信息检索还是终身教育的基础。学校培养学生的目标是学生的智能:包括自学能力、研究能力、思维能力、表达能力和组织管理能力。 UNESCO提出,教育已扩大到一个人的整个一生,认为唯有全面的终身教育才能够培养完善的人,可以防止知识老化,不断更新知识,适应当代信息社会发展的需求 那么,什么是信息检索呢?通过“百度”搜索引擎可以得到解释是:“:信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。狭义的信息检索就是信息

文献检索与论文写作

文献检索与论文写作 篇一:文献检索与论文写作讲义 文献信息检索与论文写作讲义 前言 古今中外,凡学术研究之集大成者,都非常重视搜求和利用文献资料。中国儒家经典之一《论语》的《八佾》篇中记载着我国古代思想家、教育家孔子的一段话:“夏礼吾能言之,杞不足徵也;殷礼吾能言之,宋不足徵也;文献不足故也。足,则吾能徵之矣。”(这段话的意思是:“夏朝的礼,我能说出来,(但是它的后代)杞国不足以证明我的话;殷朝的礼,我能说出来,(但它的后代)宋国不足以证明我的话。这是由于文字资料及熟悉夏礼和殷礼的人不足的缘故造成的。如果足够的话,我就可以得到证明了。”)孔子论事有据、注重文献的治学精神由此可见一斑。 英国伟大的科学家牛顿说过:“如果说我比别人看得略为远些,那是因为我站在巨人们的肩膀上的缘故。”(这句名言最初出现在牛顿给发明显微镜、提出胡克定律的英国力学家胡克(Robert Hooke, 1635–1703)的一封回信中。) 牛顿所谓的“站在巨人肩膀上”,意思就是指他充分地占有和利用文献资料,从前人研究的“终点”中找出自己研究的“起点”,从而在学术研究工作中取得了突破性的成就。

上述孔子和牛顿的言论,充分说明文献资料在学术研究 中的重要作用。而文献信息检索方法是扩大资料来源的重要途径,它既是一门学科,也是一种学习方法。 《文献信息检索与论文写作》是为大四学生准备毕业论文而设的一门网上自修课,它淡化了学科的伦理研究和概念论述,侧重于实务和应用。毕竟,探究文献信息是众人之事,须善于撷取他人之长,但学习文献信息检索技巧却是因人而异,须推陈出新,善于融汇一己心得。因此,本课程融百家之言于一炉,但更求能为学生提供一些适合于本学科的新信息、新技能,传递文献信息检索的新思想、新观念。 文献信息检索的目的是应用,在应用之中我们一定还要注意拿来主义与学术创新之间的关系。复旦教授俞吾金认为,学术规范的灵魂是学术创新。他说:“任何一种学术研究活动,如果缺乏对它以前的研究史的必要的回应,本质上都是不合法的。换言之,任何一种学术研究成果,如果不包含着对前人和同时代人的代表性研究成果的必要的回应,那么,它根本上就是不合法的,就是不符合学术规范的。”这段话精辟地概括出了我们在写论文时既要注意研究资料自主创新,又不能抄袭别人的成果,否则大处说叫学术腐败,小处说是做人不诚实。北京大学温儒敏认为:学术规范应从细小的事做起,从自己做起。他说:“现在的确有不少学者,特别是年轻的学者和研究生、大学生,不一定都了解

文献检索论文范文

南通农业职业技术学院 毕业论文(设计) 课题名称生物防腐剂在食品工业中的应用 专业名称食品营养与检测 班级营养3122 学号22 姓名张艳 指导老师 2014年 5 月 26 日

生物防腐剂在食品工业中的应用 摘要 本论文介绍了目前应用较多的微生物防腐剂乳链球菌素、溶菌酶及那他霉素的抗菌机理、抗菌谱及其在食品工业中的应用情况,讨论了微生物防腐和保鲜剂的研究进展,并对其发展趋势进行了展望。 关键词生物防腐剂食品工业应用

Application of biological preservatives in food industry In this paper This paper introduces the application of the microbial preservative Streptococcus lactis used peptide, lysozyme and natamycin antibacterial mechanism, antibacterial spectrum and in the food industry, discussed the research progress of microbial preservative and antistaling agent, and the trend of development in the future. Keyword Biological preservatives The food industry The food industry

目录 1 引言 (1) 2 生物防腐剂及其特性 (2) 2.1 细菌素 (2) 2.1.1 Nisin的结构特点 (2) 2.1.2 Nisin的理化性质 (2) 2.1.3 Nisin的抑菌性 (3) 2.2 那他霉素 (3) 2.2.1 理化特性 (3) 2.2.2 抑菌特性 (4) 2.3 溶菌酶 (4) 2.4 泰乐菌素 (4) 2.5 聚溶素 (4) 2.6 酵母菌嗜杀毒素 (5) 2.7 霉菌素 (5) 2.8 食用菌 (5) 3 生物防腐剂在食品工业中的应用 (5) 3.1 Nisin的应用 (5) 3.2 Nisin溶菌酶在食品防腐中的应用 (6) 3.3 Natamycin在食品中的应用 (6) 全文结论 (7) 致谢 (8) 参考文献 (9)

信息检索效率的探讨

学号:20095101112 学年论文(设计) 学院计算机与信息技术学院 专业计算机科学与技术 年级2009级计算机科学与技术(1)班 姓名杜懂懂 论文(设计)题目信息检索效率的探讨 指导教师刘道华职称副教授 成绩 2013 年 5 月 13 日 信息检索效率的探讨

摘要:在信息技术迅速发展的推动下,传统信息服务机构和网络信息服务运营商逐步走上由信息服务向知识服务的转型之路。在这种趋势下,信息检索也由过去单纯的字符匹配逐步转向面向内容、基于知识的信息检索。在这里简单探讨一下基于知识服务的信息检索效率的基本概念和评价指标,剖析语义分析程度、信息模型、检索方法和信息收录范围等主要影响因素,最后通过一个实例,对比分析说明知识服务将提高用户信息检索的效率。 关键词:知识服务;信息检索;效率。 引言:进入知识经济时代,知识管理、知识服务的理念得到广泛认同,信息检索技术也由基于关键词的信息检索逐步转向针对文章内容的基于知识的信息检索。后者不再是基于字符的机械匹配,而是更强调语义,模拟人类的思维方式,从语义和概念出发,自动分析信息资源的语义信息,查找和发现具有相关知识单元的信息资源。较之前者,其检索结果更准确,更贴近用户需求。信息检索是将信息按照一定的规律组织起来,找到所需信息的过程和技术,简单的说,就是信息的有序化识别和查找。信息检索效率就是实施识别和查找过程的效率。信息检索效率不仅是影响信息检索工具价值的重要因素,也是评价信息检索技术发展的重要指标。 1、基于知识服务的信息检索效率的主要评价指标有检全率、检准率、友好性和检索耗时。 1.1、检全率 检出相关信息的记录数与系统中全部相关信息的记录数之比。这里的相关信息是指具有语义联系的信息。 1.2、检准率 是指检出相关记录数与检出全部相关记录数之比。 1.3、友好性 对检索结果按照相关度进行排序,便于用户率先查看相关度高的结果再看相关

文本预览
相关文档 最新文档