第二章习题答案与解答

  • 格式:docx
  • 大小:23.27 KB
  • 文档页数:5

下载文档原格式

  / 8
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章习题及解答

1. 简述网络信息资源的特点。

(1)分散性分布;

(2)共享性与开放性;

(3)数字化存储;

(4)网络化传输。

2. 试比较全文搜索引擎、分类检索、元搜索引擎三种搜索引擎的不同之处。

全文搜索引擎是目前主流的搜索引擎,有计算机索引程序在互联网上自动检索网站网页,建立起数据库,收录网页较多,用户按搜索词进行检索,返回排序的结果。以谷歌、百度、必应等为代表。

分类检索,将人工搜集或用户提交的网站网页内容,将其网址分配到相关分类主题目录,形成分类树形结构索引。用户不需用关键词检索,只要根据网站提供的主题分类目录,层层点击进入,便可查到所需的网络信息资源。典型代表有Yahoo、新浪分类目录搜索、淘宝网的类目等。分类检索用于目标模糊、主题较宽泛、某专业网站或网页的查找,要求查准时选用;

元搜索引擎不是一种独立的搜索引擎,没有自己的计算机索引程序和索引数据库,是架构在许多其他搜索引擎之上的搜索引擎。在接受用户查询请求时,可以同时在其他多个搜索引擎中进行搜索,并将其他搜索引擎的检索结果经过处理后返回给用户。

3. 简述搜索引擎的工作原理。

搜索引擎的基本工作原理包括如下三个过程:首先,抓取,在互联网中发现、搜集网页信息;第二,建立索引,对信息进行提取和组织建立索引库;第三,搜索词处理和排序,由检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。

4.简述常用的关键词高级检索功能。

常用的关键词高级检索功能应用包括:使用检索表达式搜索、使用高级搜索页、元词搜索。

使用检索表达式搜索分别有空格、双引号、使用加号、通配符、使用布尔检索等。

有时我们为了限制搜索范围、搜索时间、过滤关键字等,需要用到高级搜索页。

大多数搜索引擎都支持“元词”(metawords)功能。依据这类功能,用户把元词放在

关键词的前面,这样就可以告诉搜索引擎你想要检索的内容具有哪些明确的特征。

5. 简述基于大数据信息检索的特点。

基于大数据的信息检索具有以下特点:

智能化、个性化、可视化。

6. 简述大数据的特征。

大数据的特征可用4V来概括:

第一,Volume(海量的数据规模);

第二,Variety(多样的数据类型);

第三,Value(价值密度低);

第四,Velocity(快速的数据流转)。

7. 简述大数据的总体三层架构。

大数据的总体架构包括三层:数据存储、数据处理和数据分析。类型复杂和海量由数据存储层解决,快速和时效性要求由数据处理层解决,价值由数据分析层解决。

8. 数据分析主要关注的两个内容是什么?

数据分析主要关注两个内容:一是数据建模,在该数据模型下需要支持各种分析方法和分析策略;二是根据业务目标和业务需求建立的KPI指标体系,对应指标体系的分析模型和分析方法。解决这两个问题基本解决数据分析的问题。

9. 简述数据挖掘。

数据挖掘是面对海量数据时对数据价值进行提炼的关键环节,它没有什么预先设定好的主题,主要是在现有数据上面进行基于各种算法的计算,从而起到预测(Predict)的效果,实现一些高级别数据分析的需求。比较典型算法有用于聚类的Kmeans、用于统计学习的SVM 和用于分类的NaiveBayes,主要使用的工具有Hadoop的Mahout等。

10. 简述大数据思维。

大数据时代的变革绝不限于技术层面,本质上,它为我们观察世界提供了一种全新思维。

(1)从样本思维转向总体思维。在大数据时代,人们可以获得并分析更多的数据,而不再依赖于采样。

(2)从精确思维转向容错思维。当拥有海量即时数据时,绝对的精准不再是追求的主要目标,适当忽略微观层面上的精确度,容许一定程度的错误与混杂。

(3)从因果思维转向相关思维。在大数据时代,人们可以通过大数据技术挖掘出事物之间隐蔽的相关关系,获得更多的认知与洞见。

11. 简述大数据的价值。

(1)对大量消费者提供产品或服务的企业可以利用大数据进行精准营销;做小而美模式的中小微企业可以利用大数据做服务转型。

(2)在投资者眼里,大数据是资产。

(3)通过“加工处理”可以实现大数据的“增值”。

12. 数据化管理的四个层次是什么?

(1)业务指导管理。

业务指导管理的范畴包括销售、人力资源、生产、财务、客服等业务单元。通过数据收集、数据监控、数据追踪等手段透视业务,通过数据分析、数据挖掘等方式搭建业务管理模型来提升业务。主要管理模块有目标及预测管理、利润及费用管理等。

(2)营运分析管理。

简单来讲,营运分析管理是对人、货、场、财的分析管理。包括绩效考核管理、库存分析管理、供应链分析管理、客流分析管理、资金分析管理、客户关系管理(CRM)等。业务指导管理和营运分析管理的区别在于前者侧重于追踪和监控,后者侧重于分析和管理。

(3)经营策略管理。

经营策略管理指通过对各经营环节进行对应的数据分析来达到制定和修改策略的目的,数据化的策略管理是企业测量合理化的一个保证。包括消费者购买行为分析、会员顾客策略、商品定价策略、品牌定位策略、竞争对手策略管理、资源分配策略等。

(4)战略规划管理。

战略规划管理是通过企业内部和外部数据,制定企业的长远规划的过程。包括宏观经济分析、行业环境分析、经营环境分析、内部资源分析、企业竞争力分析、战略目标规划管理、战略可操作性评估等。

13. 数据化管理的流程有哪些步骤并应该注意哪些事项。

(1)分析需求。分析需求包括收集需求、分析需求、明确需求三个部分。

(2)收集数据。收集数据是根据使用者的需求,通过各种方法来获取相关数据的一个过程。在收集过程中需要不断地问自己,数据来源是否可靠?收集数据的方法是否有瑕疵?收集的数据是否有缺失?

(3)整理数据。整理数据是对收集到的数据进行预处理。使之变成可供进一步分析的标准格式的过程。

(4)分析数据。分析数据是指在业务逻辑的基础上,运用最简单有效的分析方法和最