当前位置:文档之家› 矢量及栅格数据分析实验报告

矢量及栅格数据分析实验报告

矢量及栅格数据分析实验报告
矢量及栅格数据分析实验报告

. ... .

.

信息工程学院资源环境学院《GIS原理》实验报告

实验名称矢量及栅格数据分析

实验时间2015.4.22

实验地点资环楼229

姓名

学号

班级遥感科学与技术131

《GIS原理》实验报告

一、实验目的及要求

1)掌握矢量数据插值分析、栅格数据重分类、叠加分析的基本原理;

2)熟悉ArcGis 中离散点数据插值分析的基本方法;

3)熟悉ArcGis 中栅格数据重分类、栅格计算器的基本操作;

4)熟悉ArcGis 中栅格数据分区统计的基本方法;

5)了解ArcGis 中缓冲区分析、按掩膜提取的基本方法。

二、实验设备及软件平台

ArcCatalog 10、ArcMap 10.2

三、实验原理

1)数据插值分析

2)栅格数据重分类原理

3)叠加分析的基本原理

四、实验容与步骤

1 空间插值分析

1)打开ArcMap中,将数据框更名为“任务1”,加入省边界图层。

.

. 2)将2011 年02 月27 日08 时观测资料.xls、2011 年02 月27日14

时.xls 通过Add Xy Data 功能,生成点图层。导出数据,分别命名为Obs2708.shp 和Obs2714.shp。

3)对Obs2708.shp 中的属性“温度”在四川围进行插值分析。可以通过“Arctoolbox->Spatial Analyst(空间分析)工具中的Interpolate to Raster(插值)工具选择。(本实验采用反距离权重法IDW),点插值成栅格表面。

4)通过属性中的符号系统,修改显示样式。.

.

. 2 多栅格局域运算

1)启动ArcMap,添加数据框,并更名为“任务2”,将温度栅格数据

IDW2708、IDW2714 加入。

2)确认是否选择扩展模块的许可。“自定义菜单(Customize)”中的“扩展模块Extensions”功能对话框中的Spatial Analyst 均已打钩。

3 )在ArcToolbox 中选择“Spatial Analyst 工具”中的“地图代数Map algebra”下的“栅格计算器Raster Caculator”。在栅格计算器的表达式框中输入如下表达式:("idw2708" + "idw2714" ) / 2表示计算结果中栅格的值是IDW2708、IDW271

4 对应栅格的值的平均值。输出栅格命名为IDW27。

.

. 3 分区运算

1)在ArcMap中插入数据帧,并命名为“任务3”,并把上一个任务的输出

结果IDW27 和省地州界图层添加到任务 3 中。

2)从ArcToolbox 中“Spatial Analyst 工具”的“区域分析”选择“以表格显示分区统计Zonal Statistics”。分区区域输入为地州界,区域字段(转栅格属性值)为Name(地州界图层中的属性),赋值格栅为IDW27。

数据分析实验报告

《数据分析》实验报告 班级: 07信计0班 学号: 姓名: 实验日期 2010-3-11 实验地点: 实 验楼505 实验名称: 样本数据的特征分析 使用软件名称:MATLAB 1. 熟练掌握利用Matlab 软件计算均值、方差、协方差、相关系数、标准差 与变异系数、偏度与峰度,中位数、分位数、三均值、四分位极差与极差; 2. 熟练掌握jbtest 与lillietest 关于一元数据的正态性检验; 3. 掌握统计作图方法; 4. 掌握多元数据的数字特征与相关矩阵的处理方法; 安徽省1990-2004年万元工业GDP 废气排放量、废水排放量、固体废物排放 量以及用于污染治理的投入经费比重见表 6.1.1,解决以下问题: 表6.1.1 实 验 目 的

1. 计算各指标的均值、方差、标准差、变异系数以及相关系数矩阵; 2. 计算各指标的偏度、峰度、三均值以及极差; 3?做出各指标数据直方图并检验该数据是否服从正态分布?若不服从正态分布,利用boxcox变换以后给出该数据的密度函数; 4.上网查找1990-2004江苏省万元工业GDR废气排放量,安徽省与江苏省是否 服从同样的分布?

程序如下: clear;clc format ba nk %保留两位小数 %%%%%%%%%%%安徽省%数据%%%%%%%%%%%%%%%%%% A=[104254.40 519.48 441.65 0.18 94415.00 476.97 398.19 0.26 89317.41 119.45 332.14 0.23 63012.42 67.93 203.91 0.20 45435.04 7.86 128.20 0.17 46383.42 12.45 113.39 0.22 39874.19 13.24 87.12 0.15 38412.85 37.97 76.98 0.21 35270.79 45.36 59.68 0.11 35200.76 34.93 60.82 0.15 35848.97 1.82 57.35 0.19 40348.43 1.17 53.06 0.11 40392.96 0.16 50.96 0.12 37237.13 0.05 43.94 0.15 34176.27 0.06 36.90 0.13]; %计算各指标的均值、方差、标准差、变异系数、偏度、峰度以及极差 A1=[mea n(A);var(A);std(A);std(A)./mea n(A);skew ness(A,0);kurtosis(A,0)-3;ra nge( A)] %E均值 A2=[1/4 1/2 1/4]*prctile(A,[25 50 75]) % 十算各指标的相关系数矩阵 A3=corrcoef(A) %做岀各指标数据直方图 subplot(221),histfit(A(:,1),8) subplot(222),histfit(A(:,2),8) subplot(223),histfit(A(:,3),8) subplot(224),histfit(A(:,4),7) %检验该数据是否服从正态分布 for i=1:4 [h(i),p(i),lstat(i),cv(i)]=lillietest(A(:,i),0.05); end h,p %十算岀前二列不服从正态分布,利用boxcox变换以后给岀该数据的密度函数[t1,l1]=boxcox(A(:,1)) [t2,l2]=boxcox(A(:,2)) [t3,I3]=boxcox(A(:,3))

数据分析实验报告

数据分析实验报告 文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-

第一次试验报告 习题1.3 1建立数据集,定义变量并输入数据并保存。 2数据的描述,包括求均值、方差、中位数等统计量。 分析—描述统计—频率,选择如下: 输出: 统计量 全国居民 农村居民 城镇居民 N 有效 22 22 22 缺失 均值 1116.82 747.86 2336.41 中值 727.50 530.50 1499.50 方差 1031026.918 399673.838 4536136.444 百分位数 25 304.25 239.75 596.25 50 727.50 530.50 1499.50 75 1893.50 1197.00 4136.75 3画直方图,茎叶图,QQ 图。(全国居民) 分析—描述统计—探索,选择如下: 输出: 全国居民 Stem-and-Leaf Plot Frequency Stem & Leaf 5.00 0 . 56788 数据分析实验报告 【最新资料,WORD 文档,可编辑修改】

2.00 1 . 03 1.00 1 . 7 1.00 2 . 3 3.00 2 . 689 1.00 3 . 1 Stem width: 1000 Each leaf: 1 case(s) 分析—描述统计—QQ图,选择如下: 输出: 习题1.1 4数据正态性的检验:K—S检验,W检验数据: 取显着性水平为0.05 分析—描述统计—探索,选择如下:(1)K—S检验

结果:p=0.735 大于0.05 接受原假设,即数据来自正太总体。 (2 )W 检验 结果:在Shapiro-Wilk 检验结果972.00 w ,p=0.174大于0.05 接受原假设,即数据来自正太总体。 习题1.5 5 多维正态数据的统计量 数据:

数据分析实验报告册

《数据分析》 实验报告册 20 15 - 20 16 学年第一学期 班级: 学号: 姓名: 授课教师:实验教师:

目录 实验一网上书店的数据库创建及其查询 实验1-1 “响当当”网上书店的数据库创建 实验1-2 “响当当”网上书店库存、图书和会员信息查询 实验1-3 “响当当”网上书店会员分布和图书销售查询 实验二企业销售数据的分类汇总分析 实验2-1 Northwind公司客户特征分析 实验2-2 “北风”贸易公司销售业绩观测板 实验三餐饮公司经营数据时间序列预测 实验3-1 “美食佳”公司半成品年销售量预测 实验3-2 “美食佳”公司月管理费预测 实验3-3 “美食佳”华东分公司销售额趋势预测 实验3-4 “美食佳”公司会员卡发行量趋势预测 实验3-5 “美食佳”火锅连锁店原料年度采购成本预测 实验四住房建筑许可证数量的回归分析 实验4-1 “家家有房”公司建筑许可证一元线性回归分析实验4-2 “家家有房”公司建筑许可证一元非线性回归分析实验4-3 “家家有房”公司建筑许可证多元线性回归分析实验4-4 “家家有房”公司建筑许可证多元非线性回归分析 实验五手机用户消费习惯聚类分析 实验六新产品价格敏感度测试模型分析

实验一网上书店的数据库创建及其查询实验1-1 “响当当”网上书店的数据库创建 实验类型:验证性实验学时:2 实验目的: ?理解数据库的概念; ?理解关系(二维表)的概念以及关系数据库中数据的组织方式; ?了解数据库创建方法。 实验步骤: 这个实验我们没有直接做,只是了解了一下数据库的概念。 实验1-2 “响当当”网上书店库存、图书和会员信息查询 实验目的 ?理解odbc的概念; ?掌握利用microsoft query进行数据查询的方法。 实验步骤: 1..建立odbc数据源:启动microsoft office query应用程序,在microsoft office query应用程序窗口中,执行“文件/新建”命令,出现“选择数据源”对话框,单击“确定”按钮,出现“创建新数据源”对话框,按照要求做相应的操作。 选择数据源对话框创建新数据源窗口 做图上所示的选择odbc microsoft access安装对话框

GIS矢量数据和栅格数据知识点

栅格数据和矢量数据 矢量数据 定义: ?矢量数据结构通过记录空间对象的坐标及空间关系来表达空间对象的位置。 ?点:空间的一个坐标点; ?线:多个点组成的弧段; ?面:多个弧段组成的封闭多边形; 获取方法 ?定位设备(全站仪、GPS、常规测量等) ?地图数字化 ?间接获取 ●栅格数据转换 ●空间分析(叠置、缓冲等操作产生的新的矢量数据) 矢量数据表达考虑内容 ?矢量数据自身的存储和管理 ?几何数据和属性数据的联系 ?空间对象的空间关系(拓扑关系) 矢量数据表达 ?简单数据结构 ?拓扑数据结构 ?属性数据组织 矢量数据结构编码方式 实体式 索引式 双重独立式 链状独立 栅格数据 定义 以规则像元阵列表示空间对象的数据结构,阵列中每个数据表示空间对象的属性特征。或者说,栅格数据结构就是像元阵列,每个像元的行列号确定位置,用像元值表示空间对象的类型、等级等特征。 每个栅格单元只能存在一个值。 对于栅格数据结构 ●点:为一个像元 ●线:在一定方向上连接成串的相邻像元集合。 ●面:聚集在一起的相邻像元集合。 获取方式: ●遥感数据 ●图片扫描数据 ●矢量数据转换 ●手工方式 栅格数据坐标系 栅格数据压缩编码方案 栅格数据的分层

栅格数据的组织方法 栅格数据特点 编码方式: 直接编码—无压缩编码 链式编码—便界编码 游程长度编码 块式编码 四叉树编码 矢量数据优点: ?表示地理数据的精度较高 ?严密的数据结构,数据量小 ?完整的描述空间关系 ?图形输出精确美观 ?图形数据和属性数据的恢复、更新、综合都能实现 ?面向目标,不仅能表达属性,而且能方便的记录每个目标的具体属性信息缺点: ?数据结构复杂 ?矢量叠置较为复杂 ?数学模拟比较困难 ?技术复杂,特别是软硬件 栅格数据优点: ?数据结构简单 ?空间数据的叠置和组合方便 ?各类空间分析很易于进行 ?数学模拟方便 缺点: ?图形数据量大 ?用大像元减少数据量时,精度和信息量受损 ?地图输出不美观 ?难以建立网络连接关系 ?投影变换比较费时 ?矢量数据结构是一种常见的图形数据结构,它用一系列有序的x、y坐标对表示地理实体的空间位置。 ?矢量结构的特点:属性隐含,定位明显 ?矢量型数据结构按其是否明确表示各地理实体的空间相互关系可分为实体型和拓扑型两大类。 实体型与拓扑型数据结构比较 ?两者都是目前最常用的数据结构模型 实体型代表软件为MapInfo 拓扑型代表软件为ARC/INFO ?它们各具特色 实体型虽然会产生数据冗余和歧异,但易于编辑。 拓扑型消除了数据的冗余和歧异,但操作复杂,甚至会产生新的数据冗余。

数据分析实验报告

《数据分析》实验报告 班级:07信计0班学号:姓名:实验日期2010-3-11 实验地点:实验楼505 实验名称:样本数据的特征分析使用软件名称:MATLAB 实验目的1.熟练掌握利用Matlab软件计算均值、方差、协方差、相关系数、标准差与变异系数、偏度与峰度,中位数、分位数、三均值、四分位极差与极差; 2.熟练掌握jbtest与lillietest关于一元数据的正态性检验; 3.掌握统计作图方法; 4.掌握多元数据的数字特征与相关矩阵的处理方法; 实验内容安徽省1990-2004年万元工业GDP废气排放量、废水排放量、固体废物排放量以及用于污染治理的投入经费比重见表6.1.1,解决以下问题:表6.1.1废气、废水、固体废物排放量及污染治理的投入经费占GDP比重 年份 万元工业GDP 废气排放量 万元工业GDP 固体物排放量 万元工业GDP废 水排放量 环境污染治理投 资占GDP比重 (立方米)(千克)(吨)(%)1990 104254.40 519.48 441.65 0.18 1991 94415.00 476.97 398.19 0.26 1992 89317.41 119.45 332.14 0.23 1993 63012.42 67.93 203.91 0.20 1994 45435.04 7.86 128.20 0.17 1995 46383.42 12.45 113.39 0.22 1996 39874.19 13.24 87.12 0.15 1997 38412.85 37.97 76.98 0.21 1998 35270.79 45.36 59.68 0.11 1999 35200.76 34.93 60.82 0.15 2000 35848.97 1.82 57.35 0.19 2001 40348.43 1.17 53.06 0.11 2002 40392.96 0.16 50.96 0.12 2003 37237.13 0.05 43.94 0.15 2004 34176.27 0.06 36.90 0.13 1.计算各指标的均值、方差、标准差、变异系数以及相关系数矩阵; 2.计算各指标的偏度、峰度、三均值以及极差; 3.做出各指标数据直方图并检验该数据是否服从正态分布?若不服从正态分布,利用boxcox变换以后给出该数据的密度函数; 4.上网查找1990-2004江苏省万元工业GDP废气排放量,安徽省与江苏省是 否服从同样的分布?

宏观经济实验报告

学生实验报告

注:1.指导教师和学生成绩一栏由指导教师填写,其它栏目内容均由学生填写。 2.“实验项目名称”要与该实验课程教学大纲中的“实验项目”相对应。

附一: 四、实验指南 (一)宏观经济分析的基本方法 1.总量分析法 总量分析法是对影响宏观经济的总量指标进行分析,如GDP,消费额、投资额、银行贷款总额、物价水平等。总量分析主要是一种动态分析,主要研究总量指标的变动规律 2.结构分析法 是指对经济系统中各组成部分及其对比关系变动规律的分析。比如分析第一产业、第二产业、第三产业之间的比例,分析消费与投资的比例关系。结构分析主要是一种静态分析,即对一定时间内经济系统中各组成部分变动规律的分析 3.宏观分析资料的搜集与处理 宏观分析所需的有效资料一般包括政府的重点经济政策与措施、一般生产统计资料、金融物价统计资料、贸易统计资料、每年国民收入统计与景气动向、突发性非经济因素等。 (二)宏观经济分析的主要内容 宏观经济分析主要包括宏观经运行的变动、宏观经济政策、国际金融环境以及对证券市场的

供求关系等几个方面。当然像人口因素、能源因素以及包括政治因素、战争因素、灾害因素都有可能对证券市场产生决定性的影响,但在一般情况下,上述因素的作用机制必须单独分析研究。宏观经济分析的内容重在对宏观经济形势与经济背景作出基本判断,以分析在新兴加转型背景下中国宏观经济对证券市场的的影响,把握证券市场总体变动趋势,掌握宏观经济政策对证券市场的影响力度与方向,判断整个证券市场的投资价值。 1.宏观经济变动对证券市场的影响 宏观经济分析最重要的参考依据要选取官方公开公布的数据,尤其是国家统计局的数据相对最可靠。可借助统计工具与手段,了解证券价格变化与经济运行形势的关联性。 宏观经济分析包含的内容有许多,在此可重点选取几个方面进行分析,比如可以以国民生产总值对证券价格的影响,看看经济持续增长与衰退对证券市场的影响;也可以选取就业状况的变动对证券市场影响分析,就业状况的好坏不仅反映了经济状况,而且对证券市场资金供给的增减变化有密切关系。通过具体因素的分析,掌握宏观经济形势对证券市场的影响方式与影响程度。宏观经济的运行形势对证券市场的影响可见表3-1、3-2、3-3。 表3-1 评价宏观经济形势的基本指标 表3-2 宏观经济运行对证券市场的影响

数据分析实验报告

数据分析实验报告 【最新资料,WORD文档,可编辑修改】 第一次试验报告 习题1.3 1建立数据集,定义变量并输入数据并保存。 2数据的描述,包括求均值、方差、中位数等统计量。 分析—描述统计—频率,选择如下: 输出:

方差1031026.918399673.8384536136.444百分位数25304.25239.75596.25 50727.50530.501499.50 751893.501197.004136.75 3画直方图,茎叶图,QQ图。(全国居民) 分析—描述统计—探索,选择如下: 输出: 全国居民Stem-and-Leaf Plot Frequency Stem & Leaf 9.00 0 . 122223344 5.00 0 . 56788 2.00 1 . 03 1.00 1 . 7 1.00 2 . 3 3.00 2 . 689

1.00 3 . 1 Stem width: 1000 Each leaf: 1 case(s) 分析—描述统计—QQ图,选择如下: 输出: 习题1.1 4数据正态性的检验:K—S检验,W检验数据: 取显着性水平为0.05 分析—描述统计—探索,选择如下:(1)K—S检验 单样本Kolmogorov-Smirnov 检验 身高N60正态参数a,,b均值139.00

标准差7.064 最极端差别绝对值.089 正.045 负-.089 Kolmogorov-Smirnov Z.686 渐近显着性(双侧).735 a. 检验分布为正态分布。 b. 根据数据计算得到。 结果:p=0.735 大于0.05 接受原假设,即数据来自正太总体。(2)W检验

数据分析实验报告

实验一SAS系统的使用 【实验类型】(验证性) 【实验学时】2学时 【实验目的】使学生了解SAS系统,熟练掌握SAS数据集的建立及一些必要的SAS语句。 【实验内容】 1. 启动SAS系统,熟悉各个菜单的内容;在编辑窗口、日志窗口、输出窗口之间切换。 2. 建立数据集 表1 Name Sex Math Chinese English Alice f908591 Tom m958784 Jenny f939083 Mike m808580 Fred m848589 Kate f978382 Alex m929091 Cook m757876 Bennie f827984 Hellen f857484 Wincelet f908287 Butt m778179 Geoge m868582 Tod m898484 Chris f898487 Janet f866587 1)通过编辑程序将表1读入数据集sasuser.score; 2)将下面记事本中的数据读入SAS数据集,变量名为code name scale share

price: 000096 广聚能源8500 0.059 1000 13.27 000099 中信海直6000 0.028 2000 14.2 000150 ST麦科特12600 -0.003 1500 7.12 000151 中成股份10500 0.026 1300 10.08 000153 新力药业2500 0.056 2000 22.75 3)将下面Excel表格中的数据导入SAS数据集work.gnp; name x1 x2 x3 x4 x5 x6 北京190.33 43.77 7.93 60.54 49.01 90.4 天津135.2 36.4 10.47 44.16 36.49 3.94 河北95.21 22.83 9.3 22.44 22.81 2.8 山西104.78 25.11 6.46 9.89 18.17 3.25 内蒙古128.41 27.63 8.94 12.58 23.99 3.27 辽宁145.68 32.83 17.79 27.29 39.09 3.47 吉林159.37 33.38 18.37 11.81 25.29 5.22 黑龙江116.22 29.57 13.24 13.76 21.75 6.04 上海221.11 38.64 12.53 115.65 50.82 5.89 江苏144.98 29.12 11.67 42.6 27.3 5.74 浙江169.92 32.75 21.72 47.12 34.35 5 安徽153.11 23.09 15.62 23.54 18.18 6.39 福建144.92 21.26 16.96 19.52 21.75 6.73 江西140.54 21.59 17.64 19.19 15.97 4.94 山东115.84 30.76 12.2 33.1 33.77 3.85 河南101.18 23.26 8.46 20.2 20.5 4.3 湖北140.64 28.26 12.35 18.53 20.95 6.23 湖南164.02 24.74 13.63 22.2 18.06 6.04 广东182.55 20.52 18.32 42.4 36.97 11.68 广西139.08 18.47 14.68 13.41 20.66 3.85 四川137.8 20.74 11.07 17.74 16.49 4.39 贵州121.67 21.53 12.58 14.49 12.18 4.57 云南124.27 19.81 8.89 14.22 15.53 3.03 陕西106.02 20.56 10.94 10.11 18 3.29 甘肃95.65 16.82 5.7 6.03 12.36 4.49 青海107.12 16.45 8.98 5.4 8.78 5.93 宁夏113.74 24.11 6.46 9.61 22.92 2.53

矢量、栅格数据结构的优缺点

§2.4 矢量栅格一体化数据结构 一、矢量、栅格数据结构的优缺点 矢量数据结构可具体分为点、线、面,可以构成现实世界中各种复杂的实体,当问题可描述成线或边界时,特别有效。矢量数据的结构紧凑,冗余度低,并具有空间实体的拓扑信息,容易定义和操作单个空间实体,便于网络分析。矢量数据的输出质量好、精度高。 矢量数据结构的复杂性,导致了操作和算法的复杂化,作为一种基于线和边界的编码方法,不能有效地支持影像代数运算,如不能有效地进行点集的集合运算(如叠加),运算效率低而复杂。由于矢量数据结构的存贮比较复杂,导致空间实体的查询十分费时,需要逐点、逐线、逐面地查询。矢量数据和栅格表示的影像数据不能直接运算(如联合查询和空间分析),交互时必须进行矢量和栅格转换。矢量数据与DEM(数字高程模型)的交互是通过等高线来实现的,不能与DEM 直接进行联合空间分析。 栅格数据结构是通过空间点的密集而规则的排列表示整体的空间现象的。其数据结构简单,定位存取性能好,可以与影像和DEM数据进行联合空间分析,数据共享容易实现,对栅格数据的操作比较容易。 栅格数据的数据量与格网间距的平方成反比,较高的几何精度的代价是数据量的极大增加。因为只使用行和列来作为空间实体的位置标识,故难以获取空间实体的拓扑信息,难以进行网络分析等操作。栅格数据结构不是面向实体的,各种实体往往是叠加在一起反映出来的,因而难以识别和分离。对点实体的识别需

要采用匹配技术,对线实体的识别需采用边缘检测技术,对面实体的识别则需采用影像分类技术,这些技术不仅费时,而且不能保证完全正确。 通过以上的分析可以看出,矢量数据结构和栅格数据结构的优缺点是互补的(图2-4-1),为了有效地实现GIS中的各项功能(如与遥感数据的结合,有效的空间分析等)需要同时使用两种数据结构,并在GIS中实现两种数据结构的高效转换。 在GIS建立过程中,应根据应用目的和应用特点、可能获得的数据精度以及地理信息系统软件和硬件配置情况,选择合适的数据结构。一般来讲,栅格结构可用于大范围小比例尺的自然资源、环境、农林业等区域问题的研究。矢量结构用于城市分区或详细规划、土地管理、公用事业管理等方面的应用。 完

数据分析与挖掘实验报告

数据分析与挖掘实验报告

《数据挖掘》实验报告 目录 1.关联规则的基本概念和方法 (1) 1.1数据挖掘 (1) 1.1.1数据挖掘的概念 (1) 1.1.2数据挖掘的方法与技术 (2) 1.2关联规则 (5) 1.2.1关联规则的概念 (5) 1.2.2关联规则的实现——Apriori算法 (7) 2.用Matlab实现关联规则 (12) 2.1Matlab概述 (12) 2.2基于Matlab的Apriori算法 (13) 3.用java实现关联规则 (19) 3.1java界面描述 (19) 3.2java关键代码描述 (23) 4、实验总结 (29) 4.1实验的不足和改进 (29) 4.2实验心得 (30)

1.关联规则的基本概念和方法 1.1数据挖掘 1.1.1数据挖掘的概念 计算机技术和通信技术的迅猛发展将人类社会带入到了信息时代。在最近十几年里,数据库中存储的数据急剧增大。数据挖掘就是信息技术自然进化的结果。数据挖掘可以从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的,人们事先不知道的但又是潜在有用的信息和知识的过程。 许多人将数据挖掘视为另一个流行词汇数据中的知识发现(KDD)的同义词,而另一些人只是把数据挖掘视为知识发现过程的一个基本步骤。知识发现过程如下: ·数据清理(消除噪声和删除不一致的数据)·数据集成(多种数据源可以组合在一起)·数据转换(从数据库中提取和分析任务相关的数据) ·数据变换(从汇总或聚集操作,把数据变换和统一成适合挖掘的形式) ·数据挖掘(基本步骤,使用智能方法提取数

据模式) ·模式评估(根据某种兴趣度度量,识别代表知识的真正有趣的模式) ·知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)。 1.1.2数据挖掘的方法与技术 数据挖掘吸纳了诸如数据库和数据仓库技术、统计学、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索、图像和信号处理以及空间数据分析技术的集成等许多应用领域的大量技术。数据挖掘主要包括以下方法。神经网络方法:神经网络由于本身良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性非常适合解决数据挖掘的问题,因此近年来越来越受到人们的关注。典型的神经网络模型主要分3大类:以感知机、bp反向传播模型、函数型网络为代表的,用于分类、预测和模式识别的前馈式神经网络模型;以hopfield 的离散模型和连续模型为代表的,分别用于联想记忆和优化计算的反馈式神经网络模型;以art 模型、koholon模型为代表的,用于聚类的自组

经济数据分析实验报告

(此文档为word格式,下载后您可任意编辑修改!) 实验报告格式: 商学院经济与管理实验教学中心 实验报告 实验名称经济数据分析综合实验 班级学号姓名 同组学生姓名实验时间:7-18周 得分:批改时间:2014年01月03日实验教师(签名):孙小红评语: 实验一:数据文件的建立 一、实验目的 1、理解并掌握数据类型的概念。 2、掌握一份具体问卷转化为数据文件。 3、掌握正确设置变量及属性,区分处理主观题与客观题、单选题、多选题及表格式题目 的不同之处。 4、掌握带标签值数据的录入。 二、实验内容 见《实验手册》。 三、实验步骤 本次试验的内容是“数据文件的建立”。以下介绍两种不同的数据文件建立方法。 第一种输入变量和数据建立数据文件,以“温州企业基本情况”数据文件为例 1、双击打开SPSS 17.0软件,在弹出的对话框中选择“输入数据” 2、切换到“变量视图”,单击“名称”下的空格,输入“ID”,单击“类型”下的空格,选 择“数值,宽度为2,小数为0”,单击“标签”下的空格,输入“问卷编号”,其他各列选择默认值 3、同步骤2,在“名称”下输入“企业名称”,在“类型”下选择“字符串,宽度为30,

小数为0”,其余默认。 4、在“名称”下输入“企业性质”,在“类型”下选择“数值,宽度为1,小数为0”。单击“值”,弹出“值标签”对话框,在“值”栏输入“1”,在“标签”输入“国有及国有控股企业”,选择“添加”,同理输入其他的选项,接着按“确定”,其余默认。 5、按照步骤4,输入“企业经营情况”和“所属行业” 6、切换到“数据视图”,在各个变量下输入数据 7、选择“文件”菜单,下拉,按“保存” 第二种导入EXCEL文件建立数据文件,以“学生”数据文件为例 1、双击打开SPSS.17.0 2、选择“文件”菜单,下拉,选择“打开---数据”,在弹出的对话框中,在“文件类型”下拉,选择“EXCEL”,然后再选择“查找范围”,选中所要导入的EXCEL“学生”文件。 3、切换到“变量视图”,在“gender”变量的“值”栏,单击添加“1=男生,2=女生”,点击“确认”。 4、选择“文件”菜单,下拉,按“另存为”,存在D盘 四、实验结果与分析 1 企业基本情况 2 态度与认识 3 资金投入、人力资源和企业文化

光电效应实验报告数据处理 误差分析

表1-1:不同频率下的遏止电压表 λ(nm)365 404.7 435.8 546.1 577 v(10^14)8.219 7.413 6.884 5.493 5.199 |Ua|(v) 1.727 1.357 1.129 0.544 0.418 表1-2:λ=365(nm)时不同电压下对应的电流值 U/(v)-1.927 -1.827 -1.727 -1.627 -1.527 -1.427 -1.327 I/(10^-11)A-0.4 -0.2 0 0.9 3.9 8.2 14 -1.227 -1.127 -1.027 -0.927 -0.827 -0.727 -0.718 24.2 38.1 52 66 80 97.2 100 表1-3:λ=404.7(nm)时不同电压下对应的电流值 U/(v) -1.477 -1.417 -1.357 -1.297 -1.237 -1.177 -1.117 I/(10^-11)A -1 -0.4 0 1.8 4.1 10 16.2 -1.057 -0.997 -0.937 -0.877 -0.817 -0.757 -0.737 24.2 36.2 49.8 63.9 80 93.9 100 表1-4:λ=435.8(nm)时不同电压下对应的电流值 U/(v)-1.229 -1.179 -1.129 -1.079 -1.029 -0.979 -0.929 I/(10^-11)A-1.8 -0.4 0 2 4.2 10.2 17.9 -0.879 -0.829 -0.779 -0.729 -0.679 -0.629 -0.579 -0.575 24.8 36 47 59 71.6 83.8 98 100 表1-5:λ=546.1(nm)时不同电压下对应的电流值 U/(v)-0.604 -0.574 -0.544 -0.514 -0.484 -0.454 -0.424 I/(10^-11)A-4 -2 0 3.8 10 16.2 24 -0.394 -0.364 -0.334 -0.304 -0.274 -0.244 -0.242 34 46 56.2 72 84.2 98.2 100 表1-6:λ=577(nm)时不同电压下对应的电流值 U/(v)-0.478 -0.448 -0.418 -0.388 -0.358 -0.328 -0.298 I/(10^-11)A-3.1 -1.8 0 2 6 10.2 16.1 -0.268 -0.238 -0.208 -0.178 -0.148 -0.118 -0.088 -0.058 22.1 31.8 39.8 49 58 68.2 79.8 90.1 -0.04 100

数值分析实验报告册

实验名称:Lagrange插值(实验一) 实验目的: 掌握Lagrange插值数值算法,能够根据给定的函数值表达求出插值多项式和函数在某一点的近似值。实验准备: 1.在开始本实验之前,请回顾教科书的相关内容; 2.需要一台准备安装Windows XP Professional操作系统和装有数学软件的计算机。 实验内容及要求 已知数据如下: 要求: 试用Lagrange插值多项式求0.5626,0.5635,0.5645 x 时的函数近似值. 实验过程: 编写Matlab函数M文件Lagrange如下: function yy=lagrange(x,y,xi) m=length(x); n=length(y); if m~=n,error('向量x与y的长度必须一致');end for k=1:length(xi) s=0; for i=1:m z=1; for j=1:n if j~=i z=z*(xi(k)-x(j))/(x(i)-x(j)); end end s=s+z*y(i); end yy=s end 在命令窗口调用函数M文件lagrange,输出结果如下: >>x=[0.56160, 0.56280, 0.56401, 0.56521]; >>y=[0.82741, 0.82659, 0.82577, 0.82495]; >>xi=[0.5626, 0.5635, 0.5645]; >>yi= lagrange (x,y,xi)

yi= 0.8628 0.8261 0.8254 实验总结(由学生填写): 教师对本次实验的评价(下面的表格由教师填写): 实验名称:曲线拟合的最小二乘方法(实验二) 实验目的: 掌握最小二乘方法,并能根据给定数据求其最小二乘一次或二次多项式,然后进行曲线拟合。实验准备: 1.在开始本实验之前,请回顾教科书的相关内容;

矢量数据与栅格数据

矢量数据与栅格数据 1.矢量数据 矢量数据主要是指城市大比例尺地形图。此系统中图层主要分为底图层、道路层、单位 层,合理的分层便于进行叠加分析、图形的无逢拼接以实现系统图形的大范围漫游。矢量数据一般通过记录坐标的方式来尽可能将地理实体的空间位置表现的准确无误,显示的图形一般分为矢量图和位图。 矢量数据是计算机中以矢量结构存贮的内部数据。是跟踪式数字化仪的直接产物。在矢量数据结构中,点数据可直接用坐标值描述;线数据可用均匀或不均匀间隔的顺序坐标链来描述;面状数据(或多边形数据)可用边界线来描述。矢量数据的组织形式较为复杂,以弧段为基本逻辑单元,而每一弧段以两个或两个以上相交结点所限制,并为两个相邻多边形属性所描述。在计算机中,使用矢量数据具有存储量小,数据项之间拓扑关系可从点坐标链中提取某些特征而获得的优点。主要缺点是数据编辑、更新和处理软件较复杂。 2..栅格数据 栅格数据是按网格单元的行与列排列、具有不同灰度或颜色的阵列数据。每一个单元(象素)的位置由它的行列号定义,所表示的实体位置隐含在栅格行列位置中,数据组织中的每个数据表示地物或现象的非几何属性或指向其属性的指针。一个优秀的压缩数据编码方案 是:在最大限度减少计算机运算时间的基点上进行最大幅度的压缩。 栅格数据是按网格单元的行与列排列、具有不同灰度或颜色的阵列数据。栅格结构是大小相等分布均匀、紧密相连的像元(网格单元)阵列来表示空间地物或现象分布的数据组织。是最简单、最直观的空间数据结构,它将地球表面划分为大小、均匀、紧密相邻的网格阵列。每一个单元(象素)的位置由它的行列号定义,所表示的实体位置隐含在栅格行列位置中,数据组织中的每个数据表示地物或现象的非几何属性或指向其属性的指针。对于栅格结构:点实体由一个栅格像元来表示;线实体由一定方向上连接成串的相邻栅格像元表示;面实体(区域)由具有相同属性的相邻栅格像元的块集合来表示。

spss相关分析实验报告

实验五相关分析实验报关费 一、实验目的: 学习利用spss对数据进行相关分析(积差相关、肯德尔等级相关)、偏相关分析。利用交叉表进行相关分析。 二、实验内容: 某班学生成绩表1如实验图表所示。 1.对该班物理成绩与数学成绩之间进行积差相关分析和肯德尔等级相关 分析。 2.在控制物理成绩不变的条件下,做数学成绩与英语成绩的相关分析(这 种情况下的相关分析称为偏相关分析)。 3.对该班物理成绩与数学成绩制作交叉表及进行其中的相关分析。 三、实验步骤: 1.选择分析→相关→双变量,弹出窗口,在对话框的变量列表中选变量 “数学成绩”、“物理成绩”,在相关系数列进行选择,本次实验选择 皮尔逊相关(积差相关)和肯德尔等级相关。单击选项,对描述统计 量进行选择,选择标准差和均值。单击确定,得出输出结果,对结果 进行分析解释。 2.选择分析→相关→偏相关,弹出窗口,在对话框的变量列表选变量“数 学成绩”、“英语成绩”,在控制列表选择要控制的变量“物理成绩” 以在控制物理成绩的影响下对变量数学成绩与英语成绩进行偏相关分 析;在“显著性检验”框中选双侧检验,单击确定,得出输出结果, 对结果进行分析解释。 3.选择分析→描述统计→交叉表,弹出窗口,对交叉表的行和列进行选 择,行选择为数学成绩,列选择为物理成绩。然后对统计量进行设置, 选择相关性,点击继续→确定,得出输出结果,对结果进行分析解释。 四、实验结果与分析:

表1

五、实验结果及其分析:

分析一:由实验结果可观察出,数学成绩与物理成绩的积差相关系数r=,肯德尔等级相关系数r=可知该班物理成绩和数学成绩之间存在显著相关。

矢量数据的获取与处理

第3章矢量数据与栅格数据的获取及处理 导读:GIS项目中费用最大的部分是数据库建设,即基础地理信息的获取与处理,这其中就包括矢量数据和栅格数据的获取与处理,例如遥感影像数据现已作为地理信息系统的重要数据来源。本章分别介绍了矢量数据的获取与处理以及栅格数据的获取与处理,以及他们的应用。并在最后一节介绍了矢栅一体化数据结构的基本概念。 3.1矢量数据的获取与处理方法 3.1.1矢量数据的概念 矢量数据(Vector Data)即在直角坐标系中,用X、Y坐标表示地图图形或地理实体的位置的数据。矢量数据一般通过记录坐标的方式来尽可能将地理实体的空间位置表现的准确无误。 在计算机地图制图中,各地图图形元素在二维平面上的矢量数据表示为:点——用一对(x,y)坐标表示; 线——用一串有序的(x,y)坐标对表示; 面——用一串有序的但首尾坐标相同的(x,y)坐标对表示其轮廓范围。 地图数据与其他大多数由计算机处理的科学数据是极其不同的。大部分地图数据都是反映制图现象的地理分布,故具有定位的性质,也称这类地图数据为空间数据(或几何数据)。空间数据可反映点、线和面状物体的定位特性。还有一部分地图数据是用来描述制图现象的质量和数量特征,如哪是河流,哪是道路,哪是居民点以及它们的名称和其他有关的特征描述等,这类数据通常称之为属性数据。任何地图数据都有时间性,即现势性,这是显而易见的。 3.1.2几何数据的获取 几何数据是根据给定各要素相对位置或绝对位置的坐标来描述的。其获取的方法主要有:

1)由外业测量获得,如数字测图。野外实地测量等获取的数据可转换后直接进入GIS的地理数据库,以便于进行实时的分析和进一步的应用。GPS所获取的数据也是GIS的重要数据源。 2)由栅格形式的空间数据转换获得。栅格数据结构向矢量数据结构的转换又称为矢量化。如卫星测地、扫描数字化仪扫描、航摄像片等。可以用此类数据转化为矢量数据。 基于图像数据的矢量化方法: ①二值化:线画图形扫描后产生图像栅格数据,这些数据是按0~255的不同灰度值量度的,将这种256级不同的灰度压缩到2个灰度形成二值图,即0和1两级灰度图。 ②细化:细化是消除线画横断面栅格数的差异,使得每一条线只保留代表其轴线或周围轮廓线位置的单个栅格的宽度。对于栅格线画的细化方法,可分为“剥皮法”和“骨架法”。 ③跟踪:跟踪的目的是将细化处理后的栅格数据转化为从节点出发的线段或闭合的线条,并以矢量形式存储线段的坐标。跟踪时,从起始点开始,根据八个邻域进行搜索下一个相邻点的位置,记录坐标,直到完成全部栅格数据的矢量化。 3)对现有地图跟踪数字化获得,将现有的地图图形离散化为数据。 跟踪数字化是目前应用最广泛的一种地图数字化方式,是通过记录数字化板上点的平面坐标来获取矢量数据的。其基本过程是:将需数字化的图件(地图、航片等)固定在数字化板上,然后设定数字化范围、输入有关参数、设置特征码清单、选择数字化方式(点方式和流方式等),就可以按地图要素的类别分别实施图形数字化了。 由于跟踪数字化本身几乎不需要GIS的其它计算功能,所以跟踪数字化软件往往可以与整个GIS系统脱离开,因而可单独使用。

GIS矢量数据分析与栅格数据分析实验完整版

G I S矢量数据分析与栅 格数据分析实验 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

本科学生实验报告 姓名尹永义学号 专业地理科学班级 2014B _ 实验课程名称地理信息系统概论(实验) 实验名称矢量数据分析与栅格数据分析 指导教师及职称速绍华(讲师) 开课学期 2014 _至_ 2015_学年_下学期云南师范大学旅游与地理科学学院编印

3、实验理论依据或知识背景: 矢量数据分析矢量数据以点、线和面空间要素为输入数据。 分析结果的准确性取决于空间特征的位置及形状的准确性。 拓扑关系是一些矢量数据分析(如建立缓冲区和叠置分析)的一个因素。 基于邻近(Proximity)概念,建立缓冲区可把地图分为两个区域:一个区域位于所选地图要素的指定距离之内,另一个区域在指定距离之外。 在指定距离之内的区域称为缓冲区。 围绕点建立缓冲区产生圆形缓冲区。围绕线建立缓冲区形成一系列围绕每条线段的长条形缓冲带。围绕多边形建立缓冲区则生成由该多边形边 界向外延伸的缓冲区。 对线要素建立缓冲区未必在线两侧都有缓冲区,可以只在线的左侧或右 侧建立缓冲区。 缓冲距离(又叫缓冲大小)未必为常数,可以根据给定字段取值而变 化。 缓冲区边界也可以被融合掉,使得缓冲区之间没有叠置区。 地图叠置操作是将两个要素图层的几何形状和属性组合在一起,生成新 的输出图层。 输出图层的几何形状代表来自各输入图层的要素的几何交集。 输出图层的每个要素包含所有输入图层的属性组合,而这种组合不同于 其邻域。 所有叠置方法都是基于布尔连接符的运算,即AND、OR 和 XOR。 若使用 AND 连接符,则此叠置操作为求交(Intersect)。 若使用 OR 连接符,则此叠置操作称为联合(Union)。 若使用 XOR 连接符,则此叠置操作称为对称差异(Symmetrical Difference)或差异(Difference)。 若使用以下表达式 [(Input Layer)AND(Identity Layer)] OR (Input Layer),则该叠置操作称为识别(Identity)或减去 (Minus)。 模式分析是关于二维空间点要素空间分配的研究。 在整体水平上,模式分析可以揭示某分布模式是随机、离散还是集聚 的。 在局部水平上,模式分析可以检测出分布模式中是否含有高值或低值的局部集聚。 模式分析包括点模式分析、量测空间自相关的莫兰指数(Moran’s I)和量测高/低聚集度的G 统计量。 栅格数据分析 栅格数据分析是基于栅格像元和栅格的。 栅格数据分析能在独立像元、像元组或整个栅格全部像元的不同层次上进行。 一些栅格数据运算使用单一栅格,而另一些则使用两个或更多栅格数 据。

统计分析实验报告

统计分析综合实验报告 学院: 专业: 姓名: 学号:

统计分析综合实验考题 一.样本数据特征分析: 要求收集国家统计局2011年全国人口普查与2000年全国人口普查相关数据,进行二者的比较,然后写出有说明解释的数据统计分析报告,具体要求如下: 1.报告必须包含所收集的公开数据表,至少包括总人口,流动人口,城乡、性别、年龄、民族构成,教育程度,家庭户人口八大指标; 2.报告中必须有针对某些指标的条形图,饼图,直方图,茎叶图以及累计频率条形图;(注:不同图形针对不同的指标)3.采用适当方式检验二次调查得到的人口年龄比例以及教育程度这两个指标是否有显著不同,写明检验过程及结论。 4.报告文字通顺,通过数据说明问题,重点突出。 二.线性回归模型分析: 自选某个实际问题通过建立线性回归模型进行研究,要求: 1.自行搜集问题所需的相关数据并且建立线性回归模型; 2.通过SPSS软件进行回归系数的计算和模型检验; 3.如果回归模型通过检验,对回归系数以及模型的意义进行 解释并且作出散点图

一、样本数据特征分析 2010年全国人口普查与2000年全国人口普查相关数据分析报告 2011年第六次全国人口普查数据显示,总人口数为1370536875,比2000年的第五次人口普查的1265825048人次,总人口数增加73899804人,增长5.84%,平均年增长率为0.57%。

做茎叶图分析: 描述 年份统计量标准误 人口数量2000年均值40084265.35 4698126.750 均值的 95% 置信区间 下限30489410.50 上限49679120.21 5% 修整均值39305445.50 中值35365072.00 方差 68424424372574 4.400 标准差26158062.691 极小值2616329

相关主题
文本预览
相关文档 最新文档