数据描述性分析解读

  • 格式:pptx
  • 大小:1.54 MB
  • 文档页数:156

下载文档原格式

  / 156
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(xi
x)2
其量纲是数据量纲的平方。 标准差
s
s2
1 n 1
n i 1
(xi
x)2
均值、方差等数字特征
Hale Waihona Puke Baidu
变异系数:刻画数据相对分散性的度量
CV=100 s (%)
校正平方和
x
n
CSS= (xi x)2 i 1
未校平方和
n
USS =
x
2 i
i 1
均值、方差等数字特征
3 偏度与峰度
偏度与峰度是刻画数据的偏态、尾重程度的度量。 它们与数据的矩有关。数据的矩分为原点矩与中心矩。
第一章 数据描述性分析
数据分析的基本内容
数据描述性分析 非参数方法 回归分析 主成分分析 判别分析 聚类分析 时间序列分析 Bayes统计分析
SAS软件介绍-Colin
随着信息技术的迅速发展-特别是数据仓库技术的 广泛应用,企业拥有的数据量急剧呈几何级数增 大,在这大量的数据信息中,隐藏着企业运作的 利弊得失,若能够对这种海量的数据与信息进行 快速有效地深入分析和处理,就能从中找出规律 和模式,获取企业决策所需知识,帮助企业进行 迅速有效的运筹决策。
x1, x2 , , xn ,
其中n 称为样本容量。
1 均值:即是 x1, x2 , , xn的, 平均数:
x
1 n
n i 1
xi
均值表示数据的集中位置。(matlab mean函数)
均值、方差等数字特征
2 方差、标准差与变异系数 方差是描述数据取值分散性的一个度量,
s 2
1 n 1
n i 1
SAS软件
在数据处理与统计分析领域,SAS系统已成为国 际上流行标准企业管理软件。美国《财富》杂志 评选的500家最大公司中的90%以上的企业都在 应用SAS软件。 在北美,SAS广泛地被用于所有的金融公司,医 药研发机构和政府调查和监管部门。特别是在加 拿大的金融中心-多伦多,每年更是需要大量熟练 掌握和运用SAS的科技人员。
输出 窗口,
F7
日志 窗口,
F6
程序 编辑 窗口,
F5
显示管理系统的基本窗口
在程序编辑窗口中,你可以 1 输入、编辑和提交程序语句 2 打开以前储存的程序 3 将程序存入文件
显示管理系统的基本窗口
在日志窗口中,你可以看到你提交的程序执行过 程中系统产生的一些信息 在输出窗口中,你可以浏览当前的SAS程序产生 的输出结果
常用的模块有base,graph,stat,insight,assist, analyst模块等,分别执行基本数据处理、绘图、统计分 析、数据探索、可视化数据处理等功能。
SAS系统的启动和退出
退出 1 选择关闭按钮; 2 执行菜单命令【File】→【Exit...】; 3 在命令框执行BYE或ENDSAS命令
k阶原点矩
vk
1 n
n i 1
xik
K阶中心矩
uk
1 n
( xi
i 1
x)k
s
均值、方差等数字特征
偏度
g1
n (n 1)(n 2)s3
n
( xi
i 1
x)3
n2u3 (n 1)(n 2)s3
其中s是标准差。偏度是刻画数据对称性的指 标。关于均值对称的数据其偏度为0,右侧更分 散的数据偏度为正,左侧更分散的数据偏度为负。
SAS的宗旨是为所有需要进行数据处理、数据分析的非计算机工作人 员提供一种易学易用、完整可靠的软件系统。SAS语言本身是一种非 过程语言(第四代语言),类似于C语言,且综合了各种高级语言的 功能和灵活的格式,将数据处理和统计分析融合于一体。
SAS系统的启动和退出
启动 1 双击桌面图标 2 执行开始菜单中程序菜单项
SAS软件
SAS 是一个庞大的系统,它多个功能模块组 成,每个模块分别完成不同的功能。由于SAS最 初是为专业统计人员设计的(这一点和SPSS已 恰恰相反),因此使用上以编程为主,初学者掌 握较为困难。
SAS软件
SAS公司统计分析的强大优势和完美的数据挖掘产品,可以帮助用户: Customer Segmentation-识别最有利润的客户群,并揭示其中 的特征 Credit Risk Management-通过准确的信用评分提高客户的利润 率 Balanced Scorecard - 企业均衡计分管理 Fraud Detection-欺诈检测 Customer Retention-客户流失管理 Cross Selling-组合销售 以及其他需要预测和规则发现的应用等等
SAS模块
SAS8.2的完整版本包含以下数十个模块。 BASE,GRAPH,ETS,FSP,AF,OR,IML,SHARE, QC,STAT,INSIGHT,ANALYST,ASSIST, CONNECT,CPE,LAB,EIS,WAREHOUSE,PC File Formats,GIS,SPECTRAVIEW, SHARE*NET, R/3,OnlineTutor: SAS Programming,MDDB Server, IT Service Vision Client, IntrNet Compute Services, Enterprise Reporter,MDDB Server common products, Enterprise Miner,AppDev Studio,Integration Technologies等
n
数据描述性分析
数据分析研究的对象是数据,它们是n 个观测值:
x1, x2 , , xn ,
1
如果这 n 个观测值就是所要研究对象的全体,那么数据
分析的任务就是提取数据中包含的有用的信息。如果数
,
据是从总体中抽出的样本,就要分析推断样本中包含的
总体的信息。
均值、方差等数字特征
一元数据的数字特征主要是以下几种。设 n个观测值为
SAS软件介绍-Colin
美国SAS软件研究所(SAS Institute Inc.)创建于1976年。 27年来,SAS软件研究所一直致力于为金融、医药研发、 保险、电信、制造、政府以及科研教育等部门,在SAS的 数据仓库, 统计分析、联机分析处理系统, 数据挖掘, Intranet和各种瘦客户端的核心产品和技术之上,为各种 企业提供客户关系管理、信贷风险分析和管理、企业综合 风险管理、数据仓库、协作式商务智能、企业均衡记分卡 (Balanced Score Card)、电子商务智能、供应关系管理、 财务分析和报告、人力资源管理和其它各种商务智能和决 策支持系统(DSS)的解决方案。