谁说菜鸟不懂数据分析(工具篇)-读书笔记
- 格式:pdf
- 大小:1.10 MB
- 文档页数:18
谁说菜鸟不会数据分析(一)一、数据分析六步曲:1.明确分析目的和内容2.数据收集3.数据处理4.数据分析5.数据展现:能用图说明问题的,就不用表格,能用表格说明问题的,就不用文字。
6.报告撰写几个常用指标或术语:相对数=比较数值(比数)/基础数值(基数)分母是用做对比标准的指标数值,简称基数;分子是用做与基数对比的指标数值,简称比数。
3.百分比与百分点:百分比是相对数中的一种,它表示一个数是另一个数的百分之几,也称百分率或百分数。
百分点是指不同时期以百分数的形式表示的相对指标的变动幅度。
4.频数与频率:频数是指一组数据中个别数据重复出现的次数。
频率是每组类别次数与总次数的比值,它代表某类别在总体中出现的频繁程度,一般采用百分数表示,所有组的频率加总等于100%。
所以频数是绝对数,频率是相对数。
5.比例与比率:比例与比率都属于相对数。
比例是指在总体中各部分的数值占全部数值的比重,通常反映总体的构成和结构。
比率是指不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。
6.倍数与番数:倍数与番数同样属于相对数,但使用时容易混淆。
倍数是一个数除以另一个数所得的商。
需要注意的是,倍数一般是表示数量的增长或上升幅度,而不适用于表示数量的减少或下降。
番数是指原来数量的2的N次方倍。
7.同比与环比:同比是指与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况,例如2022年12月与2022年12月相比。
环比是指与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况,例如2022年12月与2022年11月相比。
二、数据准备2.1理解数据2.1.1字段与记录字段:字段是事物或现象的某种特征。
比如成绩表中的“学号”“姓名”“总分”等都是字段,在统计学中称为变量。
记录:记录是事物或现象某种特征的具体表现。
比如成绩表中的“性别”可以是男或女,“总分”可以是273或者230等,记录也称为数据或变量值。
1、Accessa)函数计算i.DATADIFF1.DATADIFF(“参数”,起始时间,结束时间)2.3.例句SELECT 用户ID,注册日期,DATEDIFF(“D”,注册日期,#2011-12-31#) AS 注册天数FROM 用户明细;b)数值分组i.IIF函数法1.与Excel中的IF函数用法及功能一样。
在Access数据库中,IIF函数最多可进行13层嵌套2.IFF(表达式,表达式成立时返回的值,表达式不成立时返回的值)3.例句a)SQLSELECT 用户ID,年龄,IIF(年龄<=20,”20岁及其以下”,IIF(年龄<=30,”21-30岁”,IIF(年龄<=40,”31-40岁”,“40岁以上”))) AS 年龄分组FROM 用户明细;b)ii.CHOOSE1.与Excel中的CHOOSE函数用法及功能一样。
2.CHOOSE(参数,结果1,结果2,……,结果N)3.说明:a)参数可为表达式,如果参数或表达式返回的值为1,则函数CHOOSE返回结果1;如果参数或表达式返回的值为2,函数CHOOSE返回结果2,以此类推。
b)参数或表达式返回的值必须为1~254的数字,如果小于1或者大于254,则Access数据库将返回错误值“#VALUE!”。
c)如果参数为小数,则在使用前将被截尾取整,即相当于Excel中的INT函数效果。
4.例句SELECT 用户ID,年龄,CHOOSE((年龄-1)/10+1,”10岁及其以下”,”11-20岁”,”21-30岁”,”31-40岁”,”40岁以上”) AS 年龄分组FROM 用户明细;5.结果iii.SWITCH1.SWITCH(条件1,结果1,条件2,结果2,……,条件N,结果N)2.说明a)如果条件1为True,SWITCH将返回结果1,如果条件2为True,SWITCH将返回结果2,以此类推。
b)参数由成对的条件表达式和结果值组成,条件表达式按照从左到右的顺序求值,将返回与第一个求职结果为True的表达式相对应的结果值。
1.明确分析思路:首先要明确分析目的:菜鸟与数据分析师的区别就在于菜鸟做分析时目的不明确,从而导致分析过程非常盲目。
这点有比较深的体会,在公司里做过关于搜索和新手的产品数据分析,自己对分析目的没考虑太多,靠的是前人留下的上期数据分析结果,倘若让我从零开始做,估计会很盲目。
然后确定分析思路:梳理分析思路,并搭建分析框架,把分析目的分解成若干个不同的分析要点,即如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标。
最后还要确保分析框架的体系化,使分析结果具有说服力:营销方面的理论模型有4P、用户使用行为、ST P理论、SWOT等;管理方面的理论模型有PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART等。
在上周一个汇报上使用了SWOT分析方法,对这些营销或管理的模型还都很陌生。
2.数据收集:一般数据来源于以下几种方式:数据库、公开出版物(统计年鉴或报告)、互联网、市场调查。
3.数据处理:数据处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法。
导师提过在做数据处理时,不要在原始数据上进行数据处理以防原始数据丢失,保留数据处理过程以便发现错误时查找。
4.数据分析:数据分析是指用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。
与数据挖掘的关系是数据挖掘侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式与规律。
5.数据展现:一般情况下,数据是通过表格和图形的方式来呈现的。
常用的数据图表包括饼图、柱形图、条形图、折线图、散点图、雷达图等。
进一步加工整理变成我们需要的图形,如金字塔图、矩阵图、漏斗图、帕雷托图等。
在一般情况下,能用图说明问题的就不用表格,能用表说明问题的就不用文字。
6.报告撰写:一份好的数据分析报告,首先需要有一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然。
结构清晰、主次分明可以使阅读者正确理解报告内容;图文并茂,可以令数据更加生动活泼,提高视觉冲击力,有助于阅读者更形象、直观地看清楚问题和结论,从而产生思考。
谁说菜鸟不会数据分析2篇第一篇:菜鸟也能成为数据分析达人随着信息时代的到来,数据分析成为了越来越多企业必备的技能和能力,成为了一个非常有前途的职业。
也就有了一种误解,认为只有那些具备数学和计算机技能的人才能够从事数据分析。
其实,这个想法是错误的。
即使是一个菜鸟,只要打好基础,也可以成为一位出色的数据分析师。
1、学会自己动手首先,菜鸟在开始数据分析这个工作之前,需要有自学能力。
虽然在学校里或培训课程上可以学到很多,但在实践中,自学才是最实用的方法。
不断地练习和探索,不断研究文档并跟进最新研究成果,这样才能不断进步。
推荐几个学习数据分析的网站:DataCamp、Coursera、Kaggle。
2、学好数学和编程菜鸟要将数据分析这个技能掌握到位,必须学好数学和编程。
不要只是停留在基础的计算思想上,要结合实际问题进行学习。
通过逐渐深入理解各种算法,建立数学模型和计算机模型,学习编程语言等,提高自己的数据分析技能,从而把这些算法应用到实际的问题应用中。
3、学习数据可视化技能学会数据分析,只是开始,但如何把数据分析结果以清晰明了的方式呈现给别人就非常关键了。
这时候就需要菜鸟掌握数据可视化技能。
通过各种可视化工具,菜鸟可以将自己的数据分析结果转化为图表、地图、甚至是3D可视化,使数据分析结果更加直观,有力地支持决策。
推荐几个数据可视化工具: Tableau 、Plotly、D3.js。
4、多交流多接受挑战在数据分析中,多交流是非常重要的。
菜鸟可以参加各种在线活动,参加博客、社群的讨论,了解前沿内容并讨论数据分析中的挑战以及如何解决难题。
通过与其他专业人士和同行的交流,菜鸟可以发现自己在哪些方面比较薄弱和不足,并且通过交流中的互相提高,让自己变得更加专业。
通过以上这些方法,一个菜鸟也可以成为一位出色的数据分析师。
这要求需要菜鸟自己付出时间和精力,不断提升自己的能力。
当然,这一切都是基于良好的基础知识,对于一个充满激情和雄心的菜鸟来说,取得成功就不是一个梦想,而是一个可能实现的目标。
谁说菜鸟不会数据分析-- 整理概括版本数据分析的三大作用一、现状分析简单来说告诉你过去发生了什么第一: 告诉你企业现阶段的整体运营情况,通过各个经营指标的完成情况来衡量企业的运营状态,以说明整体经营是好还是坏,以及好坏的程度。
第二: 告诉你企业各项业务的构成,让你了解企业各项业务的发展及变动情况,对企业运营情况有更深入的了解。
二、原因分析简单来说告诉你某一现状为什么发生。
运营情况具体好在哪里,差在哪里。
三、预测分析将来会发生什么对企业的未来发展趋势作出预测,一般通过专题分析来完成的,通常在制定企业季度、年度等计划时进行的,其开展的频率没有现状分析及原因分析高。
数据分析六部曲一、明确分析目的和思路1、明确分析目的(为什么开展数据分析,通过这次数据分析我要解决什么问题等等) 2 、确定分析思路(如何具体开展数据分析,需要从那几个角度进行分析,采用那些分析指标。
要知道先分析什么,后分析什么,使得各个分析点之间有逻辑关系。
通俗来说以营销、管理等理论为指导,结合实际业务情况,搭建分析框架,这样才能确保分析维度的完整性,分析结果的有效性及正确性。
营销理论模型有4p、用户使用行为、stp 理论、swot等,管理方面理论pest、5w2h时间管理、生命周期)3、数据分析方法论(指数据分析思路比如从哪几方面开展数据分析, 各方面包含什么内容和指标, 是数据分析的前期规划,指导着后期数据分析工作的开展。
与数据分析方法不同,前者是宏观角度分析的,后者是从微观角度分析的包括对比分析、交叉分析等等方法。
)常用的方法论有:PEST是指影响一切行业和企业的各种宏观力量。
一般应对的是政治、经济、技术、社会);5W2H何因、何事、何人、何时、何地、如何做、何价);逻辑树分析法(将问题的所有子问题分层罗列,从最高层开始,并逐步向下拓展。
遵循 3 个原则:要素化;把相同问题总结归纳成要素,框架化: 将各个要素组织成框架,遵守不重不漏的原则,,关联化; 框架内的各要保持必要的相互关系,简单而不孤立);4P营销理论(四要素:产品(有形产品、服务、人员、组织、观念和它们的组合)、价格(基本价格、折扣价格、支付期限。
《谁说菜鸟不会数据分析》读后感精选10篇《谁说菜鸟不会数据分析》是一本由张文霖/刘夏璐/狄松编著著作,电子工业出版社出版的16开胶版纸图书,本书定价:59.00元,页数:306,特精心从网络上整理的一些读者的读后感,希望对大家能有帮助。
《谁说菜鸟不会数据分析》读后感(一):我觉得使用excel更合适做这本书的书名我觉得使用excel更合适做这本书的书名,书写的很浅,没有讲太多数据分析的思路,更多的是在说excel的使用。
比起这本书,我还是更推荐《headfirstdataanalysis》作为入门书籍。
《谁说菜鸟不会数据分析》读后感(二):菜鸟看完还是菜鸟本来没多些料,还要讲故事,大部分篇幅可以略过。
收获的可能就是些excel的用法了。
内文图表风格也不一致,有的比较模糊,可以简化或合并一些示例表格。
值得借来翻一遍。
《谁说菜鸟不会数据分析》读后感(三):不错的入门书介绍了一下数据分析的基本知识,外加一些excel技巧,挺适合初入职场的用户入门,尤其是方法论和方法的部分值得好好学。
虽然看标题就知道不会有高深的内容,但如果能基于某一行业或例子一以贯之或许会更好。
《谁说菜鸟不会数据分析》读后感(四):不错的入门书介绍了一下数据分析的基本知识,外加一些excel技巧,挺适合初入职场的用户入门,尤其是方法论和方法的部分值得好好学。
虽然看标题就知道不会有高深的内容,但如果能基于某一行业或例子一以贯之或许会更好。
《谁说菜鸟不会数据分析》读后感(五):只适合连excel都不会的初级者书是全彩图的,不知道是不是为了迎合女性读者。
内容真的就是excel基础,当你要是用它来学excel也根本不行,因为不系统。
大家不要被名字给蒙蔽了,真想看,去书店看一会你就基本都明白了。
不推荐购买。
我买后悔了啊。
《谁说菜鸟不会数据分析》读后感(六):在公司上班的都应该看看的这本书的东西还是写得很有趣的,对于那些在公司上班的人,都值得拥有一本,不知不觉中提升竞争力。
谁说菜鸟不会数据分析(入门篇)5.1数据分析方法数据分析作用与对应的分析方法数据分析作用 基本方法 数据分析方法现状分析 对比 对比分析平均分析综合评价分析 ……原因分析 细分 分组分析结构分析交叉分析杜邦分析漏斗图分析 矩阵关联分析 聚类分析 ……预测分析 预测 回归分析 时间分析 决策树 神经网络 ……一、定义• 对比分析法 – 将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律。
• 对比分析法的特点:可以非常直观地看出事物某方面的变化或差距,并且可以准确、量化地表示出这种变化或差距是对少。
二、分类分为静态比较和动态比较★ 静态比较 – 在同一时间条件下对不同总体指标的比较,如不同部门、不同地区、不同国家的比较,也叫横向比较,简称横比。
★ 动态比较 – 在同一总体条件下对不同时期指标数值的比较,也叫纵向比较,简称纵比。
三、实践运用1. 与目标对比实际完成值与目标进行对比,属于横比。
例如将公司目前的业绩与全年的业绩目标进行对比,看是否完成目标。
2. 不同时期对比选择不同时期的指标数值作为对比标准,属于纵比。
例如将公司目前的业绩与自身的去年同期及上个月完成情况进行对比。
• 同比 - 与去年同期对比。
• 环比 - 与上个月完成情况对比。
3. 同级部门、单位、地区对比与同级部门、单位、地区对比属于横比。
4. 行业内对比与行业中的标杆企业、竞争对手或行业的平均水平进行对比,属于横比。
5. 活动效果对比对某项营销活动开展前后进行对比,属于纵比。
对活动的开展状况进行分组对比,属于横比。
四、注意事项1. 指标的口径范围、计算方法、计量单位必须一致,即要用同一种单位或标准取衡量。
2. 对比的对象要有可比性。
3. 对比的指标类型必须一致。
• 分组分析法 – 根据数据分析对象的特征,按照一定的标志(指标),把数据分析对象划分为不同的部分和类型来进行研究,以揭示其内在的联系和规律性。
如果你想知道到底有多少种数据类型,最简单的方法就是在Excel中任意选择一个单元格,单击鼠标右键-设置单元格格式中可以查看所有数据类型,如图所示:
这么多的数据类型,最终可以归为两大类:字符型数据和数值型数据。
两种类型顾名思义,区分的重要依据为后者可以直接用算术方法进行汇总和分析。
3. 数据表
一张数据表的制作,可以侧面反映出制作者的数据沉淀及应用水平,数据表的设计是否合理,关系着后期数据分析的效率及深度。
数据表设计的六点要求:
1)数据表由标题行和数据部分组成;
2)第一行是表的列标题(字段名),列标题不能重复;
3)第二行起是数据部分,数据部分的每一行数据称为一个记录,并且数据部分不允许出现空白行和空白列;
4)数据表中不能有合并单元格存在;
5)数据表与其他数据之间应该留出至少一个空白行和一个空白列;
6)数据表需要以一维的形式存储,但是在实际操作中接触的数据往往是以二维表格的形式存在的,此时应将二维表转化为一维表的形式存储数据;
对于以上数据表设计的几点要求,本人有所体会,我做的数据报表里有不少的合并单元格,基本都是为了满足一时之需,没有为后续数据分析做长远考虑和规划,还有就是在数据部分不要有空白行和空别列,这些都不是规范的数据表。