看懂数据分析图表的十个基本方法(下)
- 格式:docx
- 大小:526.26 KB
- 文档页数:11
⼗种常⽤的数据分析⽅法01 细分分析 细分分析是分析的基础,单⼀维度下的指标数据的信息价值很低。
细分⽅法可以分为两类,⼀类逐步分析,⽐如:来北京市的访客可分为朝阳,海淀等区;另⼀类是维度交叉,如:来⾃付费SEM的新访客。
细分⽤于解决所有问题。
⽐如漏⽃转化,实际上就是把转化过程按照步骤进⾏细分,流量渠道的分析和评估也需要⼤量⽤到细分的⽅法。
02 对⽐分析 对⽐分析主要是指将两个相互联系的指标数据进⾏⽐较,从数量上展⽰和说明研究对象的规模⼤⼩,⽔平⾼低,速度快慢等相对数值,通过相同维度下的指标对⽐,可以发现,找出业务在不同阶段的问题。
常见的对⽐⽅法包括:时间对⽐,空间对⽐,标准对⽐。
时间对⽐有三种:同⽐,环⽐,定基⽐。
例如:本周和上周进⾏对⽐就是环⽐;本⽉第⼀周和上⽉第⼀周对⽐就是同⽐;所有数据同今年的第⼀周对⽐则为定基⽐。
通过三种⽅式,可以分析业务增长⽔平,速度等信息。
03 漏⽃分析 转化漏⽃分析是业务分析的基本模型,最常见的是把最终的转化设置为某种⽬的的实现,最典型的就是完成交易。
但也可以是其他任何⽬的的实现,⽐如⼀次使⽤app的时间超过10分钟。
漏⽃帮助我们解决两⽅⾯的问题: 在⼀个过程中是否发⽣泄漏,如果有泄漏,我们能在漏⽃中看到,并且能够通过进⼀步的分析堵住这个泄漏点。
在⼀个过程中是否出现了其他不应该出现的过程,造成转化主进程收到损害。
04 同期群分析 同期群(cohort)分析在数据运营领域⼗分重要,互联⽹运营特别需要仔细洞察留存情况。
通过对性质完全⼀样的可对⽐群体的留存情况的⽐较,来分析哪些因素影响⽤户的留存。
同期群分析深受欢迎的重要原因是⼗分简单,但却⼗分直观。
同期群只⽤简单的⼀个图表,直接描述了⽤户在⼀段时间周期(甚⾄是整个LTV)的留存或流失变化情况。
以前留存分析只要⽤户有回访即定义为留存,这会导致留存指标虚⾼。
05 聚类分析 聚类分析具有简单,直观的特征,⽹站分析中的聚类主要分为:⽤户,页⾯或内容,来源。
解读图表信息的技巧图表是我们在日常生活中经常遇到的一种信息表达形式。
无论是在学术研究、商业决策还是新闻报道中,图表都起到了重要的作用。
然而,要准确地理解和解读图表所传递的信息并不是一件容易的事情。
本文将为大家介绍一些解读图表信息的技巧,帮助读者更好地理解和利用图表数据。
首先,我们需要了解图表的类型。
常见的图表类型包括折线图、柱状图、饼图等。
折线图常用于展示数据随时间变化的趋势,柱状图则适合比较不同组别的数据差异,而饼图则能直观地显示各个组别在整体中的比例关系。
了解图表类型有助于我们选择合适的图表进行数据展示和分析。
其次,我们需要注意图表的坐标轴。
坐标轴包括横轴和纵轴,它们通常代表不同的变量或类别。
在观察图表时,我们要仔细阅读坐标轴的标签,了解它们所代表的含义。
同时,还要注意坐标轴的刻度和范围,以便准确地理解数据的大小和变化趋势。
另外,我们要注意图表中的数据标记。
数据标记是指图表中用于标示具体数值的点、柱形或饼块等。
在观察图表时,我们可以通过仔细观察数据标记的位置和数值来获取更多的信息。
有时,图表还会使用颜色、形状或大小等不同的标记来表示不同的数据类别或属性,我们也要留意这些细节,以充分理解数据的含义。
此外,我们还需要关注图表中的趋势和关联。
趋势是指数据随时间或其他变量的变化趋势,而关联则是指不同变量之间的相关性。
通过观察图表中的趋势和关联,我们可以发现一些规律和规律,进而做出合理的推断和判断。
例如,在折线图中,如果某个变量的线条呈现上升趋势,我们可以推断该变量随时间的增加而增加。
最后,我们要善于比较和分析图表数据。
图表往往会提供多组数据,我们可以利用这些数据进行比较和分析。
比较不同组别的数据有助于我们发现差异和相似之处,而分析数据之间的关系则能帮助我们深入理解数据背后的原因和机制。
在进行比较和分析时,我们可以使用数字、百分比或图表上的线条、柱形等来支持我们的观点。
综上所述,解读图表信息需要一定的技巧和经验。
数据分析方法有哪些?10种数据分析方法数据,犹如一片广袤的海洋,隐藏着无尽的信息和价值。
然而,要从这片海洋中提取出有用的信息并进行深化的分析,需要借助适当的数据分析方法。
在本文中,我们将探讨10种常用的数据分析方法,关心读者更好地理解和应用数据分析。
描述性统计分析描述性统计分析是数据分析的基础,它通过对数据进行总结和描述,揭示数据的基本特征。
常用的描述性统计分析方法包括计数、平均数、中位数、众数、标准差等。
通过这些统计指标,我们可以了解数据的分布状况、集中趋势和离散程度,为后续的分析供应基础。
相关性分析相关性分析用于讨论两个或多个变量之间的关系。
通过计算相关系数,我们可以推断变量之间的相关性强弱和正负相关程度。
常用的相关性分析方法包括皮尔逊相关系数、斯皮尔曼相关系数等。
相关性分析可以关心我们发觉变量之间的潜在关联,为进一步的分析供应线索。
回归分析回归分析是一种用于讨论变量之间关系的方法,它可以通过建立数学模型来猜测一个或多个自变量对因变量的影响。
常用的回归分析方法包括线性回归、多元回归、规律回归等。
回归分析可以关心我们理解变量之间的因果关系,为决策供应依据。
时间序列分析时间序列分析是一种讨论时间相关数据的方法,它可以揭示数据随时间变化的规律和趋势。
常用的时间序列分析方法包括移动平均法、指数平滑法、ARIMA模型等。
时间序列分析可以关心我们猜测将来的趋势和变化,为决策供应参考。
聚类分析聚类分析是一种将相像的数据对象归类到同一组的方法,它可以关心我们发觉数据中的隐蔽模式和规律。
常用的聚类分析方法包括K均值聚类、层次聚类等。
聚类分析可以关心我们理解数据的内在结构,为目标市场划分、客户分类等供应支持。
因子分析因子分析是一种用于讨论变量之间潜在关系的方法,它可以将多个变量归纳为少数几个因子,从而简化数据分析。
常用的因子分析方法包括主成分分析、因子旋转等。
因子分析可以关心我们发觉变量之间的共同特征和隐含结构,为变量选择和数据降维供应指导。
数据图表的解读与分析数据图表是一种常见且重要的数据展示方式,它通过图像化的方式将数据呈现给读者,使得读者能够更直观地理解和分析数据。
在本文中,我们将讨论数据图表的解读与分析方法,并探讨如何有效地利用数据图表来支持决策和问题解决。
1. 数据图表的种类和特点数据图表主要包括折线图、柱状图、饼图、散点图等。
不同类型的图表适用于不同的数据类型和目的。
以下是常见数据图表的特点及其适用场景:- 折线图:用于显示随时间或其他连续变量的变化趋势,可以比较多个变量之间的关系。
- 柱状图:用于比较不同类别或组之间的数值差异,可以显示各类别的相对大小。
- 饼图:用于显示各个部分占总体的比例关系,适用于展示不同部分的相对重要性。
- 散点图:用于分析两个变量之间的关系,可以观察数据的分布和趋势。
2. 解读数据图表的方法要正确解读数据图表,首先应该仔细观察图表的各个元素,包括标题、坐标轴、单位、图例等,以确保对数据的理解准确无误。
接下来,可以采用以下方法进行进一步的解读:- 比较数据的大小:对于柱状图或折线图,可以通过观察各个系列的高度或趋势来比较数据的大小。
同时,还可以关注图表中的数据标签或数值标注,以获取更精确的数据信息。
- 观察数据的趋势:折线图可以展示数据随时间的变化趋势,通过观察折线的走势,可以判断出数据的增长、下降或波动情况。
此外,还可以使用趋势线或回归分析来预测未来的趋势。
- 分析数据的关系:散点图可以帮助分析两个变量之间的关系。
通过观察散点图的分布形态,可以判断出两个变量是否存在相关性、正相关还是负相关,并进一步分析背后的原因和机制。
- 着重关注异常值:在解读数据图表时,应特别关注可能存在的异常值或离群点。
这些异常值可能对整体数据分析产生重大影响,因此需要对其进行深入研究,寻找异常的原因和解决办法。
3. 分析数据图表的意义和应用数据图表不仅仅是简单的数据展示工具,它还可以提供更深层次的信息和洞察力,从而支持决策和问题解决。
数据分析与决策制定的十个方法在当今信息时代,数据分析和决策制定已成为企业和组织管理的重要方面。
通过对大量数据的分析和处理,可以为企业提供有效的决策依据。
下面将介绍数据分析与决策制定的十个方法,帮助您更好地利用数据进行决策。
方法一:目标明确在进行数据分析之前,必须明确决策的目标。
只有明确目标才能有针对性地收集和分析数据,从而为决策提供帮助。
例如,如果目标是提高销售额,我们可以分析不同渠道的销售数据,确定哪些渠道效果更好,然后制定相应的决策。
方法二:数据收集数据分析的前提是拥有足够的数据。
通过多种手段,如问卷调查、市场研究和用户反馈等,收集与决策相关的数据。
数据的收集要全面、准确,并且要注意保护用户的隐私。
方法三:数据清洗在进行数据分析之前,需要对数据进行清洗。
清洗数据包括去除不准确、重复和缺失的数据,确保数据的质量和准确性。
只有干净的数据才能得出准确的结论。
方法四:可视化展示在进行数据分析时,应该将数据以可视化的方式展示出来,这样更容易理解和分析数据。
例如,通过制作图表、统计图和热力图等,可以清晰地展示数据的分布和趋势,帮助决策者更好地理解数据。
方法五:数据挖掘数据挖掘是从大量的数据中寻找隐藏的模式和关联规则。
通过运用各种统计学和机器学习的方法,可以发现数据中的规律,为决策制定提供更深入的洞察。
例如,可以通过数据挖掘发现客户的购买偏好和行为模式,从而制定精准的市场营销策略。
方法六:预测分析通过历史数据和统计模型,对未来可能发生的情况进行预测分析。
例如,可以通过销售数据和市场趋势预测未来几个季度的销售额和市场需求,以便为制定预防和调整策略提供参考。
方法七:模拟实验通过建立模拟实验模型,对不同决策方案进行模拟和测试。
通过模拟实验可以预测不同决策对业务绩效的影响,帮助决策者在实际操作之前做出更好的决策。
方法八:经验判断除了数据分析,决策制定还需要结合经验判断。
数据并非万能,有些情况下需要根据经验和直觉来做出决策。
分析统计图表,得出正确信息在现代社会,统计图表成为一种常见的信息展示方式,人们往往通过观察图表以获取正确的信息。
然而,在日常生活中,我们常常会在面对各种统计图表时感到困惑,不知道如何正确地分析它们。
因此,本文将向读者介绍如何正确地分析统计图表,从而得出正确的信息。
首先,让我们来看看最基本的统计图表——柱形图和折线图。
柱形图常用来表现各种不同类别之间的数量比较,而折线图则更多地被用来表示连续性数据在时间或空间上的变化。
在分析两种图表时,要注意以下几点:1. 仔细观察纵轴和横轴的标尺。
这是为了避免出现因不清楚标尺而导致的误解,例如在柱形图中,若不仔细观察纵轴的标尺,可能会被相差不大的数据误导;而在折线图中,若不清楚横轴上时间或空间的刻度间距,也可能导致对数据的误解。
2. 关注各种类别之间的差异性。
当我们面对一个柱形图时,应该特别关注各个柱子的高度差异,这可以帮助我们快速地了解各类别之间的数量大小;而在面对一个折线图时,我们需要留心曲线的起伏,从中分析出数据的变化规律。
3. 考虑统计图表呈现的数据范围。
有时候,一份统计图表可能只涵盖特定的数据范围,而我们无法通过它了解到更广泛的数据背景,因此在分析时需要考虑到这一点。
除了柱形图和折线图以外,还有其他常见的统计图表,例如散点图、饼图和雷达图等。
不同的图表类型对应着不同的数据表达形式,因此在分析时需要注意如何正确地理解它们。
在处理统计图表时,还有一些常见的误区需要避免。
下面是一些不应该追求的目标:1. 不要试图在图表上看到不存在的数据关系。
有时我们可能会人为地把一些统计数据联系在一起,这不仅会误导我们的判断,还可能导致信息的错误传播。
2. 不要割裂数据进行分析。
因为一个统计数据的含义可能仅出现在另一个数据的背景下,所以单纯地把它割裂出来进行分析可能会导致我们对数据的真实含义出现偏差。
3. 不要把图表中的数据误解为事实。
尽管统计图表可以帮助我们更加直观地了解各种数据,但是它们仅仅是事实的一种表述,而非代表了真实的客观事实。
数据图表的读取与分析近年来,随着大数据时代的到来,数据图表在各行各业中扮演着越来越重要的角色。
数据图表作为一种直观的表达方式,能够帮助人们快速理解和分析复杂的数据信息。
在本文中,将探讨如何准确读取和分析数据图表,以及如何应用这些数据图表为决策和解决问题提供支持。
一、正确读取数据图表1. 了解数据图表的类型和特点要正确读取数据图表,首先需要了解不同类型的数据图表以及它们的特点。
常见的数据图表类型包括折线图、柱状图、饼图、散点图等。
每种图表都有其独特的表达方式和适用场景。
在读取数据图表时,需要明确图表的类型,以便更好地理解数据信息。
2. 注意图表的标题和坐标轴标签数据图表通常会有标题和坐标轴标签,它们能够提供关键的信息。
在读取数据图表时,需要仔细阅读标题和标签,了解图表的主题以及各轴所代表的含义。
例如,柱状图的纵轴可能表示数量或百分比,横轴可能表示时间或类别。
通过准确理解标题和标签,可以更加准确地读取数据图表。
3. 注意图表的数据尺度和范围数据图表的纵轴和横轴一般都有一定的尺度和范围。
在读取数据图表时,需要留意纵轴和横轴的数值范围和间隔。
通过对数据范围的了解,可以更好地理解数据的分布和趋势。
此外,对于柱状图等图表,还需注意各个柱状之间的间隔和宽度,以避免对数据的误解。
二、有效分析数据图表1. 理解图表的整体趋势数据图表通常能够展现数据的整体趋势,比如增长、下降或保持稳定等。
在分析数据图表时,需要关注整体趋势,寻找数据的规律和变化。
例如,折线图的趋势线能够反映数据的变化方向和幅度,柱状图能够直观地展示各组数据的差异。
通过理解整体趋势,可以揭示数据背后的规律。
2. 比较不同数据之间的关系数据图表不仅可以展示整体趋势,还可以比较不同数据之间的关系。
在分析数据图表时,需要关注数据之间的差异和相似之处。
通过比较不同数据,可以发现数据之间的关联性和相互影响。
例如,散点图能够显示各个数据点的分布情况,饼图能够直观地展示不同部分之间的比例关系。
统计图表的读取与分析技巧统计图表是表达和呈现数据信息的有效方式之一,通过图表可以直观地了解和展示数据的趋势和关系。
然而,要准确地读取和分析统计图表并从中获取有价值的信息并不是一件容易的事情。
本文将分享一些统计图表的读取与分析技巧,帮助读者更好地理解并利用这些图表。
一、折线图折线图常用于展示随时间变化的数据趋势。
在读取折线图时,应注意以下几点:1. 审视横坐标和纵坐标的含义。
横坐标一般表示时间,纵坐标则表示相应的数值。
确保理解坐标的单位和范围,以便正确解读数据。
2. 注意折线的走向和趋势。
通过观察折线的上升或下降趋势,可以了解数据的变化规律和趋势。
3. 分析峰值和谷值。
峰值表示数据的最高点,谷值表示数据的最低点。
分析这些值有助于了解数据的极端情况。
二、柱状图柱状图常用于比较不同组别或不同时间段的数据。
在读取柱状图时,应注意以下几点:1. 确认每根柱子代表的是什么。
柱子可以代表不同的类别、不同的时间段或不同的变量,需要明确每根柱子所代表的含义。
2. 比较柱子的高度。
柱子的高度表示相应数据的大小,通过比较柱子的高度可以得出不同组别或时间段之间的关系。
3. 寻找异常值。
注意是否有柱子特别高或特别低,这些异常值可能代表了重要的信息。
三、饼图饼图常用于展示不同部分在整体中的比例关系。
在读取饼图时,应注意以下几点:1. 分析每个扇形的比例。
饼图的每个扇形表示不同部分的比例,可以通过比较扇形的面积了解各部分的重要性。
2. 关注具有较大扇形的部分。
较大的扇形可能代表了重要的部分,需要特别关注。
3. 比较相邻扇形的大小差异。
通过比较相邻扇形的大小差异,可以了解不同部分之间的相对重要性。
四、散点图散点图常用于展示两个变量之间的关系。
在读取散点图时,应注意以下几点:1. 观察点的分布规律。
通过观察点的分布情况,可以了解两个变量之间的关系,例如正相关、负相关或无关系。
2. 分析离群点。
注意是否存在与其他点相距较远的点,这些离群点可能代表了异常情况或者重要的变量。
分析数据报告的十个技巧1. 引言1.1 概述在当今信息爆炸的时代,数据报告已成为我们日常工作和生活中不可或缺的一部分。
对于企业决策者、市场调研人员和数据分析师来说,准确有效地进行数据报告十分重要。
本文将介绍分析数据报告的十个技巧,帮助读者更好地应对数据处理与分析过程。
1.2 目的本篇文章旨在帮助读者能够准确收集、整理、分析和呈现数据报告。
通过掌握这些技巧,读者将能够提高数据报告的质量和可理解性。
无论是为了支持商业决策还是向其他利益相关者传达关键信息,这些技巧都将对读者非常有益。
1.3 结构本文将按照以下结构展开讨论:首先,在第二部分"数据收集与整理" 中,我们将介绍如何进行数据质量检查、清洗与处理以及数据可视化与分析。
接着,在第三部分"设定报告目标和受众" 中,我们将探讨如何确定报告目标、分析受众需求以及选择合适的报告风格。
接下来,在第四部分"制作数据报告的关键要点" 中,我们将重点讲解突出关键指标、避免信息过载和结果解释清晰简洁这三个关键要点。
最后,在第五部分"数据有效沟通技巧" 中,我们将介绍图表设计原则、故事性呈现数据以及多角度分析数据等技巧。
通过掌握这十个技巧,读者将能够更好地分析和呈现数据报告,并在工作中取得更好的成果。
在开始探索这些技巧之前,让我们先来了解如何进行数据收集与整理。
2. 数据收集与整理:数据收集是进行数据分析的第一步,而数据整理则是确保数据的准确性和完整性,为后续的分析工作做好准备。
下面将介绍和讨论一些关于数据收集与整理的技巧。
2.1 数据质量检查:在开始进行数据分析之前,务必进行数据质量检查。
这包括检查数据是否有缺失值、异常值、重复值等问题。
对于缺失值和异常值,可以考虑删除或填充缺失值,修正或排除异常值。
对于重复值,则需要合并或删除重复的记录。
2.2 数据清洗与处理:数据清洗是指通过剔除不符合要求或不可用的数据来消除噪音和冗余信息。
报告中的图表分析和解读方法图表是我们在报告中经常使用的一种展示数据的方式,通过图表可以直观地呈现数据的变化趋势、比较差异以及关系等信息。
然而,对于一般读者来说,对图表的解读可能并不容易。
因此,在报告中正确地分析和解读图表数据是至关重要的。
本文将介绍一些常见的图表分析和解读方法,帮助读者更好地理解报告中的图表数据。
一、柱状图的解读方法柱状图是最常见的用于比较不同类别数据的图表类型。
通常,柱状图的横轴表示不同的类别,纵轴表示数量或者比例。
在解读柱状图时,可以从以下几个方面分析:1.1 高低差异:观察不同类别的柱子的高低差异,判断数据之间的数量差异。
如果某个类别的柱子特别高,说明该类别在这个指标上具有明显的优势。
1.2 变化趋势:比较不同时间点或者不同地区的柱状图,观察柱子的变化趋势。
如果柱子逐渐增长或者逐渐减少,说明数据在这个指标上具有明显的变化趋势。
1.3 对比分析:将不同类别的柱状图进行对比,观察柱子的相互关系。
如果两个柱子的高度差距较大,说明这两个类别在这个指标上的差异较大。
二、折线图的解读方法折线图是用于呈现数据随时间、空间或者其他连续性变量而变化的图表类型。
在解读折线图时,可以从以下几个方面进行分析:2.1 趋势变化:观察折线的走势,判断数据的整体变化趋势。
如果折线逐渐上升,说明数据在这个变量上呈现逐渐增长的趋势。
2.2 周期性变化:观察折线的周期性波动,判断数据是否存在某种周期性变化规律。
如果折线呈现定期的波动,说明数据具有一定的周期性变化。
2.3 变化率分析:计算相邻数据点的变化率,判断数据的增长速度或者下降速度。
如果变化率较大,说明数据在这个变量上的变化速度较快。
三、饼图的解读方法饼图是用于呈现百分比和比例的图表类型。
在解读饼图时,可以从以下几个方面进行分析:3.1 比例关系:观察各个扇形区域的大小比较,判断各个类别在总体中所占的比例关系。
如果某个扇形区域较大,说明该类别在总体中所占比例较大。
数据分析一方面自己要会将数据制作成图形便于他人解读,另外一方面,我们自己也必须学会解读别人的图形,或者解读自己过去曾经制作的图形。
每个数据图形背后都是数据,而不同水平和能力的人在同样图形上看到的东西可能会不同。
解读数据会有很多方法,我们这里给大家提示性介绍十个方法。
上期内容:①辅助线②找差异、找变化③找奇异点、特殊群体④找转折点、拐点⑤找特征本期内容:⑥找问题⑦找源头Root Cause⑧找关系⑨找驱动⑩找规律6、找问题对数据分析人员来讲找问题就是找数据,只要问对了问题,就能够找到对的合适的数据,通过数据可以分析出具体的问题,并能够找到具体的方案。
在一定意义上来讲,问对问题比找到答案更加重要。
只要问题问对了,答案基本上非常容易获得。
有人甚至夸张地说,问对问题,事情就解决了一半。
我作为资深的数据分析师,我常用以下五个问题来确保我们的分析能够深入到最深层次,能够挖掘到事物的本质,能够找到问题的根源。
这五个问题永远都是数据分析师应该掌握的内容,否则就仅仅是数据处理人员,称不上数据分析师。
What –存在什么差异或者变化?这个差异和变化是什么?是向好还是向坏的方向发展的?是好现象还是坏现象?是需要警惕还是需要挖掘创新的?What is the change? ——这个变化是什么?这个变化的本质是什么?Who –这个变化的主体是谁?客体是谁?是谁在变化或者是谁引导了变化?是谁造成的变化?这个变化的责任方应该是谁?如果是好的话,谁该领功,是坏的话,谁该负责?他为什么要引领这个变化或者他有什么样的动机要让这个变化发生?背后的利益或者情感的驱动是什么?When –这个变化是什么时间发生的?是最新发生的吗?是过去就一直在发生着,只是现在变化大了才发现的?这种变化持续多久了?多长时间才发生了这么大的变化?是快速还是慢速?按照这个速度发生变化下去,多长时间可以发生质的变化?这种变化是否需要阻止?最迟需要什么时候阻止?这个变化是否需要加速?如果需要,到什么时候需要达成什么结果?Where –这个变化在哪里发生的?发生的环境要素是什么?牵扯到哪些部门、组织或者利益相关方?每个利益相关方的诉求是什么?会对该事物的发生和发展有什么影响?这个变化发生的环境因素是必要条件还是充分条件?是什么条件达到了才产生了这个变化?这个条件是否可以人为创造?如果不能人为创造,自然界将有什么可能形成这样的条件?How –如何调整?如何强化?如何弱化?如何创造事物发生的条件让事物按照我们期望的方向进行变化?如何才能改变现在的状况?这个变化是怎样发生的?这个发生能否避免或者重复?4W1H的五问方法可以让数据分析人员能够把握问题的关键,能够找到问题的根源。
在执行过程中需要钻研精神,不放过任何一个细微的变化与差别,对所有的问题有追根寻底的精神。
刚开始学习这五问方法的时候,容易陷入一个窘境,就是有太多的问题要问了,非常少量的数据需要花费大量的时间去追根究底。
其实,当你对公司业务熟悉之后,在追问问题根源的时候,也会更有重点,当然这也可能是遗漏问题的根源。
越想走捷径,越容易出遗漏的问题。
7、找源头Root Cause上节中4W1H的方法可以让我们通过问问题找到问题的关键和问题的根源,找到发生变化的原因,从而能够找到解决问题的方法,是一个非常全面的方式。
而在进行数据分析的时候,找到问题的根源,问题的根,却是一个比较见功底的活儿。
一个公司中的管理问题往往根源都在管理上,也就是都在老总对公司的管理上。
常言道,问题都在前三排,根源就在主席台。
很多公司的管理问题都可以追究到企业老总的管理方法和管理理念、管理方式、管理思路的问题。
为何公司令行不止?因为老总言行不一致;为何很多人收贿受贿?因为老总就是这样的人;为什么很多人光说不做?因为老总只喜欢那些说得好听的;为什么大家都不愿意实干?因为出错之后,老总就会惩罚,不干无错。
太多的问题都容易指向老总的问题。
有些问题的根源来自于公司的潜规则或者长期以来养成的习惯,有些公司的员工不作为,是因为长期以来大家养成了懒散的习惯,没有尽职尽责的精神。
制度流程的问题往往是管理中常见的问题根源。
门在哪儿开,人们就从哪儿走。
门开错了位置,大家就会走错位置。
公司的制度和流程缺少严谨性和严肃性,往往导致很多制度和流程最终流为形式;如果制度和流程在不同的人身上发生不同的变化,那么制度和流程的严肃性就会被质疑而失去其权威性;如果制度和流程失去权威性,很多人就会钻空子。
随着公司规模的变化、人数的增多、业务的复杂程度增加,原有的制度和流程可能会发生变化,出现不适用的现象,需要根据公司发展需要进行调整。
数据能够显现出一些问题,当这些问题出现后,数据分析人员需要根据公司的情况,提出相关的建议和意见,协同相关的部门对制度和流程进行修订,并追踪制度流程修订后的结果,用数据来追踪效果,确保这种修订是好的、可行的、有效的。
就如前面分析的月度销售额曲线图案例那样,公司的目标制定流程不科学,需要重新设定公司目标制定和分解的流程;另外公司员工激励的制度不合理,不能有效地激励员工超额完成任务,需要协同人力资源部修订员工激励方案,确保员工能够把能力发挥到极致,让公司切实把握所有的发展机会来发展,不能因为员工的问题影响公司的持续。
在挖掘数据现象背后的Root Cause的时候,需要我们对事物的本质有清醒的认知。
同样是营销和销售,每个公司对这两个部门的定义会有很大的区别。
在快速消费品公司,营销主导销售,公司的销售模式是通过广告吸引消费者购买,而销售需要做好产品的分销,确保消费者去购买的店面中有可销售的产品,不断货;而在药品、医疗器械、耐用消费品中,销售起到非常重要的作用,在终端消费者决策中起到非常重要的影响,而营销则是为销售提供各种销售工具的。
而这种差异来自于什么呢?购买者的决策机制。
当购买者的决策机制是由感性的品牌喜好决定的时候,营销主导销售;当消费者的购买决策复杂,需要专业知识、理性决策等的时候,需要专业的销售人员或者专家在销售点能够临门一脚地把我成交过程。
这里的Root Cause就是购买者的购买决策过程。
由此你可以推断下去,B2B的销售往往都是销售主导营销,或者营销为销售提供支持服务。
8、找关系通过数据找到事物之间的关系是我们比较容易做到的。
通过散点图,我们看到相关的分布状况,我们就能够直观地判断两者之间的关系是否是相关关系,相关性有多高,随机误差的影响有多大。
有时候我们需要对数据进行一定的调整才能看到其相关性,比如可以通过对数关系、幂指关系等处理后再看其相关关系。
相关性高可以有正相关和负相关,相关性低,说明两个关系不紧密。
相关性研究需要比较谨慎,一方面要有足够的丰富的专业知识,同时还不要违背常识。
比如,如果说监狱中85%罪犯都喜欢吃米饭,我们是否可以得出结论说米饭是导致犯罪的原因?调查研究显示癌症患者中只有18%的人是重烟民,但90%的人都吃米饭,有65%的人每天至少吃一顿米饭,那么是否可以得出结论说米饭是导致癌症的原因?纽约股票交易所的股票指数与华尔街上女性的裙子长短呈正相关,股票下跌,裙子变短;股票上涨,裙子变长,那么华尔街女性的裙子长度是导致纽约股市涨跌的原因吗?这些是无法立住脚的分析判断,但数据分析软件或者算法所给予我们的只有这些相关性,只有真实的数据和指标,我们解读的时候必须加入常识的成分,不能单纯地从数据角度去判定事物间的关系。
9、找驱动数据无法直接告诉我们事物变化背后的驱动要素是什么,只能告诉我们相关的关系或者两种指标之间的变化关系,我们需要自己找寻事物变化的驱动关系。
汽车加入汽油,通过发动机的启动,我们就能够行驶几百公里,这是典型的汽油驱动发动机、发动起驱动车轮前行的逻辑关系,但现实世界,特别是商业环境下,这种单纯的关系是不存在,甚至我们认为存在的关系,也会变得更加复杂。
广告可以扩展我们品牌的知名度、提高消费者的认知度,从而提高我们的销售量,但广告和销售量之间的关系并不像发动机那样明显。
我们把广告投放到电视媒体、广播媒体和互联网媒体,让我们的品牌有更多的曝光率,但是曝光率和购买率之间还有很大的距离,我们如何来评测广告的效果,站在一个公司的角度,是投入和产出之间的关系,而站在消费者的角度,则是看到与想买与可买与最后购买之间的转化率关系。
数据分析要从多个维度进行,一方面要从公司的维度,广告是公司的投入,销售收入是公司的产出,这是一个投入产出之间的关系,另外一方面,站在用户的角度,如果广告消费冗余,看到广告会更加腻烦,本来还希望购买你的产品,但看到你们比较恶心的广告或者不断骚扰我们日常生活的广告之后就不想再买了。
因为消费者知道,你花费了广告费打广告,我如果购买你的商品,我购买的价格中包含了你的广告费,且你的广告这么恶心,对我造成了骚扰,为了不让你继续骚扰我们,我不想购买你们的产品,这样我从口袋中掏出来的钱不会花费在无聊甚至恶心的广告上,不会再对我们造成骚扰,最好你们能够从地球上消失,这样我在看网页、看视频、看我喜欢的内容的时候不会出现你们无聊的恶心广告。
消费者会越来越成熟,你是否能够让广告更加符合他们自身的需求,这会变得越来越重要。
我们在进行数据分析的时候经常会分析转化率的问题。
销售的分析带有转化率分析,我们获得了多少客户的信息、有多少比例愿意跟我们接触,有多少人愿意了解我们的产品,有多少人对我们的产品感兴趣,又有多少人对我们的产品产生了购买意向,最后有多少人最终购买了我们的产品,这整个过程的数据体现出各个阶段的转化率,不同的转化率代表着我们营销和销售的效率问题。
我们数据只能分析从一个阶段到另外一个阶段的转化率问题,却无法发现从一个阶段到下一个阶段转化的驱动要素,我们可以通过各种方式采集数据,但现阶段的技术无法实现驱动效果分析,我们能做的是通过各种不同的实验方法,然后分析不同方法的效率和效果问题。
这种方法我们称为A/B测试。
所谓的A/B测试,就是我们针对同类的客户,采取A方案的方法和B方案的方法,然后来对比A方案和B方案的方法之间的效率差异、效果差异,然后确定那种方法更加有效率。
数据分析最终的结果可以评测A和B的效率与效能问题,但无法揭示A为什么有效、B为什么低效,或者背后的逻辑是什么,这就需要人为的参与解读和理解,而这些理解往往是建立在假设或者臆想之上的,没有足够的证据证明其驱动过程和效果。
A/B测试是一种方法,是数据分析人员与公司的管理者达成一致进行实验的一种方法,如果管理者本身不想进行测试,这个过程就很难实现。
因为管理者有其管理目标,A/B测试总要锁定一定的条件,导致管理者在过程中的自由裁决力度减弱,在这个方面,管理者为了保证既定考核目标的实现,往往会采取其喜欢的方式来管理,而让整个测试结果不可用。