网上科普有关“数据分析的步骤是什么?”话题很是火热,小编也是针对数据分析的步骤是什么?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。
1.问题定义
比较典型的场景是我们需要针对企业的数据进行分析,比如公司通常会有销售数据、用户数据、运营数据、产品生产数据……你需要从这些数据里获得哪些有用的信息,对策略的制定进行指导呢?又比如你需要做的是一份市场调研或者行业分析,那么你需要知道你需要获得关于这个行业的哪些信息。
首先你需要确定去分析的问题是什么?你想得出哪些结论?
比如某地区空气质量变化的趋势是什么?
王者荣耀玩家的用户画像是什么样的?经常消费的是那类人?
影响公司销售额增长的关键因素是什么?
生产环节中影响产能和质量的核心指标是什么?
如何对分析用户画像并进行精准营销?
如何基于历史数据预测未来某个阶段用户行为?
这些问题可能来源于你已有的经验和知识。比如你已经知道每周的不同时间用户购买量不一样,那么你可以通过分析得出销量和时间的精确关系,从而精准备货。又比如你知道北京最近几年的空气质量是在变坏的,可能的因素是工厂排放、沙尘暴、居民排放、天气因素等,那么在定义问题的时候你就需要想清楚,需要针对哪些因素进行重点分析。
有些问题则并不清晰,比如在生产环节中,影响质量的核心指标是什么,是原材料?设备水平?工人水平?天气情况?某个环节工艺的复杂度?某项操作的重复次数?……这些可能并不明显,或者你是涉足新的领域,并没有非常专业的知识,那么你可能需要定义的问题就需要更加宽泛,涵盖更多的可能性。
问题的定义可能需要你去了解业务的核心知识,并从中获得一些可以帮助你进行分析的经验。从某种程度上说,这也是我们经常提到的数据思维。数据分析很多时候可以帮助你发现我们不容易发现的相关性,但对问题的精确定义,可以从很大程度上提升数据分析的效率。
如何更好地定义问题?
这就需要你在长期的训练中找到对数据的感觉,开始的时候你拿到特别大的数据,有非常多的字段,可能会很懵逼,到底应该从什么地方下手呢?
但如果有一些经验就会好很多。比如,你要研究影响跑步运动员速度的身体因素,那么我们可能会去研究运动员的身高、腿长、体重、甚至心率、血压、臂长,而不太会去研究运动员的腋毛长度,这是基于我们已有的知识。又比如我们要分析影响一个地方房价的因素,那么我们可能会有一些通用的常识,比如城市人口、地理位置、GDP、地价、物价水平,更深入的可能会有产业格局、文化状态、气候情况等等,但一般我们不会去研究城市的女孩长相,美女占比。
所以当你分析的问题多了之后,你就会有一些自己对数据的敏感度,从而养成用数据分析、用数据说话的习惯。这个时候你甚至可以基于一些数据,根据自己的经验做出初步的判断和预测(当然是不能取代完整样本的精准预测),这个时候,你就基本拥有数据思维了。
2.数据获取
有了具体的问题,你就需要获取相关的数据了。比如你要探究北京空气质量变化的趋势,你可能就需要收集北京最近几年的空气质量数据、天气数据,甚至工厂数据、气体排放数据、重要日程数据等等。如果你要分析影响公司销售的关键因素,你就需要调用公司的历史销售数据、用户画像数据、广告投放数据等。
数据的获取方式有多种。
一是公司的销售、用户数据,可以直接从企业数据库调取,所以你需要SQL技能去完成数据提取等的数据库管理工作。比如你可以根据你的需要提取2017年所有的销售数据、提取今年销量最大的50件商品的数据、提取上海、广东地区用户的消费数据……,SQL可以通过简单的命令帮你完成这些工作。
第二种是获取外部的公开数据集,一些科研机构、企业、政府会开放一些数据,你需要到特定的网站去下载这些数据。这些数据集通常比较完善、质量相对较高。当然这种方式也有一些缺陷,通常数据会发布的比较滞后,但通常因为客观性、权威性,仍然具有很大的价值。
第三种是编写网页爬虫,去收集互联网上的数据。比如你可以通过爬虫获取招聘网站某一职位的招聘信息,爬取租房网站上某城市的租房信息,爬取豆瓣评分评分最高的**列表,获取知乎点赞排行、网易云音乐评论排行列表。基于互联网爬取的数据,你可以对某个行业、某种人群进行分析,这算是非常靠谱的市场调研、竞品分析的方式了。
当然,比较BUG的一点是,你通常并不能够获得所有你需要的数据,这对你的分析结果是有一定影响的,但不不影响的是,你通过有限的可获取的数据,提取更多有用的信息。
3.数据预处理
现实世界中数据大体上都是不完整,不一致的脏数据,无法直接进行数据分析,或分析结果差强人意。数据预处理有多种方法:数据清理,数据集成,数据变换,数据归约等。把这些影响分析的数据处理好,才能获得更加精确地分析结果。
比如空气质量的数据,其中有很多天的数据由于设备的原因是没有监测到的,有一些数据是记录重复的,还有一些数据是设备故障时监测无效的。
那么我们需要用相应的方法去处理,比如残缺数据,我们是直接去掉这条数据,还是用临近的值去补全,这些都是需要考虑的问题。
当然在这里我们还可能会有数据的分组、基本描述统计量的计算、基本统计图形的绘制、数据取值的转换、数据的正态化处理等,能够帮助我们掌握数据的分布特征,是进一步深入分析和建模的基础。
4.数据分析与建模
在这个部分需要了解基本的数据分析方法、数据挖掘算法,了解不同方法适用的场景和适合的问题。分析时应切忌滥用和误用统计分析方法。滥用和误用统计分析方法主要是由于对方法能解决哪类问题、方法适用的前提、方法对数据的要求不清等原因造成的。
另外,选择几种统计分析方法对数据进行探索性的反复分析也是极为重要的。每一种统计分析方法都有自己的特点和局限,因此,一般需要选择几种方法反复印证分析,仅依据一种分析方法的结果就断然下结论是不科学的。
比如你发现在一定条件下,销量和价格是正比关系,那么你可以据此建立一个线性回归模型,你发现价格和广告是非线性关系,你可以先建立一个逻辑回归模型来进行分析。
一般情况下,回归分析的方法可以满足很大一部分的分析需求,当然你也可以了解一些数据挖掘的算法、特征提取的方法来优化自己的模型,获得更好地结果。
5.数据可视化及数据报告的撰写
分析结果最直接的结果是统计量的描述和统计量的展示。
比如我们通过数据的分布发现数据分析工资最高的5个城市,目前各种语言的流行度排行榜,近几年北京空气质量的变化趋势,避孕套消费的地区分布……这些都是我们通过简单数据分析与可视化就可以展现出的结果。
另外一些则需要深入探究内部的关系,比如影响产品质量最关键的几个指标,你需要对不同指标与产品质量进行相关性分析之后才能得出正确结论。又比如你需要预测未来某个时间段的产品销量,则需要你对历史数据进行建模和分析,才能对未来的情况有更精准的预测。
数据分析报告不仅是分析结果的直接呈现,还是对相关情况的一个全面的认识。我们经常看到一些行业分析报告从不同角度、深入浅析地剖析各种关系。所以你需要一个讲故事的逻辑,如何从一个宏观的问题,深入、细化到问题内部的方方面面,得出令人信服的结果,这需要从实践中不断训练。
数据分析的一般流程总的来说就是这几个步骤:问题定义、数据获取、数据预处理、数据分析与建模、数据可视化与数据报告的撰写。
需求分析的十个步骤
作为数据分析师, 清晰了解数据分析的步骤是非常重要的,有助于清楚把控整个数据分析的流程。
作为想要学习数据分析的人员,了解整个数据分析的流程, 这样在面对一个数据分析问题的时候,知道如何去开展。
那么数据分析流程包含哪些环节呢?
我将一次完整的数据分析流程主要分为六个环节,包括明确 分析目的、数据获取、数据处理、数据分析、数据可视化、总结与建议 。
做任何事情都有其对应的目的,数据分析也是如此。每一次分析前,都必须要先明确做这次分析的目的是什么,只有先明确了目的,后面的分析才能围绕其展开, 常见的数据分析目标包括以下三种类型:
指标波动型 : 主要是针对某个指标下降了,上涨或者异常所做的分析, 比如DAU(日活跃用户数)降低了, 留存率降低了, 电商平台的订单数量减少了, 收入降低了,质量指标如卡顿率上涨的,分析的主要目的是挖掘指标波动的原因, 及时发现业务的问题。
评估决策型 :主要是针对某个活动上线, 某个功能上线, 某个策略上线的效果评估以及下一步迭代方向的建议,这些建议是指导产品经理或者其他业务方决策的依据。
专题探索型 : 主要是针对业务发起的一些专题的分析, 比如增长类的专题分析, 怎么提高用户新增,活跃,留存,付费, 比如体验类的专题分析, 如何提高用户查找表情的效率, 比如方向性的探索, 微信引入视频号的功能的用户需求分析以及潜在机会分析。
明确了数据分析目的之后, 第二步就是根据我们的分析目的,提取相对应的数据,通常这一个环节是利用 hive sql 从数据仓库中提取数据。
提取的数据通常要注意提取的维度和对应的指标个数,以电商app 的付费流失严重分析案例,我们需要提取的维度和指标可以根据具体的业务流程来(如图):
首先从维度上,我们需要确定好,比如时间维度我们提取的时间跨度是多长,比如今天的数据和昨天的对比,那就是取2天的数据,如果是这周和上周那就是十四天的数据。
设备维度的值是否需要提取ios和安卓的用户进行不同的平台的对比,分析付费流失严重是否主要发生在某个平台。
年龄、性别、地域维度,就是提取用户这些维度的信息, 主要是为了在哪一个年龄层, 哪一个性别,哪一个地域流失最严重。
新老用户的维度, 主要是从新旧维度上分析流失严重是否是集中在新用户还是老用户(如图所示)
确定好了维度以后, 接下来就是指标信息, 维度+ 指标才是一个完整的数据 。
因为需要分析每一个环节的流失情况,所以需要提取下单的每一个环节对应的指标的人数和次数。
基于这些人数和次数,我们可以计算每一个环节之间的转化率。
活跃浏览比 = 浏览的人数/活跃的人数
浏览添加比 = 添加的人数/浏览的人数
添加下单比 = 点击下单人数/添加购物车人数
成功下单率 = 成功下单的人数/点击下单的人数
当我们知道我们应该从哪里获取数据, 以及获取哪些指标数据后,为了保证我们提取的数据的质量,我们通常要对数据进行处理。
常见的数据处理有异常值处理,空值处理。举个例子, 比如我们在提取用户的年龄数据之前,我们需要去除掉年龄中的空的数据以及异常的数据, 异常的数据指得是比如年龄超过120岁这种。
数据处理好了之后,就可以开始分析,根据我们的分析目标,我们要选择合适的分析方法和分析思路去做拆解和挖掘。
常见的分析方法包括:漏斗分析, 相关性分析, 5w2h 分析, aha 时刻分析, 麦肯锡逻辑树分析法,用户画像分析,RFM用户分群,对比分析等方法,这些方法详细的介绍会在第三章展开, 在这里不做赘述
针对我们的订单流失的问题,典型的分析思路和方法是利用漏斗分析和用户画像分析。
漏斗分析主要是可以挖掘付费流失严重的主要流失环节是在哪里。我们发现付费流失严重主要是因为用户活跃到浏览商品的转化率从50%跌倒30%, 减少了20%,那就可以把问题定位到为什么用户浏览变少的问题上。
用户画像分析,可以帮助我们分析流失严重的用户是什么特征,比如什么样的年龄, 性别, 地域等, 那就可以知道这种流失是集中在哪一个年龄群体,哪一个地域群体以及其他的行为特征。
通过数据分析得出结论后,还需要用图表展示出来,俗话说得好,“文不如表,表不如图",用图表可以更清晰展现你的结论,通常的可视化我们可以利用excel 自带的可视化的功能, 也可以通过python或者R脚本进行可视化。
常见的图表有: 柱形图,折线图,饼图,条形图,面积图, 散点图,组合图,箱线图
当我们利用图表把我们的数据分析结论展示出来以后,最后就是数据分析的总结的部分,主要分成我们得出了什么具体的结论以及给业务具体的建议,告诉他们改进的方向。
这就是一次完整的数据分析的流程,从分析目的到提取数据,到分析数据给出结论的完整的过程。
1、概念明确----2、需求分析目的------3、如何识别需求---4、判断需求真伪----5、分析[ 用户故事评估框架、马斯洛框架、营销框架定位]---6、评判价值----7、砍需求能力---8、分类----9、排优先级----10、提升需求分析能力
一、什么是产品需求?
1、想要 vs 需要 vs 需求
“想要”(Want)是用户外在表达出来的,而“诉求”(Need)是用户内在的心理预期。产品需求满足的是用户的内在诉求,这是根本。
想要(Want)是外在的、具体的、有指向性的解决方案。
需要(Need),或者如我们前面说到的“诉求”,是内在的、原始的最终动机。
需求(Demand)是满足内在需要的同时,在可控成本内实现外在想要的解决方案。
二、需求分析的目的
需求分析,本质是动机的分析,目的在于预测用户未来的行为。需求分析阶段的产出 物,需要回答用户要什么、为什么要,还要回答以后什么情况下还可能要类似的东西、这种情
况有什么特点、如何人为的制造这种情况、
需求重要,是因为它是用户行为的动机;需求是分层的,说出来的一个样,实际是另一个样。
用户需求分析,是为了通过分析动机,准确预测用户的行为。不同的需求,代表? 了不同的动机,注定会产生不同的行为,应当看做不同类型的用户。
在需求分析中考虑竞争性,是为了比竞争对手预测得更准确,这是我们在后面要说的。
知识点需求= 购买欲望 + 购买力 = 需要 + 目标产品 + 购买力
三、如何识别需求?
? 分析完需求,那我们如何去发掘新需求呢?这里就涉及如何识别需求。 识别需求可以从三个方面去考虑,分别是视角、效率、体验。
? 1、视角
? 先说视角。作为产品经理,我们要具备多样化的视角来审视需求和产品,分为用户视角和产品视角。
比如:开头我们提到的关于微信朋友圈可见范围的例子,相比于之前三天可见和半年可见,增加了一个月可见范围。
在这个设计里,用户往往会站在自我的角度说,“不想让别人看我的朋友圈”,这是用户视角。而产品视角是考虑群体和整体,是“让用户更小压力去发朋友”。这种视角差异,最终的方案也会有差别。
用户视角满足的是“想要”(Want),产品视角实现的是“需要”(Need)。
2. 效率
另一个识别需求的维度就是效率。在最优效率的前提下,满足尽可能多的用户需求。
我们还是用一个例子来说明,用过微信公众号赞赏功能的人都知道,如果自己赞赏过作者,那自己的头 像就会始终排在最前面。
如果自己没有赞赏过,那每次进入文章,且赞赏人数超过 24 人后,底部的赞赏头像都不是固定顺序展示的。
3. 体验
最后一个识别需求的维度就是体验,关于体验,做产品的同学就比较熟悉了。体现在信息架构设计、流程设计、交互设计还有文案设计等方面。
体验也是一个很虚的指标,很难量化,每个人的认知和感受都会因为习惯、文化、个人倾向产生差别。任何细节的体验设计,都会给用户传递一个认知,而我们要明白的是,独立个体的认知差异是很大的。
比如:对于“快车”这个概念,刚出来的时候,大众是无认知的,只能找到对标,比如出租车和专车,而快车是介乎于两者之间的一种服务。
如何更好的设计快车体验呢,其实用价格比专车低、比出租车干净舒服、且车多三个认知来传递给用户,就能让用户快速接受并理解。
四、接收需求判断真伪
真需求要满足三个条件
1. 该用户属于目标用户
2. 需求必须符合产品定位
3. 需求能够实现
五、如何分析需求
1、采用用户故事的方式进行分析
需求是结合用户表达的外在欲望、内在的核心诉求以及可用成本的综合评估。
基于这个定论,我整理了一句话,可以作为需求分析的一个评估框架—— 我们为谁用什么方法解决了一个什么问题?
在这句话里,“谁”指的就是我们的目标用户,我们需要明确用户画像;“问题”对应的是前文提到的需求,而“方法”就是我们基于需求提供的产品方案。
我们为谁用什么方法解决了一个什么问题?其实就是在反问我们自己,作为产品经理,你在为哪类人服务,他们的核心诉求是什么,你设计了一个什么产品方案去满足他们的需求。
用户分析,我们可以从用户身份和用户特征两个角度出发,用户是什么人群,年龄、性别、地区等都是构建用户画像的基本素材。
目标用户有什么样的特征,比如职业特征、文化特征等,这些都能帮助我们进一步理解用户。
其次是需求场景,说白了,就是用户是在什么环境和状态下来使用我们的产品。
“场”是时间加空间,“景”是情景和互动。当用户停留在这个空间的时间里,情景互动触发并裹挟用户的意见就是场景。
可以用比较通用的马斯洛需求理论对用户需求进行分析,评估满足的是哪个层级的
需求,或者是通过用户体验五层模型来划分需求层级。
用户价值是从体验和效率两方面来衡量的,一个需求能改善现有体验,那就能提升用户价值,能提高使用效率,也能提升用户价值。
如何衡量体验是否有提升呢,可以用新体验减去旧体验的方式,例如针对某个体验改进,简单粗暴的做法就是新旧体验相减得到的用户投诉率,如果为正,说明用户价值有提升。
而效率则可以通过用户完成某一任务的平均时长来衡量,例如在电商产品中,用新旧总平均成交转化时长的差值来衡量提单效率是否有提升。
商业价值就比较直观了,关乎于成本和利润,互联网传统的商业化方式包括了广告、游戏、会员等。目前也有很多做增值服务和第三方能力输出服务的,这都是商业化手段,同时也会对应到一些产品需求上。
2、马斯洛框架和营销层方式结合起来
做需求调研和分析,最尴尬的结局就是:用户以为自己说清楚了,我们以为自己听清楚了,结果两边就这样整差了。
?在产品上线之前,甚至在进入产品设计阶段之前,我又怎么能知道我做的需求分析已经足够深了呢?
? 行业给出的一般方法是MVP(MinimumViable Product),利用MVP收集线上实际数据。 但MVP只能告诉你,你是错了还是对了,依然解决不了“为什么”以及“应该怎样”的问 题。况且MVP还有覆盖度的问题,怎么设计才能让MVP覆盖所有“应该”被测试的场景呢?
到了1959年以后,马斯洛认为“人本”的导向会产生“自由主义”倾向,从而产生自私、不负责任、不顾他人、自我放纵等自我中心倾向。于是,马斯洛于1969年发表了论文《Z理论 ——两种不同类型的自我实现者》,并依照“超人本心理学”(Trans-HumanisticPsychology)将需求层次理论拆解为三个次理论:X理论、Y理论和Z理论。
依次为:
Z理论
最高需求(超越性灵性需求)
Y理论
? 自我实现需求
? 尊重需求
? 社会需求
X理论
安全需求 生理需求
营销学中的需求分层
在科特勒老师的《营销管理》(15th Global Edition)中,给出了这样一个案例:
表明了的需求:顾客需要一个便宜的汽车;
真正的需求:顾客需要一个养车比较便宜的汽车,而不是价格便宜的汽车;
未表明的需求:顾客希望零售商提供较好的服务;
愉快的需要:顾客希望零售商给装配车载GPS系统;
秘密的需要:顾客希望朋友们将TA看作是懂行的消费者;
有了前面两套框架,我们就守住了需求的来源和表达过程。但是两套框架的用法正好截然相 反:马老师的框架是“5:1”——从五个层次里选一个当前所在的层次;但营销学的需求理论 是“1:5”——拿到一个需求从五个方面来分解。
我们用卖苹果的例子还原一下需求分析的过程:
用户说:“我要买一个苹果”。此时千万不要直接就套上马老师的需求层次了,因为这根本就不是一个“根本性”的需要,而是一个结合了具体产品——苹果的具体需要。
这时应当用的是营销中的五个分类:
? 表明了的需要:我要一个苹果;
? 真正的需要:可能是解决饿肚子,可能是解决馋,更有甚者是解决低血糖的症状等
? 等;
? 未表明的需要:如果为了填饱肚子,就需要个大的;如果为了解馋,就需要味道好
? 的;如果为了解决低血糖,就需要一个更甜的;
? 愉快的需要:吃饱了、解馋了、头不晕了(低血糖的症状之一)当然开心,如果买一
? 送一、免费加工成苹果汁、还能额外加点糖,有可能就更好了;
? 秘密的需要:可能是工作繁忙,接下来还要赶往别处,实在没时间吃别的了;又或者
? 是最近吃胖了,需要用水果当饭吃;
六、评判需求价值
1. 广度:受众人群以及受众面
2. 强度:用户对于需求的迫切程度
3. 频率:间隔时间及可持续性
七、砍需求能力
1. 对需求进行价值评估和量化
2. 关联性较强的需求进行整合
?3. 排列优先级
所有对产品的价值判断,都基于对行业、市场的探知程度;对人性的认识和了解程度(发现没有,把握人性始终贯穿产品的各个层面)
八、对需求分类
九、对需求排优先级
能用是基本要求,能用的标准是产品功能完整、没有异常、逻辑闭环,如果功能或流程缺失,或者产品有bug,那是达不到能用的标准的。
易用对应一些锦上添花的需求,在满足能用的前提下,做流程优化和交互优化,使产品达到用户体验良好的状态。
爱用是让用户形成习惯和依赖,例如我们在朋友圈里发布了很多内容,随着内容增多,我们的离开成本就越高,并且每次都能收到朋友圈的正向反馈,这个闭环就能形 成习惯和依赖。
传播能力使产品具备价值可扩散的属性,满足用户需求并获得市场认可后,需要将价值外延以吸引更多的用户,这是建立在基础功能完备、体验优良,并且满足用户价值 的前提下。
十、如何提升需求分析能力?
1. 倾听
首先是倾听,面对需求方,不论是用户还是运营还是工程师,首先做到先听,这是放下自我做产品的前提。
什么是事实? 客观的原因和现象是事实,基于现象去分析背后的原因,基于原因再形成观点。
2. 观察
其次是观察,观察是最好的洞察用户需求的方式,到用户身边去,看他们做了什么,行动往往反映了用户的真实诉求。
3. 同理心
? 如何切身感受、设身处地呢?最简单的方式就是到用户的环境中去,感受用户不如变成用户。
只有切身感受,尤其是感受到了痛,你才真的理解了用户。
附记:
需求沟通:需求中的需求?
至于怎么讲,我们还可以套用前面的框架——老板跟你说:“你做个需求分析”。
?那么:
表明了的需要:老板需要你做一个需求分析;
真正的需要:老板可能在策划下一款新产品,或者要把一个竞争对手打掉,或者是老板的老板要求下来的,或者......
未表明的需要:时间呢?质量呢?形式呢?汇报对象呢?怎么,你不知道?快问啊!
愉快的需要:老板可能希望你从不同的视角(员工视角、跨行业视角、年轻视角等 等)给出不一样的答案;可能希望你直接做成他能用来汇报的ppt格式,可能......
秘密的需要:老板背负着公司巨大的业绩压力需要寻找突破口、老板“可能”也有自己升职加薪的小算盘......
关于“数据分析的步骤是什么?”这个话题的介绍,今天小编就给大家分享完了,如果对你有所帮助请保持对本站的关注!
本文来自作者[冉山岭]投稿,不代表共度号立场,如若转载,请注明出处:https://goduck.cc/cshi/202503-13725.html
评论列表(4条)
我是共度号的签约作者“冉山岭”!
希望本篇文章《数据分析的步骤是什么?》能对你有所帮助!
本站[共度号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览:网上科普有关“数据分析的步骤是什么?”话题很是火热,小编也是针对数据分析的步骤是什么?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。1...