参考CPDA数据分析师的定义,数据分析师(CPDA)是以数据为依据,对问题现状及远期进行科学的统计、分析、预测并转化为决策信息的专业人才,为解决决策难题提供科学指导依据。请注意,数据分析师工作的侧重点在于解决问题和提供量化决策依据,如果一个数据分析师的工作只涉及到取数和做报表等通用工作,那么他还不能称之为是一名真正的数据分析师。接下来CPDA数据君为大家来梳理一下真正的数据分析流程。
首先,明确问题。上手项目时要想清楚以下几个问题:为什么要对这个任务进行数据分析?分析这个任务或项目是为了解决什么问题?分析目标是什么?分析能够支配的资源和数据有哪些?用什么样的方法对问题进行分析?只有深刻理解做这份工作的目地及相对应的分析思路,才能发挥数据分析工作价值。
第二,数据收集。针对不同场景数据收集方式不尽相同。是选择抽样的小样本数据,还是选择大数据?是采用定性的数据,还是定量的数据?这些都是跟场景紧密相关,我们只有收集到具有代表性的数据才有可能解决问题。

第三,数据探索和处理。原始数据往往都是欠规则的,需要数据分析师进行适当清洗,剔除无效数据。此外,还需要通过探索性分析发现数据中所包含信息,甚至需进行数据转换和规约,方便后续建模。这些工作需要大家对机器学习算法深度理解的基础上进行。
第四,对数据进行深度分析。比如聚类分析、回归分析、分类分析等,这些方法都是针对不同问题的具体方法,数据分析师需要根据具体问题选择方法。

第五,结果分析并提出决策建议。在分析结果基础上给出哪些建议就需要数据分析师理解数据的能力和强大的业务背景。
第六,验证建议有效性并落地执行。我们可以先小范围进行实验,检验这些洞察的有效性,也就是互联网公司常说的“A/B test”,一旦验证了有效,该洞察就可以大范围推广了。
好了,以上就是CPDA数据君为大家梳理的数据分析师在解决问题时的通用工作流程,当然,具体细节还需要我们进行更深入的学习。