当前位置:范文城>生活范本>科普知识>

数据统计与分析方法

科普知识 阅读(3.2W)

导语:今天很高兴能够与大家做一次针对数据分析的分享。我以数据分析人员的身份,曾参加过数次的数据分析项目,在这些项目中也间接地参与了大数据系统的搭建,今天也是希望能够跟大家聊一聊我对数据分析的一些想法。

数据统计与分析方法

  一、以往的数据分析

在今天的各类型企业中,数据分析岗位已经基本得到普及和认可,这个岗位的核心任务往往是支撑运营和营销,将企业内部的数据,客户的数据进行分析和总结,形成以往工作情况的量化表现,以及客户的行为趋势或特征等。

如果从更宏观的角度来认识数据分析岗位的话,每一个数据分析人员都明白,其实数据分析岗位要达到的目标就是希望通过数据来发现潜在的规律,进而帮助预测未来,这一点同数据挖掘的目标一致。那么为什么在大多数公司都已经具备的数据分析岗位基础上,今天却还是在反复提到数据挖掘这个概念,我们就需要来看看数据分析都有哪些是没有做到的内容。

1、数据分散

多数数据分析岗位在公司中的岗位设置是隶属在单一业务部门中作为一个支撑岗,只有少数的公司是将数据分析作为一个独立的部门。其差异性在于,前者的数据分析所能分析的内容仅限于自身部门所输出的指标,比如投诉部门只看投诉处理过程中的数据,销售部门只看销售过程中的数据,一旦涉及到需要将各类指标汇总分析的情况,这种组织架构就会带来极大的负面影响,由于不同部门具备自己部门指标导出的权限,且与其他部门的配合并不影响绩效任务,所以这种跨部门采集数据的过程往往效率奇低。而数据分析最关键的就在于汇集更多的数据和更多的维度来发现规律,所以以往的数据分析多是做最基础的对比分析以及帕累托分析,少有使用算法来对数据进行挖掘的动作,因为越少的指标以及越少的维度将会使得算法发挥的效果越差。

2、指标维度少

在以往的企业中,数字化管理更多的体现在日常运维工作中,对于客户端的数据采集虽然从很早以前就已经开展,CRM系统的诞生已经有很久的时间了,但是一直以来客户端的数据维度却十分缺失,其原因在于上述这些途径所获得的数据多为客户与企业产生交互之后到交互结束之间的数据,但是这段时间只是这个客户日常生活中很少的一部分内容,客户在微博,微信上的行为特点,关注的领域或是品牌,自身的性格特点等,可以说一个客户真正的特点,习惯,仅通过与企业的交互是无从知晓的,因此难以挖掘出有效的结论。

3、少使用算法

在上述制约条件下,可想而知数据分析人员对于算法的使用必然是较少的,因为数据分析依赖于大量的指标、维度以及数据量,没有这三个条件是难以发挥算法的价值的,而在排除掉算法后,数据分析人员更多的只能是针对有限的数据做最为简单的分析方法,得出浅显易懂的分析结论,为企业带来的价值则可以想象。

4、数据分析系统较弱

目前的数据分析多采用excel,部分数据分析人员能够使用到R或SPSS等软件,但当数据量达到TB或PB单位级别时,这些软件在运算时将会消耗大量时间,同时原始的数据库系统在导出数据时所花费的时间也是相当长的,因此对大数据量的分析工作,常规的系统支撑难以到达要求。

  二、技术革命与数据挖掘

得益于互联网对于人们生活的影响逐渐增大,我们发现数据正在疯狂的增长。今天一个人一天的`时间中有将近一半是在互联网中度过的,一方面这些使用互联网的交互都是能够被捕捉记录的,一方面由于碎片化时间的使用,客户与企业交互的机会也变的越来越频繁,进一步保障了客户数据的丰富。同时在大数据技术的支撑下,今天的系统能够允许对这些大规模的数据量进行高效的分析。

因此数据分析人员也能够开始使用一些较为抽象的算法来对数据做更为丰富的分析。所以数据分析正式进入到了数据分析2.0的时代,也就是数据挖掘的时代了。

  三、数据处理流程

数据分析也即是数据处理的过程,这个过程是由三个关键环节所组成:数据采集,数据分析方法选取,数据分析主题选择。这三个关键环节呈现金字塔形,其中数据采集是最底层,而数据分析主题选择是最上层。

  四、数据采集

数据采集即是如何将数据记录下来的环节。在这个环节中需要着重说明的是两个原则,即全量而非抽样,以及多维而非单维。今天的技术革命和数据分析2.0主要就是体现在这个两个层面上。

1、全量而非抽样

由于系统分析速度以及数据导出速度的制约,在非大数据系统支撑的公司中,做数据分析的人员也是很少能够做到完全全量的对数据进行收集和分析。在未来这将不再成为问题。

2、多维而非单维

另一方面则在于数据的维度上,这在前边同样提及。总之针对客户行为实现5W1H的全面细化,将交互过程的什么时间、什么地点、什么人、因为什么原因、做了什么事情全面记录下来,并将每一个板块进行细化,时间可以从起始时间、结束时间、中断时间、周期间隔时间等细分;地点可以从地市、小区、气候等地理特征、渠道等细分;人可以从多渠道注册账号、家庭成员、薪资、个人成长阶段等细分;原因可以从爱好、人生大事、需求层级等细分;事情可以从主题、步骤、质量、效率等细分。通过这些细分维度,增加分析的多样性,从而挖掘规律。