当前位置:范文城>生活范本>科普知识>

基本数据分析方法

科普知识 阅读(1.55W)

数据分析方法是通过什么方法去组合数据从而展现规律的环节,那么基本数据分析方法有那些?

基本数据分析方法

  基本数据分析方法

1、常规分析方法

常规分析方法不对数据做抽象的处理,主要是直接呈现原始数据,多用于针对固定的指标、且周期性的分析主题。直接通过原始数据来呈现业务意义,主要是通过趋势分析和占比分析来呈现,其分析方法对应同环比及帕累托分析这两类。同环比分析,其核心目的在于呈现本期与往期之间的差异,如销售量增长趋势;而帕累托分析则是呈现单一维度中的各个要素占比的排名,比如各个地市中本期的销售量增长趋势的排名,以及前百分之八十的增长量都由哪几个地市贡献这样的结论。常规分析方法已经成为最为基础的分析方法,在此也不详细介绍了。

2、统计学分析方法

统计学分析方法能够基于以往数据的规律来推导未来的趋势,其中可以分为多种规律总结的方式。根据原理多分为以下几大类,包括有目标结论的有指导学习算法,和没有目标结论的无指导学习算法,以及回归分析。

其中有指导的学习算法简单说就是有历史数据里边已经给出一个目标结论,然后分析当各个变量达到什么情况时,就会产生目标结论。比如我们想判断各项指标需要达到什么水平时我们才认定这个人患有心脏病的话,就可以把大量的心脏病人的各项指标数据和没有心脏病的正常人的各项指标数据都输入到系统中,目标结论就是是否有心脏病,变量就是各项指标数据,系统根据这些数据算出一个函数,这个函数能够恰当的描述各个指标的数据与最终这个是否是心脏病人之间的关系,也就是当各个指标达到什么临界值时,这个人就有心脏病的判断,这样以后再来病人,我们就可以根据各项指标的临界值。这个案例中的函数就是算法本身了,这其中的算法逻辑有很多种,包括常见的贝叶斯分类、决策树、随机森林树以及支持向量机等,有兴趣的朋友可以在网上看看各种算法的逻辑是怎么样的。

另外无指导的学习算法因为没有一个给定的目标结论,因此是将指标之中所有有类似属性的数据分别合并在一起,形成聚类的结果。比如最经典的啤酒与尿布分析,业务人员希望了解啤酒跟什么搭配在一起卖会更容易让大家接受,因此需要把所有的购买数据都放进来,然后计算后,得出其他各个商品与啤酒的关联程度或者是距离远近,也就是同时购买了啤酒的人群中,都有购买哪些其他的商品,然后会输出多种结果,比如尿布或者牛肉或者酸奶或者花生米等等,这每个商品都可以成为一个聚类结果,由于没有目标结论,因此这些聚类结果都可以参考,之后就是货品摆放人员尝试各种聚类结果来看效果提升程度。在这个案例中各个商品与啤酒的'关联程度或者是距离远近就是算法本身了,这其中的逻辑也有很多中,包括Apriori等关联规则、聚类算法等。

另外还有一大类是回归分析,简单说就是几个自变量加减乘除后就能得出因变量来,这样就可以推算未来因变量会是多少了。比如我们想知道活动覆盖率、产品价格、客户薪资水平、客户活跃度等指标与购买量是否有关系,以及如果有关系,那么能不能给出一个等式来,把这几个指标的数据输入进去后,就能够得到购买量,这个时候就需要回归分析了,通过把这些指标以及购买量输入系统,运算后即可分别得出,这些指标对购买量有没有作用,以及如果有作用,那么各个指标应该如何计算才能得出购买量来。回归分析包括线性及非线性回归分析等算法。

统计学分析方法还有很多,不过在今天多用上述几大类分析方法,另外在各个分析方法中,又有很多的不同算法,这部分也是需要分析人员去多多掌握的。

3、自建模型

自建模型是在分析方法中最为高阶也是最具有挖掘价值的,在今天多用于金融领域,甚至业界专门为这个人群起了一个名字叫做宽客,这群人就是靠数学模型来分析金融市场。由于统计学分析方法所使用的算法也是具有局限性的,虽然统计学分析方法能够通用在各种场景中,但是它存在不精准的问题,在有指导和没有指导的学习算法中,得出的结论多为含有多体现在结论不精准上,而在金融这种锱铢必较的领域中,这种算法显然不能达到需求的精准度,因此数学家在这个领域中专门自建模型,来输入可以获得数据,得出投资建议来。在统计学分析方法中,回归分析最接近于数学模型的,但公式的复杂程度有限,而数学模型是完全自由的,能够将指标进行任意的组合,确保最终结论的有效性。