本次讲的是三个基础的预测方式,对照预测和细分预测方式。这三个方式在今后的预测工作中几乎处处要加进,这也是基本的统计数据挖掘思路,所以提前到这儿来讲。

一、对照预测方式对照预测方式在本质上是透过统计数据计算方式来认定三个解决计划的优劣两个常见的范例是:同两个B2C中文网站上的货品A和货品B,哪两个对中文网站重大贡献更大呢?按常规的权衡销量的方式或许足以展开全面性的对照,在这儿我们要综合性权衡用户数量、转换率、货品关注度才能更全面性的评估结果三个货品对中文网站的重大贡献。
1、对照预测方式的较为计算结果较为计算结果的预设是统一对照基层单位的关键关键步骤,预设方式分别是:比率打分平均值法、技术标准分项分拆法1.1 比率打分平均值法“比率打分平均值法”是将分项的值都转换成比率的形式,两个通用有效率的方式就是将大部份分项都乘以总体的最小值,这个方式对大部份大于0且分布不是特别对数的分项都是很有效率的。
举个范例说明——从下面的表单中知道,4种货品中用户数量最低的是货品A的563 ,转换率最低的是货品B的9%大部份货品的用户数量乘以563,转换率乘以9%,接着获得各自的比率打分,接着将一列打分做简单平均后获得综合性打分。

或许,透过较为综合性打分来判断货品在表现更科学合理如果权衡的再全面性些,针对不同货品的关键性预设权重股,结论更能R210的评估结果货品的优劣比如,上面表单中采用平均数平均的方式,货品的综合性打分又发生了变化,如下表所示图至于与否平均数,以及各分项的权重股如何预设,则能根据预测的须要和分项的特征来确定。

1.2 技术标准分项分拆法“技术标准分项分拆较为法”是用技术标准的方式除去各分项基层单位的影晌后再展开分拆较为的方式统计数据的技术标准是将统计数据按比例翻转,使之落入两个小的特定区间 公式为 X=(x-u)/σ (U代表者平均值,σ 代表者标准差)。
举个范例——如下表所示表单中统计数据,Bounce Rate来衡量进入,转换率CR来衡量工业生产。A、B、C三个强化计划哪个才是最强化的呢?

将各分项技术标准后取平均值展开较为,我们能看出A计划最强化2、对照预测方式的“试验自然环境”预设展开对照预测的关键前提是三组参数可于同样的前提下对照才有意义这时候就须要人为地去预设科学合理的较为自然环境了,即统计数据挖掘的“试验自然环境预设”。
试验自然环境预设法有三种:如前所述天数字符串的第四组较为如前所述对照试验的复训较为2.1 如前所述天数字符串的第四组较为如前所述天数字符串的第四组较为:一般是在天数字符串上的某个天数点施予试验剌激,并在试验剌激的前后展开重复测试较为,从较为的结论反映试验剌激与否对结论有影响。
举个第四组较为的流程范例——公司前4个月薪水正常,在第5个月开始给员工减薪(施予试验剌激)这时就能透过观察之后4个月和之前4个月员工的工作效益和工作满意度,来判断这个试验刺激与否对提升员工工作效益和工作满意度有效率果。
2.2 如前所述对照试验的复训较为如前所述对照试验的复训对照:一般是在同一天数预设三组样本,(试验组和控制组),接着对试验组施予试验剌激,控制组维持原状态不变透过对试验组和控制组较为来判断试验的剌激与否对结论有影响。
举个复训较为的流程范例——拿前面范例来说假如只让部分员工涨薪,再去较为未涨薪的员工和涨薪的员工前后4个月的工作效益和工作满意度的差异,如果差异显著就能证明涨薪这个试验剌激对结论是有显著影响的2.3 特殊情况下,试验自然环境如何预设。
有时候会遇到无法提供试验的对照自然环境,那该怎么做呢?举例说明。如下表所示表:有活动前和活动中各5天的统计数据。以订单数作为分项,说明活动能否显著提升每天的订单量。

由表中统计数据可发现:每天的用户数本身就是两个递增的状态,活动也带来用户数的提升那么,订单数的提升是由于用户数的提升带来的,还是活的效果带来的呢?不权衡统计数据本身的自然增长,直接较为活动前后日均订单数的差异;。
将统计数据的自然增长权衡进去,能将日均用户数的增长率作为整个中文网站统计数据的自然增长率这样,较为的结论就发生了改变活动前的曰均订单数乘上自然增长率后要比活动中的曰均订单数高,从结论看活动对订单数的提升无显著影响。
当然,直接较为活动前后的人均订单数也能得出结论但是用上面乘以自然增长率的方式还能进一步评定活动带来的效果如果活动促进了订单数量的增长,我们能估算出活动期间日均订单的增加量是多少,这样就能直接考核活动的绩效。
二、细分预测方式细分预测的目的是为了看清问题真正的所在,从而找到解决办法,细分预测是指将分项与维度相互组合例如中文网站报告一般都是中文网站统计数据的综合性情况,包括中文网站的总用户数量、总停留天数、总销售量等但是我们不知道用户在不同页面、不同内容、不同渠道的停留天数以及用户数量,也就是说这些汇总统计数据无法对不同属性的流量展开正确的判断。
所以,无论是从用户还是从中文网站的角度,流量细分都是很关键的

1、分项和维度的类型分项是用来记录访问者行为的数字,维度是用来提供观察访问者行为的一种角度,维度必须与分项在一起时才有意义分项又可分为基本分项和复合分项,常见的基本分项有访问次数、综合性浏览量等,常见的复合分项有访问深度、跳出率、平均中文网站停留天数、新访次占比等。
常见的维度类别有访问者属性维度、天数维度、流量来源维度、地理维度、内容维度和系统维度等

2、细分范例例如某日,你的老板说:我想知道2015年5月9日北京地区使用Safari浏览器在Google搜索“蓝鲸”关键词并点击了自然排名结论的访问次数听完这个需求后,你可能感觉有点晕,好多的前提混在一起,这个统计数据要如何获得呢?其实包含了6个维度和1个分项。
这6个维度和1个分项分别是 :天数维度——2010年3月10日地理维度——北京地区浏览器维度——Safari浏览器流量来源维度—— Google流量属性维度——自然排名结论关键词维度——”蓝野”分项——访问次数
而这个预测过程也很快,5分钟就可搞定,关键步骤如下表所示:

当然,如果嫌操作太复杂的话也能透过标记用户群展开自定义细分常见的标记用户群方式有:透过用户访问特定的页面对其展开分类;透过用户点击特定的链接对其展开分类;透过用户的自主选择对其展开分类当然,细分前得分清非注册用户、新注册用户、已注册用户。