查看原文
其他

大数据也是个江湖: 关于腾讯大数据“购买iPhone人群普遍无房无车学历低”的一地鸡毛

傅一平 与数据同行 2021-10-16

点击上方蓝字关注公众号

请您点击“与数据同行”以“关注”,关于数据的实践与思考,每周一我在这里等你!

作者:傅一平  博士 就职于浙江移动大数据中心 

腾讯大数据3月9号发布了一个大数据报告《从HUAWEI Mate 9看国产高端手机市场》,最近几天突然有媒体解读这份报告,提到:“近期腾讯一份报告显示,用苹果手机主要是屌丝。根据腾讯大数据的分析,在Mate 9、iPhone 7、三星S7这三款手机的使用人群中,华为以男性/高学历/中青年/高管为主;苹果以女性/中学历/青少年/职场新人为主。购买iPhone 7的人群普遍无房无车学历低!”

有报告为证: 

然后出现反驳帖《用iPhone7的普遍无房、无车、学历低?腾讯大数据惨遭移动打脸》的文章。

“随之而后,更是引来XX运营商的直接打脸,移动数据表明,iPhone在企业中高层中据绝对优势地位,但iPhone7的使用率逊于iPhone6。iPhone6用户今年可能将迎来大规模换机潮。

移动的相关数据表明,iPhone 7用户大约是华为MATE9用户的7倍,78.2%中高层使用iPhone 7,18.3%使用华为MATE 9。但MATE9用户中的年龄确实更大,平均年龄比iPhone7用户大7岁。”

各大网站纷纷转载,在乱花渐欲迷人眼的各类评论中,到底真相是什么?由此延伸开来,面对网上到处充斥着各类的大数据报告和统计数据,我们未来到底应该信谁?

首先不要去做键盘侠,不要一上来就凭着主观认识站好队,比如一看到华为和苹果就自然想到国产和国外品牌之争,由此延伸到爱国,由此关联到自己身边的人和事来证明自己的看法,人类简史说的好啊,大脑有一个本事就是善于联想,善于编故事,其在促成人类进程中发挥了至关重要的作用,但是,我们不能被自己的直觉大脑蒙蔽。

凡事理性的去做分析,用逻辑去判别事情的真伪,不要人云亦云,是作为一个理性的人,一个数据人应该具备的基本素质。

这里就以这份报告为例,谈谈我的理解。

首先不要轻信别人转载的东西,别人家的东西要努力去核实,笔者查了下,发现腾讯这篇报告竟然早在3月份就发布了,发布的地方是腾讯大数据微信公众号,名字叫《从HUAWEI Mate 9看国产高端手机市场》,其实一看名字就知道这是一篇很“正面”的HUAWEI Mate 9的文章,当然,不能不看内容就说是激励文章。

其实这篇文章内容根本没有其他媒体转载的那样用词激进,一比对就出现大量不符合,媒体说“近期腾讯一份报告显示…”,其实不是近期,明明是3月份,数据还是12月第四季度的,都过了大半年了,手机市场风云变幻,即使腾讯报告原来说的对的,现在9月份也缺乏了依据,数据分析中时间是核心的一个维度,个别媒体这么爬灰,不得不让人怀疑用心了,这是第一个纰漏。

其次,个别媒体用了较激进的词做出总结:“购买iPhone 7的人群普遍无房无车学历低”,在腾讯的报告中,其实也没有这么提及,关于无房的判断也是个笑话,明明从图中看到Mate 9和IPHONE 7有房的比例是差不多的,只是另一个指标想买房一族IPHONE 7比例高一些,怎么曲解成了无房人士的特征?那Mate 9买房意愿低是否可曲解为没买房能力啊?其实这个指标好理解,IPHONE7的年轻人多一点,因此肯定想买房的多,但这个群体有房的比例也不低。

但在腾讯报告中,很多没有具体数据的说明,比如很多图标坐标都没有,大家都知道统计和图表的艺术,有本书叫作《统计陷阱》可以看下,设想比例差0.1个点,图表也能通过鬼斧天工的艺术画出差距很大的效果,这样分析师想要表达什么样的观点,就可以表达什么样的观点,这不符合客观精神,也会给人以误导。

三款手机都是高端品牌,其实这些图表只能反映相对的事情,而不能下绝对的判断,比如“购买iPhone 7的人群普遍无房无车学历低”,在说这句话前,必须加上定语与华为Mate9的人群相比,而不是单独拉出来吸引眼球,一些媒体习惯了这样说,但看的人要长个心眼。

大数据报告更客观的做法,应该是列出所有图表的TGI数字,同时标明统计数据的口径和来源,其实可质疑的东西很多,比如怎么判断职场新人?调研来的?样本多少?是全国还是部分区域的?哪个时间段的数据?家里有住房怎么判断的?想买房怎么判断的?如果是手工调研得到的,也不能算是大数据了。

其实如果没有这些数据来源和口径的说明,任何人都可以对其数据的真伪性进行质疑,这份报告也不要当真,更不值得评论。

接下来再说说反驳的那篇文章有没有理,其实有些比较跟腾讯不在一个点上,比如反驳的报告提到78.2%中高层使用iPhone 7,18.3%使用华为MATE 9,但腾讯大数据报告中是使用MATE9的所有用户中中高层的比例,两者不是一个指标,不具备可比性。

前者的计算公式是:中高层的用户中使用MATE 9的用户/中高层的用户

后者的计算公式是:MATE 9用户中的中高层用户/MATE 9用户

真是一地鸡毛,其实想想也明白,由于IPhone7基础大,因此IPhone7中中高层的比例当然会偏低一点,腾讯大数据报告提的也没错。

结论就是:在中高层用户中IPhone 7的比例比MATE9更高,MATE 9中中高层的比例比IPhone 7的高,谁都没毛病,谁都有前途。

大家这回知道统计的艺术了吧,要说你好,你就好,要说你不好,也总有其他的角度,全赖口径,但有多少大众能看到这里面的微妙关系呢?也许事物本来就是这样,有了江湖就会有利益,有利益就会有纷争,大数据也是个江湖啊,因此我们必须有自己的判断,否则就被愚弄了。

最后说下,运营商拥有的大数据的确可以较为准确的统计到这些终端数据,而且口径可以透明化,下面简要做个描述。

1、年龄数据:从运营商的用户实名资料中,可以方便的得到用户真实年龄,毕竟有身份证信息,这是非常核心的用户注册资料

2:终端数据:用户每次通话或上网根据通信协议终端都会自动上发串号信息到基站,因此运营基于计费话单可以识别到每个用户的终端串号,并且跟手机号码是一一对应的,其终端数据应是业界最实时和真实的,质量非常高,笔者以前有一篇文章《终端企业需要什么样的终端分析报告》专门做过介绍

3:中高层职业数据:运营商可以通过维系的集团客户信息中的重要和关键人员属性信息进行判断,也可以通过运营商通信交往圈的pagerank分析挖掘到一个企业的核心人物,其它诸如集团彩云等通信录信息也能提供一些辅助。

希望玩大数据的都有这个勇气。

历史足迹

传统BI的认知:

《我们需要什么样的ETL?》

BI一线管理者的二次创业?

《十幅图读懂BI自助取数系统!》

《为什么传统BI没前途?》

《为什么BI取数这么难?》

《BI自助取数是怎么炼成的?》

《报表系统的雄心? 》

《重新认识数据可视化》

《为什么数据挖掘很难成功?》

《如何才能做好一张报表?》


大数据的实践:

《大数据运维的思考》

《企业的数据中台的价值》

《部门有界,数据无界,大数据需要大胸怀》

《一个传统企业大数据发展的编年史》

《决战大数据的对内运营》

《为什么选择这样的大数据平台架构?》

《从“培训计划”说起,传统企业要培养自己的大数据人才》

《为什么没人愿意为大数据洞察报告买单?》

《业务人员的革命:从大数据运营是一台“戏”开始》

《我们需要什么样的大数据培训?》

《大数据需要什么样的合作伙伴?》

《不忘初心,大数据不是IT的狂欢!》

《大数据,悟道2016》

《我们缺什么,一次大数据头脑风暴的启示!》

《一个大数据应用是如何炼成的? 》

《一只传统企业大数据平台团队的绽放!》

《大数据,为什么不是传统BI的简单升级?》


数据管理的领悟:

《从DAMA出发,一个指标库到底是如何炼成的?》

《一本数据字典的三生三世》

《思考|谈谈数据管理的原则》

《重装上阵-大数据管理的实践和思考》

《我如何完成一本企业数据字典的编写!》

《为什么数据管理工作很难成功?》

《七幅图读懂企业的数据字典》

《六把武器? 谈谈DT时代的大数据资产管理》


数据人员的修养:

《用数据说话:一份不算总结的半年度总结》

《这五个灵魂问题,解决BI新人80%的困惑》

《数据分析师的自我修养》

《为什么有些人用3年的时间获得了你12年的数据分析经验?》

《经营分析师如何进一步提升自己的境界》

《数据从业者与PPT的进阶》


运营商大数据:

《运营商大数据运营的现状及思考》

《浙江移动发布手机终端大数据分析报告》

《联通的大数据反欺诈,依赖互联网公司靠谱吗?》

《电信运营商的反欺诈系统不会侵犯用户隐私!》

《DPI大数据之战,运营商的艰难抉择》

《PK BAT大数据?谈谈运营商大数据的价值》

《唯有数据创新,运营商才能实现大数据变现的突破》

《逆袭 | 运营商吸引大数据人才的七个优势》


我的读书笔记:

《理解深度学习的钥匙–参数篇》

《理解深度学习的钥匙 –启蒙篇》

《读吴军的智能时代

《如何清晰的理解区块链?》

《我如何理解深度学习?》

《进阶: 产品启示录》

《黑客帝国的前奏:工业大数据的崛起》

《互联网广告:大数据变现的颜值担当》

与数据同行

ysjtx_fyp

长按二维码识别,关注此号!


视频 小程序 ,轻点两下取消赞 在看 ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存