查看原文
其他

数据分析的精进之道

林骥 林骥 2022-10-26

林骥的第 44 篇原创文章

0. 序言


2019 年 9 月 16 日,我参加了秋叶书友会第 7 期共读计划,这一期共读的书是《精进 2 》,作者采铜,浙江大学心理学博士,2016 年出版的《精进》广受好评,多次霸占各大图书排行榜的榜首。


在《精进 2 》中,采铜老师想要回答的一个核心问题是:在现代社会,什么样的学习方法更有效?为了回答这个问题,采铜老师从一支普通的铅笔开始,生动地阐释了观察事物的 4 种视角:材质、造型、装饰、工艺


我把自己所学的一些知识关联起来,迁移到数据分析领域,来“盘一盘”数据分析的精进之道。


1. 数据分析的材质


如果我们仔细观察,会发现大多数事物的材质是“复合型”的,不同材质之间优势互补。比如说,普通铅笔的材质,主要包括木杆和墨芯,一硬一软,默契配合,很好地体现了物尽其用的精神。


材质是“复合型”的特点,不仅体现在实物上,而且还体现在虚构的文学作品里,那些脍炙人口的作品,表面上你以为写的是“这个”,背后其实写的是“那个”。比如说,在金庸的武侠作品中,表面上看是武侠小说,背后其实展现的是人情。


迁移到数据分析领域,数据分析的材质,我认为主要包括分析工具和分析思维,例如:Excel、Python、SQL、R、SAS、SPSS、Power BI 等分析工具,还有对比、细分、溯源、相关、假设、逆向、演绎、归纳等分析思维



分析工具,是数据分析师必备的硬件模块,它就像数据分析师的另一双手。分析思维,是数据分析师必备的软件模块,它就像数据分析师的另一个大脑。如果一个数据分析师在自己的岗位上,没有提升自己应用分析工具和分析思维的能力,那么他的职业道路可能是很危险的。


在数据分析领域精进的道路上,通常会经历从“规范学习”、到“自由创造”的过程。首先从学习硬技能开始,然后再学习软技能,随着学习的不断深入,会发现模块种类还不够多,所以要引入新的模块,从而组合方式更加多样,于是产出也就变得更加多元和自由。


比如说,一个刚入行的数据分析新手,往往是从简单的 Excel 表格开始,掌握 Excel 的函数、公式、数据透视表、数据可视化等等,然后学会运用对比、细分、溯源等分析思维,当水平到达一定高度以后,继续深入学习  Python、SQL 等分析工具,以及相关、假设等分析思维,把硬件和软件恰当地组合在一起,就能发挥出强大的力量。


我很喜欢书中的一句话:“硬件足够硬,软件足够多,这便是一个人才能的护城河”。


2. 数据分析的造型


我们看见的东西,都可以抽象成几何体的组合。比如说,普通铅笔的横截面,是个六边形。从微观上看,铅笔的墨芯是由无数个六边形碳原子联结而成的。在日常世界和微观世界之间,出现了有趣的“同构”现象。


在数据分析领域,数据可视化的图表就有很多种造型,包括柱形图、条形图、折线图、散点图、气泡图、饼图、圆环图、箱线图、密度图、玫瑰图等等。


(点击图片可查看详细介绍)


京剧大师梅兰芳的表演,即“合理”,又“美观”。迁移到数据分析领域,我们也可以从合理和美观两个维度,对数据可视化的 10 大黄金准则进行评判:


  1. 明确数据可视化的目的;(合理)

  2. 通过对比来反映问题;(合理) 

  3. 提供数据指标的业务背景;(合理) 

  4. 通过从总体到部分的形式,展示数据分析报告;(合理、美观) 

  5. 联系实际的生产和生活,对数据指标的大小进行可视化;(合理、美观) 

  6. 通过明确而全面的标注,尽可能消除误差和歧义;(合理、美观) 

  7. 将可视化的图标,同听觉上的描述,进行有机的整合;(合理、美观) 

  8. 通过图形化工具,增加信息的可读性和生动性;(合理、美观)  

  9. 允许但并非强制,通过表格的形式,呈现数据信息;(合理)  

  10. 让受众思考呈现的数据指标,而非数据的呈现形式。(合理)


我们在日常工作中,也要经常问一问自己:这个数据合理吗?这个图表美观吗?不断地进行优化调整,只有这样,才能持续精进。


3. 数据分析的装饰


一件产品的装饰,体现了这件产品的“风格”或者说“气质”,如果仔细观察,还能学到一些知识。比如说,普通铅笔的六个侧面中,三个面刻字,三个面留白,为什么这样设计呢?为了理解这一点,我特意去买了一支中华牌六角铅笔,拿在手里旋转着看,无论怎么旋转,至少都能同时看到两个侧面,每次都能看到侧面上的刻字和留白,显得很和谐,正好符合“合理”和“美观”两个标准。


迁移到数据分析领域,如果仔细观察数据图表的装饰风格,那么也能从中学到一些知识。比如说,玫瑰图是饼图的一种变形,最早是由一个叫南丁格尔的英国护士发明的,大约在 1856 年的时候,南丁格尔利用玫瑰图的视觉效果,成功地让数据得到当时高层的,从而医事改良方案得到支持。



虽然玫瑰图展现的形式大于内容,但是在南丁格尔当时的历史环境中,也有其合理性。


数据可视化要特别注意应用的场景,要加以合理运用,否则可能会适得其反。在我们的日常工作中,建议不要使用过于花哨却不实用的图表,而要更加注重传递信息的有效性,同时兼顾合理和美观


4. 数据分析的工艺


工艺,是指对原材料进行加工和艺术改造,使之成为成品的方法和过程,其中有可能包含着一些通常想像不到的智慧。比如说,铅笔的制作工艺,有人可能会想当然地认为,就是把墨芯插进的木制外壳里面。但经过仔细端详和推测,就会发现一个更合理的铅笔制作工艺,大致包括三个步骤:


第一步:取一个木制的“半壳”,凹面朝上放置。


第二步:把圆柱形的墨芯放置在“半壳”中。


第三步:把另一个木制的“半壳”,覆盖在上面。


迁移到数据分析领域,对用户的数据进行分析,一种简单的方法,就是按性别、年龄、地区等特征进行分类,然后贴标签,构建用户画像。但更真实的情形是,需要对用户的各种相关数据进行深入地研究,通过细致的分析,洞察其中真正有价值的“隐藏知识”。


隐藏知识往往来源于实践,在商业世界中非常重要。比如说,一种好吃的酱汁,不要小看它所封装的知识,也许是某一位大厨几十年经验的总结,是某些餐饮连锁企业成功的关键。


在做数据分析的时候,经常会遇到三个问题:是什么?为什么?怎么做?第一个问题是“结果”,第二个问题是“原因”,第三个问题是“过程”。数据分析的工艺,通常就体现在这个“过程”之中,而提出有效的行动建议,正是数据分析的价值所在。


5. 数据分析师的层级


从限制到自由,从新手到专家,都是一个循序渐进的过程,通过无数次的循环刻意练习,不断进化,螺旋形上升。要想登顶最后的阶段,前面的学习是必不可少的,否则根基不稳。


如果将德雷福斯技能习得模型,应用于数据分析师的层级,那么助理数据分析师算是新手,需要在指导下行动,数据分析师属于胜任者,能处理繁重的任务,资深数据分析师属于精熟者,能发现问题中最重要的部分,下表中的“层级2”都属于数据分析专家,具备洞察“其他可能性”的视野。



6. 小结


虽然世界复杂多变,但是有些普遍适用的规律,我们可以主动去把握。


在《精进 2 》中,采铜老师博采众长,大约用了 20 万字,分 8 个章节阐述了有效学习的方法


我在读这本书的时候,就在思考本文的谋篇布局,试着把书中一些方法迁移到数据分析领域,探索数据分析的精进之道


本文前前后后不知道修改了多少遍,力求完美,希望能够唤起你的共情,引发你的思考和行动。


下面这张思维导图是书中的精华



敬请关注林骥的微信公众号,并设为星标⭐️,别嫌麻烦,这样才能在第一时间看到后续的文章更新,不错过干货。


长按二维码关注


欢迎在文章下面留言交流,我们一起用数据化解分析难题,让数据更有价值,让分析更有效。


记得转发和点一点「在看」,感谢你的支持!


猜你喜欢


数据分析的 8 种思维

数据分析的 4 个层面

数据分析的思维与工具

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存