添加时间:2015/8/19 17:24:46 来源:复旦研修网编 点击数:
【复旦EMBA︱上课记】《数据分析与决策模型》课程随笔
复旦大学EMBA项目
邓水莲
上海锦坤文化传播有限公司联合创始人
复旦EMBA2015春1班
为了上好李文连教授的《数据分析与决策模型》课程,我硬着头皮把第十三版《数据模型与决策》和第十一版《商务经济与统计》啃了好几个晚上,实在难懂!那一堆数字、公式和图表让人头皮发麻。看来这门课要学好,得花点功夫了。
万幸,李老师在第一天课程开始前就宣布说,这门课是不需要预习的!天降甘露,那颗惴惴不安的心,终于如释重负。老师真是仁慈啊,知道我们不懂,所以并不打算讲得太难,以免让我们难堪。可是让非专业的人听懂专业知识,老师必须要深入浅出地把专业知识点讲清楚,这才是高水平的教学啊!
其实,这门课我最想学的还是因子分析和线形回归。在这个大数据时代,数据纷繁复杂而且灵活多变,数据能带给我们什么?关键还是看我们怎么去用这些数据,怎么去挖掘,怎么去发现这些数据里蕴藏的规律和带给我们的启示。
神奇的数字:从数学到心理学
第一天学习下来,脑袋里全部是各种统计学词汇:频数、条形图、饼型图、直方图、打点图、茎叶显示图、帕累托图、X、u、方差、标准差、Z分数……印象最深的就是那个钟型图了,这个图着实好用,对应的经验法则是一个经典中的经典。“几乎所有的数据项的Z分数在-3和3之间。”弄得我这个没做过质量管理的人又对六西格玛管理产生了浓厚的兴趣,课后还特意把收藏很久的《六西格玛管理》的书拿出来翻阅。
数字真是一个神奇的东西,中间蕴藏的规律和奇妙只有懂得这些数字的人才能享受这份神奇带来的喜悦。课堂上李老师做了一个实验,教室里45个同学,请大家每个人写一个数字,在1-400之间任意选择,如果没有至少2个人写了重复的数字,李老师愿现场捐款500元到班费。课堂气氛马上活跃起来,结果现场验证有3组同学写的数字是完全一样的。这个表面上看似可能性很小的事情,其实理性上看概率是很大的,因为根据数据分析,老师赢的概率在90%以上。
概率这个数学上的概念,让我对管理和心理学有了更深的思考。概率密度函数也是正态分布,还是钟型图!从心理学的角度看,大部分人都是“正常人”,人们称那些“3个西格玛之外”的“异常人”为疯子、精神病。岂不知,在这些我们认为的“异常人”眼里,我们却是他们眼里的“异常人”。联想到现在很多企业管理者都在说80后、90后不好管理,其实是相对年长的管理者不懂他们,不同时代出生和生活的人,价值观和心理活动都不一样,这就导致看待一件事情的时候,每个人的标准也不一样。用自己的标准去衡量别人,结果怎么能相同呢?管理制度的制定和沟通方式的协调有没有考虑过这个问题呢?有的企业考虑到了,那落实的怎么样呢?有几个人能真正地丢掉自己的标准,用不同的标准去跟不同的人交往沟通呢?同样,在商业模式设计的时候我们的消费对象变了,之前的商业标准也得随之改变。面对越来越个性化的新新人类,我们的消费者还是正态分布吗?会不会出现动态式的散点图式的消费者分布呢?消费者喜欢同一样商品的概率到底有多大呢?相关的变量都发生了变化,新规律该怎么去寻找呢?
我又想起了战略管理课上老师推荐的《反脆弱》这本书和同一作者写的《黑天鹅》,黑天鹅事件就是那些落在“3个西格玛”之外的异常事件了。然而,作者的观点是,正是这些不可预期的异常事情在影响和改变甚至主宰着我们这个时代的变迁。怎么样去应对这些异常事件对企业的毁灭性打击是企业战略不可忽视的重点。特别是如今的社会发展趋势,长尾越来越明显,异常值会越来越多,对这些异常值的研究会不会意义更大?为此,我又找到一本书《破译黑天额--如何应对未来15年的商业巨变》,希望能找到更多答案。学习的乐趣就在于,当你知道的越多,你就会明白你不知道的东西更多,你就会更加喜欢去学习和思考。
核心的P值:找到最优方案
第三天,老师终于讲到线形回归了,在找回归方程的时候,其实我们小组是似懂非懂,基本思路就是最小二乘法,回归直线尽可能靠近所有点。人的计算能力毕竟不能和软件相比,在老师介绍的MINTAB软件中,我们只需输入数据,马上就能出现回归方程和各大重要参数。
在回归方程的各大重要参数中,其中P值是非常重要的,其意义为单一变量的额外贡献,这让我联想到了公司项目管理中的人员搭配问题,一个团队的工作最优效率如何,其影响因素,即变量太多了,我们以往经常习惯性地把人员的专业能力作为主要衡量依据,而忽略了其他因素。其实,除了专业能力,各成员的性格、合作意愿、彼此的认可、互相配合、甚至当时的情绪、感情等因素都会对最终的工作效率有所影响,放在回归方程里来说,有可能一个成员(常量)同样的工作能力,在不同的项目(回归方程)中体现出来的系数和P值是完全不同的,导致最终的工作效率差别很大,这个时候就不是人员本身的问题,而是管理者没有把人才放在最合适的位置和团队里的问题。万宗归一,从数学角度也可以看出,管理既是科学也是艺术,管理者懂一些回归分析对管理方法和效率还是很有帮助的。
现实环境中,情况之复杂也许远远超过我们的想象,在复杂的环境下,我们要做的可能还是要回归简单,找到最优化的解决方案,当面对多因素变量时,怎么去选择最好的模型就是真正的艺术了。当然,即使是找到了最好的模型,回归也只能推出相关性,而不能推导因果关系,这是我们对回归理解必须紧记的一点。
另外,对于营销咨询公司来说,我们想要的除了这些统计方法、回归方程和各大重要参数之外,其实更想要高质量的数据。怎么样才能得到最接近事实真相的高质量数据呢?因为现在的实际环境下,我们在测量某个因数所得到的数据时,其实是多个因素互相影响而来的结果,因为我们没有办法去塑造一个只有单一因素的真空环境。数据是一切分析的基础,如果数据不正确,再好再优的分析模型也得不到真正想要的结果啊,有时候反而会误导决策人做出看起来合理其实是错误的决策,因为那些数据本身就不是最真实的。
在课程的结尾,李老师介绍了他和其他几位专家合著的书《Applied Linear Statistical Models 》,翻译过来叫《实验设计》,据说这本书里会告诉我们怎么排除干扰项得到单个因素的有效数据。在数据统计分析方面我们国家确实做得不够,那些有用有效的模型和软件几乎都是国外开发的,撇开推动社会的进步不谈,即使是回到商业的本质来看,这才是真正的价值创造!