统计与数据科学专业学什么?
UW-Madison 统计系(MS)2016 年新生秋季课程表,一共六门课加一个实习。 除了最后一门课外,其他都是必修。第一门的随机过程和第二门的统计学习都是难出天际的大课(一百多个人一起上的那种),学不完,只能学一半。第三门数据挖掘是统计系和计算机系的交叉学科,偏算法,也是难出天际。第四门数据科学导论是个小杂耍课,介绍各种统计学基本概念、理论和方法。第五门数据分析是计科院开设的,讲SQL 和 R 语言。最后是实习,各个小组做各自的data project. 这个项目的核心就是上图中黄色的三本书,其中红色的那本是最难的,绿色的是统计学习方面的经典教材,蓝色的是 UWSOM 的数据科学课程大纲。虽然叫statistics,但这门硕士项目其实是以data science 为导向的,强调应用和学习新的方法来解决问题。
我读这个项目的时候,老师上课基本上不会详细介绍理论推导(除了一些必要的基础知识),所有的内容都是以应用为主。比如学习回归的时候不会花一周的时间讲为什么要用回归,怎么用最小二乘法估计模型参数,而是直接给同学们看实际的例子——什么样的数据适合做回归,如何做回归分析能解决具体的问题。这样的教学方式让项目的同学能在最短的时间里学到最多的实战技能,但是比较缺乏理论基础。不过这种教学方法也让我之后在自学其他内容的时候能够比较容易地衔接上来。