标签归档:统计学家

数据科学家的崛起

美国2012总统大选是奥巴马的胜利,但实际上也是统计学家的胜利。奥巴马当选之夜,我看见推特上有一条消息被疯狂转载:

NATE SILVER ELECTED 44TH PRESIDENT OF UNITED STATES

当然这是一句玩笑话,但Nate Silver是谁?他号称“竞选预测之神谕”:2008年的总统大选他预测对了最终结果,而且美国50州的投票结果他预测对了49个;今年的大选他又预测对了,并且是50州全对。Silver是一名统计学家,毕业于芝加哥大学,随后在毕马威会计师事务所“度过了令自己后悔的四年时间”(不喜欢那里的工作),后来转向预测棒球选手的成绩,再后来转向政治方面的数据分析和预测。总统大选的预测是一件噪声很大的工作,各家有各家的预测和分析,各种突发事件可能会导致某位候选人的支持短期内大幅变动。Silver的工作就像机器学习中的“集成学习”(他自己的描述是“贝叶斯统计”,用自己的先验信息和数据得到后验),集合众多民意调查结果,根据自己的经验判断去平均它们(具体过程我不清楚)。 继续阅读数据科学家的崛起

统计学论文的发表流程、及统计学家的晋升和合作(内幕)

统计学论文的发表流程、及统计学家的晋升和合作(内幕)这标题很吸引人,所有统计学相关领域的人可能都关心这几件事,但敬请降低对本文的期望。我不能再多说,否则要剧透了(看过的朋友也请不要剧透)。这段35分钟的视频讲述了统计学论文是如何发表的、统计学家在机构内如何得到晋升(影响晋升的指标),以及统计学家和生物学家如何交流和合作的种种“内幕”。新年伊始,我们也不想用大篇技术文章来“折磨”统计之都的读者们,那么,开始欣赏这部小电影吧:

(观看本视频可能需要安装QuickTime,视频为MP4格式)

本视频来源于Johns Hopkins Schools of Medicine and Public Health的Steve Goodman教授,已获得作者授权发布。欲转载者请自行联系原作者。Goodman教授在授权同时也表达了他对文化差异的担心,可能会有人看不懂这个片子的真正意思。如果你看完这个片子之后觉得气愤或不解(相信应该没有这样的人),请尽管联系我(谢益辉)给你解释。

我想补充说明的是视频的第三部分,尽管我前面的“内幕”打了引号,但这里反映的其实也是一种现实:统计学家和其它专业的人打交道经常互不理解,鸡同鸭讲。这在COS论坛上也经常出现——提问的人通常夹杂太多专业术语,让统计人摸不着头脑;实验设计、数据和问题被淹没在术语中,理不清头绪。反过来也一样,统计学一会儿一个纵向数据,一会儿一个随机效应,这种方差结构那种距离量度。从某种程度上来说,随着学科的深化发展,这种现象的出现是不可避免的。关于这个问题,用下面的图示来解释再清楚不过了。

附:攻读博士的全流程

以下文字和图片来源于“The Illustrated Guide to a Ph.D.”,遵循CC许可证“署名-非商业”,作者为Matt Might

Imagine a circle that contains all of human knowledge:

By the time you finish elementary school, you know a little:

By the time you finish high school, you know a bit more:

With a bachelor’s degree, you gain a specialty:

A master’s degree deepens that specialty:

Reading research papers takes you to the edge of human knowledge:

Once you’re at the boundary, you focus:

You push at the boundary for a few years:

Until one day, the boundary gives way:

And, that dent you’ve made is called a Ph.D.:

Of course, the world looks different to you now:

So, don’t forget the bigger picture:

Keep pushing.