标签归档:数据科学家

COS访谈第十一期:郁彬教授

【COS编辑部按】:受访者:郁彬             采访者:施涛

原文刊登于ICSA。本文由COS翻译组策划翻译。译者是密西根大学的冷静、新加坡国立大学的尤晓斌和中国人民大学的霍志骥,全文最终由采访者施涛和被访者郁彬审核、修改、定稿,个别地方对英文原文作了补充。本翻译征得了ICSA、郁彬和施涛的同意和支持,在此表示诚挚的谢意。此外,陈丽云、高涛、肖楠、牟官迅、邓一硕、姜晓东、邱怡轩、魏太云对译文也提出了一些修正建议,在此一并表示感谢。

郁彬是加州大学伯克利分校统计系和电子工程与计算机科学系的Chancellor’s Professor。她曾在威斯康星麦迪逊和耶鲁大学都任过教,并且曾经是贝尔实验室的技术研究成员。她在2009年到2012年间担任加州大学伯克利分校统计系系主任,还是北大微软统计和信息技术实验室的创办者和主任之一。

她在顶尖的科学期刊上发表了70余篇论文,涉及统计、机器学习、信息论、信号处理、遥感、神经科学和网络研究等领域。她还在许多期刊中担任编委,比如统计年刊(Annals of Statistics)、美国统计学会会刊(Journal of American Statistical Association)、机器学习研究期刊(Journal of Machine Learning Research)和技术计量学(Technometrics)。

她是美国艺术与科学学院(American Academy of Arts and Science)的院士。2006年当选Guggenheim Fellow,2012年作了伯努利协会的图基纪念演讲(Tukey Memorial Lecturer)。她还是泛华统计协会2012年首届许宝騄奖的三位获得者之一。她也是AAAS(American Association for the Advancement of Science,美国科学促进会)、IEEE(Institute of Electrical and Electronics Engineers,电气和电子工程师协会)、IMS(Institute of Mathematical Statistics,数理统计协会)和ASA(American Statistical Association,美国统计协会)的会士。

她是IMS的主席。她担任过Statistical and Applied Mathematical Sciences Institute的国家科学委员会的联合主席,现在是Institute for Pure and Applied Mathematics的科学顾问组,以及布朗大学Institute for Computational and Experimental Research in Mathematics的执政委员会。

2013年2月13日,郁彬在她位于伯克利埃文斯教学楼的办公室里接受她以前的学生、现于俄亥俄州立大学任教的施涛的采访。以下是采访的全部内容。

继续阅读COS访谈第十一期:郁彬教授

COS访谈第六期:张健(微软)

zhangjian_photo【COS编辑部按】:受访人:张健,微软公司担任data scientist。

写在前面的话:前面小编采访了微软的数据科学家谢梁,当时同小编一同吃酒的还有微软的另一位数据科学家张健,巧在张健兄乃小编的师兄,毕业于Ames村办大学(又名爱荷华州立大学),当年我前脚到村,他后脚离村,所以之前也不认识。敝村可能名气不大,张健兄在统计界可能也不会有太多人知晓,但俗话说(好吧,我承认我瞎编的)“村长亦干部,凡夫即圣人”,小编很好奇一个物理博士在统计行当里捣鼓什么,于是发去这次采访,希望对外专业的同行们有所启示。
继续阅读COS访谈第六期:张健(微软)

数据科学家的崛起

美国2012总统大选是奥巴马的胜利,但实际上也是统计学家的胜利。奥巴马当选之夜,我看见推特上有一条消息被疯狂转载:

NATE SILVER ELECTED 44TH PRESIDENT OF UNITED STATES

当然这是一句玩笑话,但Nate Silver是谁?他号称“竞选预测之神谕”:2008年的总统大选他预测对了最终结果,而且美国50州的投票结果他预测对了49个;今年的大选他又预测对了,并且是50州全对。Silver是一名统计学家,毕业于芝加哥大学,随后在毕马威会计师事务所“度过了令自己后悔的四年时间”(不喜欢那里的工作),后来转向预测棒球选手的成绩,再后来转向政治方面的数据分析和预测。总统大选的预测是一件噪声很大的工作,各家有各家的预测和分析,各种突发事件可能会导致某位候选人的支持短期内大幅变动。Silver的工作就像机器学习中的“集成学习”(他自己的描述是“贝叶斯统计”,用自己的先验信息和数据得到后验),集合众多民意调查结果,根据自己的经验判断去平均它们(具体过程我不清楚)。 继续阅读数据科学家的崛起