COS每周精选:数据科学的威胁

本期投稿:谢益辉 肖楠 林荟

如果我们不变革的话,数据科学对我们(生物)统计将是一个威胁Jeff Leek说。

Larry Wasserman问,数据科学会不会是统计学的终结者呢?媒体铺天盖地的谈论大数据,数据挖掘。人们现在可以谈论数据全然不需要知道这个世界上还有一门学科叫做“统计”。没有误差分析,不需要检验假设的“数据分析”是不是统计的终结?统计该归于计算机还是数学?为什么统计会被边缘化?我们该如何对待?

经济学家Carmen Reinhart和Kenneth Rogoff在2010年写了一篇论文称国债占GDP百分比超过90%的国家的经济增长率中位数比那些低于90%的国家大约低1%。可是后来Mike Konczal总结了另外三位作者指出的这两位童鞋的三个错误:选择性纳入样本、不符常规的加权以及数据处理(Excel表格)错误。计量经济学家们,你们的鼠标在Excel中一拖一拉,全球国家都要跟着抖一抖。

KDD Cup 2013 竞赛本周上线。竞赛分为两个 track,任务分别是 判断某篇论文是否为某作者所撰写作者重名辨识。回顾 2012 年的社交网络个性化推荐和 pCTR 点击率预估任务,今年的数据集相对较小,且相关研究起步较早。本次竞赛将于 2013 年 6 月 12 日结束提交,历时约两个月。与此同时,ICML 2013 的三项 Representation Learning 竞赛 也已经启动。

有人说,深情即是一桩悲剧,必得以转换主力语言来句读。这位客官用了十多年的 MATLAB,最后发现老板(R-Core)只让用 R …… 痛苦的涅磐过程,和一个好 IDE 的重要性

咳咳,在最后,小编插播一条小广告:统计之都微信公众帐号本周已经正式开通啦,如果客官想在第一时间得知主站和论坛的精彩内容,以及统计之都的线下活动、竞赛、培训和会议等信息,扫描主站右栏二维码或搜索 CapStat 即可关注。(无聊的时候,欢迎客官调戏那边的小编喔)

 

COS每周精选:数据科学的威胁》有5个想法

  1. 尽管是基于数据,但是绝大多数情况下,分析还是基于经验范畴的。

      1. RStudio用户体验更好,而且界面跟matlab类似,幸福..

  2. 个人认为,数据科学的对象就是数据本身,统计除了数据还要提出数据来自的总体的研究的问题,特别是不确定情况下的问题。数据科学提供处理数据的手段,目的是发现数据本身的结构。数据科学为统计提供了更多的样本形态,这是我们要认真研究的。

发表评论

邮箱地址不会被公开。 必填项已用*标注