标签归档:GPU

聊聊R和GPU

注:本文来自寇强的博客,原文请点击此处
寇强:现为Indiana University PhD in Informatics。
微博:@没故事的生科男

这是一直想写几句的一个话题,既然今天有时间就聊一聊。

GPGPU算是近几年兴起的一个领域,以CUDA为代表,在高性能计算方面成果相当多。作为一种相对廉价的高性能解决方案,越来越多的程序员开始加入GPGPU阵营。Andrew Ng(就是那个Machine Learning公开课的Andrew)去年在Google用造价大约一百万美的集群完成了猫脸识别,而这个月他刚刚宣布他的团队用造价两万美元的GPU集群,达到了同样的效果(论文在这儿)。从这里我们也可以大致看出GPU在Machine Learning方面的潜力。

在这个所谓的“大数据时代”,大规模机器学习似乎是个必须要解决的问题,而个人观点觉得Hadoop这种MapReduce平台不适合相对密集型的机器学习。从报道上看,UCBerkely开发的Spark平台在这个方面要远远优于Hadoop,但Spark没玩过,今天还是聊聊以前玩过的GPU。

GPGPU的解决方案有不止一个,但由于英伟达集团的大力推广,CUDA可能是支持最好,也是使用最多的,后面提到的GPU也都默认是他家的,所以真正的题目应该是“R和CUDA”。我的测试和开发环境是ubuntu,后面提到的测试和配置也都是ubuntu下面的。

继续阅读聊聊R和GPU