分类目录归档:图书出版

《Rcpp:R与C++的无缝整合》

RcppSeamless R and C++ Integration with Rcpp

[法] 德克·埃德比特尔 著    寇强 张晔 译

内容简介

Rcpp是R应用最为广泛的语言扩展包,它被应用于超过100个CRAN和BioConductor的包中。这本书是关于Rcpp的第一本综合性导论。Rcpp使得用户可以在R和C++之间来回传递数值、向量、列表或者完整的R对象,在给R分析框架带来深度的同时,也带来了C++的威力、速度和效率。

继续阅读《Rcpp:R与C++的无缝整合》

一个数据科学家的这些年

【COS编辑部按】 作者:李舰 

简介:李舰先生现任堡力山(PMI)集团副总,曾任 Mango Solutions 中国区数据总监。专注于数据科学在行业里的应用。擅长R语言的工程开发与分析建模,是 Rweibo、Rwordseg、tmcn  等 R 包的作者。与肖凯合著了《数据科学中的R语言》,参与翻译了《R语言核心技术手册》、《机器学习与R语言》。李舰先生也曾有多篇文章在统计之都主站上发表。个人主页:http://jianl.org/
引言:这篇文章来自于我和肖凯的新作《数据科学中的R语言》的前言。原书受篇幅和语言风格所限,前言经过了一些删减,在这里将全文和增补的内容发布出来。为了尽量避免为新书打广告的嫌疑,先提前声明我们会把书中一些自认为比较有价值的经验和见解发布到统计之都上,只是希望对数据科学和R语言有个基本的认识或者了解一些作者的建议和感悟的读者大可不必去买这本书,只有对具体案例和技术感兴趣并且愿意实际操作才值得去购买。

僭称科学家我本来是不敢的,不过如今人们对数据的研究和应用的主战场在业界,“数据科学家”通常指的是一个职位的名称。现在很多公司(包括我自己的)招聘的职位都流行写“Data Scientist”,所以我自称数据科学家应该还好。从我本科进入中国人民大学学习统计学专业开始到现在的10多年时间里,我所有的求学经历和职业生涯都在和数据打交道,在数据应用的最前线感受到了业界对于数据价值理解的巨大变化。也亲身经历了从数据被冷遇到如今“大数据”成为显学这一激动人心的变革。这些年的很多经验都化成了这本书中的内容。在这里,我回顾自己在数据科学家道路上的一些经历,用自己的视角来总结这个数据时代的变化,也作为这本书的前言。

继续阅读一个数据科学家的这些年

《R语言编程艺术》

R语言编程艺术
《R语言编程艺术》

由统计之都的几位成员翻译的《R语言编程艺术》终于就要面市了。本书的译者有陈堰平邱怡轩潘岚锋熊熹,负责校审的有林宇、严紫丹、程豪。这里有本书的译者序,读者可以在本书的github页面下载数据和代码。读者可以在本页留言提问,我们也会在这里公布本书的勘误。想查找更多好书,请看图书出版频道。

内容推荐

本书是R语言领域公认的经典著作,著名计算机科学家兼统计学家撰写,Amazon五星级畅销书。它是一本面向R语言开发者的纯编程类书籍,不需要读者具备统计学基础,从编程角度而非统计学角度系统讲解了R语言的数据结构、编程结构、语法、TCP/IP网络编程、并行计算、代码调试、程序性能优化、编程技巧以及R语言与其他语言的接口等所有与R编程相关的知识,几乎面面俱到。本书的实用性也非常强,44个精选的扩展案例,充分展示了R语言在数据处理和统计分析方面的强大能力。

全书一共16章:第1章介绍了学习R语言需要掌握的预备知识以及它的一些重要数据结构;第2~6章详细讲解了R语言的主要数据结构,包括向量、矩阵、数组、列表、数据框和因子;第7~13章全面讲解了R语言的语法,包括编程结构、面向对象特性、数学运算与模拟、输入与输出、字符串处理、绘图,以及R语言的调试方法。第14~16章讲解了R语言编程的高级内容,如执行速度和性能的提升、R语言与C/C++或Python的混合编程,以及R语言的并行计算等。

本书核心内容:

  • R语言的完整语法以及R语言的编程技巧。
  • 创建精美图形来展示复杂数据和函数。
  • 使用并行计算和向量化的方法编写更高效的代码。
  • 使用R对C/C++和Python的接口来提高计算速度或增加功能。
  • 文本分析、图像处理等领域新的R包。
  • 使用高级调试技巧清除代码里恼人的错误。
  • 包含许多“扩展案例”,展示完整的、特定用途的函数,并针对同一个问题讨论了不同的设计方案,以便分析高效准确的做法。
  • 在恰当的时候介绍R语言与其他语言的差异,给那些了解其他语言的开发人员提供参考。

继续阅读《R语言编程艺术》

《ggplot2:数据分析与图形艺术》现已上市

ggplot2
ggplot2:数据分析与图形艺术

由统计之都操刀翻译的《ggplot2:数据分析与图形艺术》一书已经上市了。这本书的译者包括邱怡轩(第1~2章)、主伟呈(第3~4章)、肖楠(第5~6章)、高涛(第7~8章)、潘岚锋(第9章)、魏太云(第10章、附录以及翻译过程的协调安排和全书的LaTeX排版工作)。谢益辉为本书写了译者序

这里查看书中的所有代码,点这里下载全部代码。

这里可以看见最新的勘误(标记为红色的bug即是)。

读者可以在本页或者在统计之都论坛报告错误。

内容推荐

ggplot2 是R中新颖的数据可视化包,功能强大、灵活便捷,其灵感源自 Leland Wilkison的《图形的语法》一书。使用 ggplot2 可以轻松实现:

  • 高质量图形的绘制,自动化添加图例。
  • 叠加来自不同数据源的多个图层(点、线、地图、瓦片图、箱线图等),自适应通用标度。
  • 利用 R 强大的建模功能添加平滑曲线,如 loess 、线性模型、广义可加模型和稳健回归。
  • 保存任意ggplot2 图形,方便修改或重复使用。
  • 制作主题,满足内部定制或杂志风格的需求,便捷地应用到多幅图形上。
  • 从视觉角度上审视你的图形,斟酌每一部分数据如何呈现在最终图形上。

如果你想将枯燥的数据转化为生动、形象的图片,本书绝对大有裨益。你需要了解 R 的基本知识(比如如何将数据导入到R),不过 ggplot2 是专门为绘图量身打造的“迷你语言”,在本书中你就可以学到你需要的所有知识。在阅读完本书之后,你就可以针对你的问题绘制出精确定制的图形,并且发现将脑海中的图片绘制在屏幕上已经变得轻而易举了。译者亲切地称之为“玩转数据可视化的瑞士军刀!”

目录

1. 简介
2. 从qplot开始入门
3. 语法突破
4. 用图层构建图像
5. 工具箱
6. 标度、坐标轴和图例
7. 定位
8. 精雕细琢
9. 数据操作
10. 减少重复性工作
附录A 不同语法间的转换
附录B 图形属性的定义
附录C 用grid操作图形

《R语言实战》

r-in-action

由统计之都三位成员高涛肖楠陈钢翻译的《R语言实战》现已正式出版。请点击这里下载随书代码。如果读书在阅读过程中遇到什么问题,可以留言提问。您也可以访问本书在图灵社区的主页,阅读部分试读章节。我们还会不定期地在这里发布本书的勘误,请读者留意@统计之都的微博。近期统计之都还有其他图书出版,请关注本站图书出版栏目。

有热心读者在论坛上贴出了学习笔记

内容介绍

R是一个开源项目,具有强大的统计计算及制图能力,是从大数据中获取有用信息的绝佳工具,在各种主流操作 系统上都可以安装使用,其基本安装就提供了数以百计的数据管理、统计和图形函数。另外,社区开发的数以千计的扩展(包)为R增加了更多强大功能。《R语言实战》注重实用性,是一本全面而细致的R指南,高度概括了该软件和它的强大功能,展示了实用的统计示例,且对于难以用传统方法处理的凌乱、不完整和非正态 的数据给出了优雅的处理方法。作者不仅仅探讨统计分析,还阐述了大量探索和展示数据的图形功能。《R语言实战》适合数据分析人员及R用户学习参考。

作者简介

Robert I. Kabacoff R语言社区著名学习网站Quick-R(http://www.statmethods.net/)的幕后维护者,现为全球化开发与咨询公司Management研究集团研发副总裁。此前,Kabacoff博士是佛罗里达诺瓦东南大学的教授,讲授定量方法和统计编程的研究生课程。Kabacoff还是临床心理学博士、统计顾问,擅长数据分析,在健康、金融服务、制造业、行为科学、政府和学术界有20余年的研究和统计咨询经验。

继续阅读《R语言实战》