所有由魏太云发布的文章

统计词画番外篇(一):谁共我,醉明月?

moon

将军百战身名裂。向河梁、回头万里,故人长绝。易水萧萧西风冷,满座衣冠似雪。正壮士、悲歌未彻。啼鸟还知如许恨,料不啼清泪长啼血。谁共我,醉明月?

这是笔者最喜欢的词人辛弃疾的《贺新郎·别茂嘉十二弟》之下阙,最后一句“谁共我,醉明月”写尽了挚友远去的孤独和寂寞。毫无疑问,词人在生活中有自己的基友闺蜜,那么问题来了,词人之间有没有风格相近的知音来共醉明月?笔者识字不多,读词少,所幸学习统计专业,因此只能简单地用统计方法来浅显地探讨一下这个问题了。

本文的题目是统计词画,显然有统计,有词,有可视之图画。好的,铺垫完毕,正文开始。

继续阅读统计词画番外篇(一):谁共我,醉明月?

一道抛硬币问题的不同解法和比较

简介

本文针对求指定花样在抛硬币时首次出现时间期望的问题,分别从统计模拟、马氏过程、延迟更新过程、鞅、随机图等不同角度出发对该类问题进行了模拟和理论方面的解答,并展现了各种方法的特点和实用价值。 PDF全文如下: [box type=”download”]下载:本文PDF文档[/box]

浅谈Buffon投针问题及其推广

公元1777年,法国科学家D·布丰(D.Buffon 1707~1788)设计了一个巧夺天工的实验:往间距为a的平行线族之间投掷长为L 的针,可以计算出针和平行线相交的概率为:
pi_2ltopia
根据此式,可以得到pi的近似估计值,这的确是一个伟大的、奇妙而划时代的实验,可算是蒙特卡罗模拟中的鼻祖和经典了。在大多数教材上,这个概率都是用积分或二重积分计算得来的,比较繁琐,在matrix67的博客中,我欣慰而惊奇地看到了一种非常简便、直观的解法,感慨了一番,也稍微思考了一番。

期望值的一个最引人注目的性质就是,E(A+B)=E(A)+E(B),不管A和B是不是独立的。想象一根长度为L的铁丝,不管它被弯成了什么形状,扔到地上后它与地板上的平行线的交点个数的期望值都是一样的,并且这个值是和L成正比的。这是因为,我们可以把一根弯铁丝看作很多很多小的直线段构成;而每个充分小的直线段与平行线交点个数的期望都是相同的,那么由期望值的线性关系,整个弯铁丝与平行线交点数的期望就是c·L,其中c是某个固定的系数。为了求出这个系数是多少,我们只需要考虑一些特殊的情况。注意到,把一根长度为pi的铁丝弯成一个直径为1的圆,则把它扔到地上之后,它与这组平行线总有两个交点。这就是说,pi的c倍就等于2,即c等于2/pi。自然,一根单位长度的针与平行线的交点个数的期望值就是2/pi;而由于这根针与平行线要么没有交点,要么就只有一个交点,因此这个数值就相当于是针与平行线相交的概率了。——matrix67

继续阅读浅谈Buffon投针问题及其推广

不同版本的散点图矩阵

散点图矩阵是散点图的高维扩展,它从一定程度上克服了在平面上展示高维数据的困难,在展示多维数据的两两关系时有着不可替代的作用。R 软件就包含了各种不同版本的散点图函数,本文主要介绍散点图矩阵的设计及其在R中的实现方法,并比较它们的长短,从而审时度势,选取自己喜欢的表现方式和相应的函数。 继续阅读不同版本的散点图矩阵

相关矩阵的可视化及其新方法探究

相关系数阵对于分析多元数据时非常有用,然而当变量较多时,我们很难从一堆庞大的数字中快速获取信息。正因为如此,相关阵的可视化应运而生。的确,活泼生动的图形对我们的眼球更有诱惑力。已有的相关阵可视化技巧有颜色图、椭圆图、钟表图(参见Deepayan Sarkar所著的《Multivariate Data Visualization with R》中的Fig13.6)等,其思想都非常直观。本文在阐述了颜色图和椭圆图的机理后,又提出了一种新的相关阵的可视化技术——圆圈图,并与颜色图、椭圆图进行了比较。

##2010-4-11更新:本文及扩展工作对应的包corrplot可从CRAN下载。

继续阅读相关矩阵的可视化及其新方法探究