Persi Diaconis (1)

作为统计之美的开篇,我一直想找一篇我非常愿意写的统计故事,尽管有很多,但都不能让我觉得可以发泄笔头之愤。最近在听贝叶斯统计课,刘军老师(哈佛大学统计系教授)提起了叫Persi Diaconis的人,他的故事和他的工作,这让我找到了写这篇文章的灵感。

你能想象,一个人在14岁离家出走,学习魔术,浪迹江湖,24岁后潜心学术,之后成为斯坦福大学的教授?

Persi Diaconis(维基)确实如此,他在搞魔术的时候,为了想研究如何防止被其他魔术师骗,买了本 William Feller 的 An Introduction to Probability Theory and Its Applications,但是里面涉及到了微积分等知识,看不懂,那年他18岁。他发誓要回学校学习,以此能够看得懂这本书。24岁重返校园(City College of New York)。他向《科学美国人》投稿介绍他两个有意思的洗牌方法。这样被一个马丁·葛登能的人看重,给他写了推荐信去哈佛大学,当时哈佛的统计学家 Fred Mosteller 正在研究魔术,于是就要了他(http://blog.sciencenet.cn/home.php?mod=space&uid=1557&do=blog&id=418859)。

Persi Diaconis 做了几个很有意思的工作,如洗牌多少次能够洗得比较彻底(我希望在统计之美里面,能够有一篇来单独介绍洗牌问题)等。他还有个绝活,据刘军老师说,他总可以抛硬币时,抛出他想要的那一面。而他每次的学术报告之前,都会表演一番,很多人实际上不是去听他的报告的,而是看看他的绝活。

这次就要介绍的,是他在一篇 MCMC 算法(Markov Chain Monte Carlo,马氏链蒙特卡洛方法,有文章将其评为20世纪最有名的10个算法之一)综述的文章(The Markov Chain Monte Carlo Revolution)中,给出的破译犯人密码的例子。

有一天,一个来自了解关押囚犯心理的心理医生,来到斯坦福统计系,给出了如下一个囚犯写的密码信息:

上图是囚犯写的密码信息的一部分,你可以看到很多出现频繁的字符。

问题来了,该心理医生想知道,这个密码信息的内容是什么?

我们可以想到,上图看起来怪怪的字符,每个都应该对应一个字母,只要我们找到字符和字母的对应关系,我们就可以解码了。但是怎么找到这个对应关系呢?(我想到了福尔摩斯探案集里面有这样一个例子,不过那个例子中的字符代表体系和这个不同,但是福尔摩斯的推断相当惊人!)

在下一篇我给出他的想法,从而写完MCMC算法的引子。

win your ex girlfriend backfree advice on how to make her want you back How To Get Your Ex Girlfriend Back how to get back with your ex girlfriendhow to get your girlfriend back

Persi Diaconis (1)》有17个想法

  1. Persi Diaconis的经历好传奇啊. 不过我觉得牛人做事的方法真的是非常与众不同, 为了玩魔术去学概率论. 更牛的是哈佛的统计学家 Fred Mosteller正在研究魔术, 然后招了他…

    很期待统计之美后面的内容.

    1. 恩,其实我自己一开始想到的也是利用字母出现频率的办法来尝试求解,但实际上不好,我会在下一篇来说明为什么不好。我想,一个可能的提示就是利用马氏链的思路。

    2. 应该是统计语料库的字母频率分布 以及字母前后的多阶转移概率吧

  2. 福尔摩斯里面 根据英文中字母出现的频率排序 前后依赖关系之类的;
    记不清了。。e出现最高好像

    1. 福尔摩斯的案例不是依赖于字母出现顺序的,而是推断出来密码来源是一本大家都常用的书里面的词汇。我想和这个问题的求解思路还是挺不一样的~

    2. 那个解密码的故事来自 恐怖谷 第一部 伯尔斯通的悲剧之警告,你要是有兴趣可以找找,如果找不到,我会把它贴出来。

      1. 贴出来吧。。。我从小喜欢看侦探小说,赫赫~

        ps,对牛人表示深深的致敬。。。

      1. 我记得那本书好像是年鉴吧。最喜欢这种传奇故事和吊胃口的例子了:)

发表评论

邮箱地址不会被公开。 必填项已用*标注