标签归档:中国人民大学

第五届中国R语言会议通知

R是一门用于统计计算和作图的语言,其官方机构每年都会举办useR!会议,但会议地点主要局限在欧美地区。自2008年以来,在谢益辉的倡导下,中国已经成功举办了四届自行组织的R语言会议,极大促进了R语言在中国的推广和发展。在前四届会议的成功经验下,为了进一步加强各领域R语言使用者之间的交流,我们准备于2012年5月(北京会场)举办第五届中国R语言会议。

 

会议事宜(北京会场)

一、会议时间

会议定于2012年5月26-27日,上午9:00开始报告,请参会者提前半小时入场领取材料。

二、会议地点

中国人民大学明德楼-法学0201教室。 继续阅读第五届中国R语言会议通知

精品课程系列:应用随机过程

一、课程简介

主讲教师:张波张景肖肖宇谷

指定教材:张波、张景肖《应用随机过程》,清华大学出版社

授课对象:中国人民大学统计学、精算专业大三学生

学分学时:3学分,共48学时

考核方式:闭卷考试

目的要求:针对专业特点和专业要求,力求以概率论的观点来讲述随机过程的理论,逐步培养学生利用随机过程的理论和技能解决应用概率问题。培养学生运用随机过程的方法分析问题、解决问题的能力。

二、课程讲义及历年考题

第1章 预备知识
第2章 随机过程的基本概念和类型
第3章 Poisson过程
第4章 更新过程
第5章 Markov链
第6章 鞅
第7章 Brown运动
第8章 随机积分
历年考题(200820092010

三、教学进度及内容

分15讲授课,每讲3个学时,第16次课程进行最终考核。内容安排如下:

第一讲 概述和泊松过程

  1. 随机过程的基本概念和基本类型
  2. 泊松过程的两个等价定义

第二讲 泊松过程

  1. 与泊松过程相联系的若干分布
  2. 泊松过程的推广:非齐次泊松过程、复合泊松过程、条件泊松过程

第三讲 更新过程

  1. 更新过程的定义
  2. 更新函数
  3. 更新方程
  4. 更新推理

第四讲 更新过程

  1. 更新定理:初等更新定理、布莱克威尔定理、关键更新定理
  2. 更新过程的推广:延迟更新定理、更新酬劳过程、交错更新过程

第五讲 Markov链

  1. Markov链和Markov性的定义,Markov链的特征及条件
  2. Markov链转移概率矩阵
  3. Chapman–Kolmogorov方程
  4. Markov链中相通、类、周期、常返态、瞬时态、正常返、零常返等概念

第六讲 Markov链

  1. 赌徒输光模型概率转移问题
  2. 极限定理

第七讲 Markov链

  1. 极限定理
  2. Markov链的不变分布
  3. 分支过程:单个个体开始的群体灭绝的概率求解问题

第八讲 Markov链

  1. 人口结构变化的Markov链模型
  2. 连续时间的Markov链
  3. 生灭过程
  4. Kolmogorov微分方程

第九讲 鞅

  1. 条件期望的概念和基本性质
  2. 上鞅、下鞅和鞅的概念
  3. 停时的概念

第十讲 鞅

  1. 停时定理
  2. 运用停时定理来解决赌徒模型中的问题
  3. 一致可积性的含义和判别条件
  4. 停时定理的应用

第十一讲 鞅

  1. 鞅收敛定理
  2. 利用鞅收敛定理来解决分支过程、随机游走以及Polya模型的问题
  3. 连续鞅的含义和性质
  4. 鞅在Lundberg-Cramer破产模型中的应用

第十二讲 布朗运动

  1. 布朗运动和随机游走的联系
  2. 布朗运动过程的定义
  3. 布朗运动路径的性质
  4. 布朗运动在[0, t]二次变差为t

第十三讲 布朗运动

  1. Gauss过程
  2. 布朗运动的鞅性质
  3. 布朗运动过程中的击中时和布朗运动的最大值变量

第十四讲 布朗运动

  1. 布朗桥
  2. 在一个值处被吸收的布朗运动
  3. 在原点反射的布朗运动
  4. 几何布朗运动
  5. 有漂移的布朗运动

第十五讲 伊藤积分和期权定价公式

  1. 伊藤积分
  2. BS期权定价公式

四、推荐书目

  • Ross, Stochastic Processes, 2nd edition, Wiley
  • Lawler, Introduction to Stochastic Process, 2nd edition, Chapman & Hall/CRC.
  • William Feller, An Introduction to Probability Theory and Its Applications, Vol. 1, 3rd Edition, Wiley.
  • William Feller, An Introduction to Probability Theory and Its Applications, Vol. 2, 2nd Edition, Wiley.

详情参见指定教材247页文献评注及参考文献。

首届全国大学生数据挖掘邀请赛圆满结束

 

2011年5月8日,来自浙江大学、厦门大学、复旦大学、浙江大学、北京大学、东南大学、中山大学、北京航空航天大学大学等多所高校的获奖队伍聚集于中国科学技术大学进行比赛的最终答辩环节,确定了最终的名次和奖项,标志着经过一个多月的群雄逐鹿,首届全国大学生数据挖掘邀请赛终于圆满结束。首届全国大学生数据挖掘邀请赛是由中国科技大学管理学院、中国人民大学统计学院和统计之都发起并主办,由上海花千树信息科技有限公司提供资金赞助和服务器支持。在一个多月的比赛时间中,共有来自大陆、香港及海外多所高校的1115支队伍注册参赛,期间有303支队伍成功提交预测结果,最终有240只队伍全程参与比赛。

赛题背景

以某大型婚恋网站交友数据为依托的推荐系统

队伍信息

总注册队伍1115支,其中本科生队伍794支,研究生队伍321支,分别来自以下一百多所高校及研究所:

安徽大学、安徽理工大学、安徽农业大学、北方工业大学、北方民族大学、北京大学、北京工商大学、北京航空航天大学、北京理工大学、北京林业大学、北京信息科技大学、北京邮电大学、北京语言大学、大连理工大学、大连民族学院、电子科技大学、电子科学技术大学、东北大学、东北师范大学、东华大学、东南大学、多伦多大学、福州大学、复旦大学、广东工业大学、广东省中山大学、广东外语外贸大学、广西大学、广州大学、桂林理工大学、国防科学技术大学、哈尔滨工业大学、哈尔滨工业大学深圳研究生院、杭州电子科技大学、合肥工业大学、河南工业大学、河南科技大学、湖北大学、湖南大学、华东理工大学、华东师范大学、华南理工大学、华南农业大学、华中科技大学、华中农业大学、华中师范大学、暨南大学、江西财经大学、兰州大学、洛阳理工学院、南昌大学、南方医科大学、南京财经大学、南京大学、南京航空航天大学、南京理工大学、南京农业大学、南京医科大学、南开大学、清华大学、人民大学、厦门大学、山东大学、山东科技大学、汕头大学、上海财经大学、上海大学、上海交通大学、上海师范大学、深圳大学、首都经济贸易大学、四川大学、苏州大学、太原理工大学、天津大学、天津工业大学、同济大学、乌普萨拉大学、武汉大学、武汉理工大学、西安财经学院、西安电子科技大学、西安交通大学、西安交通大学、西南财经大学、西南科技大学、香港科技大学、新加坡国立大学、新疆大学、云南财经大学、浙江财经学院、浙江大学、浙江大学城市学院、浙江工业大学、浙江理工大学、浙江师范、浙江师范大学、郑州大学、中国地质大学、中国地质大学(北京)、中国地质大学(武汉)、中国计量学院、中国科学技术大学、中国矿业大学、中国人民大学、中科院合肥研究院、中科院计算所、中科院声学所、中科院研究生院、中南财经政法大学、中南大学、中山大学、中央财经大学、重庆邮电大学、周口师范学院

 

获奖信息

本科生组:

名次 团队 队员 学校 院系
1 FooBar 仝子飞、刘佳硉 浙江大学 计算机科学与技术学院-计算机科学与工程学系
2 OldCubic 彭兵月、 刘宇辰 北京航空航天大学、清华大学 软件学院-软件工程系、经济管理学院-管理科学与工程系
3 LightSpeed 解浚源、陈宇澄 中国科学技术大学 计算机学院-计算机系
4 SiNZeRo 田文涛、洪诗保、胡亚光、叶挺 厦门大学 信息科学与技术学院-计算机科学与技术系
5 FDM 王超、张俊、董家为、王玥 复旦大学 计算机科学技术学院
6 forever 杨洋、陈章麒、姜涛、竺紫威 中国科学技术大学 少年班学院
7 兰州烧饼 蓝润荣 中国科学技术大学 管理学院-统计与金融系
8 zaq1xsw2tktk 唐坤、徐东昊 北京大学 数学科学学院-信息科学系、数学科学学院-科学与工程计算系

 

研究生组:

名次 团队 队员 学校 院系
1 RecSys1 宝腾飞、刘淇、程文华、聂鹏宇 中国科学技术大学 计算机学院
2 ForeverDream 张驰原、 李成 浙江大学 计算机学院-计算机应用技术系
3 数据掘金 徐童、曾广翔、季波、陈永环 中国科学技术大学 计算机学院-计算机系(1、2)、信息学院-自动化系(3、4)
4 totoro 杜龙志 北京大学 信息科学技术学院-计算机软件与理论
5 DataAnts 谢妍、刁瑞、来斯惟 中国科学院 数学与系统科学研究院(1、2)、自动化研究所(3)
6 icebergs 黄凯明、陆建、蒋玖川、章平 东南大学 信息科学与工程学院
7 Crystal 杨飞雕 中山大学 信息科学与技术学院-计算机科学与技术
8 napoloen 黄浩 浙江大学 计算机学院-计算机科学与工程学系

其中,第1名为一等奖(奖金10000¥),第2名为二等奖(奖金5000¥),第3~8名为三等奖(3~5名奖金2000¥,6~8名奖金500¥)。

附:首届全国大学生数据挖掘邀请赛结果排名(前100名)

竞赛相关数据展示

每天注册的队伍数:

上图为3月16日~4月15日每天注册的队伍数(注:竞赛于3月19日全面公开注册,在此之前在对中科大学生提前公布了注册网站以测试系统)。

每日有效提交次数:

上图为3月23日~4月27日每天成功提交的符合规范的预测结果数目,总共提交的次数为11162次。

提交次数频数:

上图为提交次数的频数图,从上图可以看出,大部分队伍提交次数很少。提交次数超过10的队伍有217个,超过50的有70个,超过100的有29个。最终获奖的队伍的提交总次数都很高。

赛后相关博文及帖子

旁门左道:第一届全国大学生数据挖掘邀请赛-数据集分析篇

JiangFeng:第一届数据挖掘邀请赛 – 缘来如此

ruikoeln:数据挖掘邀请赛-一个酱油党的感言

rainywh269:数据挖掘邀请赛 赛后感

cloud_wei:中科大之行及数据挖掘竞赛小总结

Mantous: 第一届全国大学生数据挖掘邀请赛-总结

中国人民大学统计学院研究生会学术期刊《统计功课》第五期(2009)摘要

期刊简介:本刊是中国人民大学统计学院研究生会的学术类期刊,一年出版一期。其目的是为统计学院各专业的硕士博士生提供一个学术交流和展示的平台,同时也为本科生提供一个学习的机会。本刊收录的文章全部是由统计学院各级研究生自主撰写,其中也包括一些专业课的作业。现应允发表其摘要于统计之都,以供广大统计人士学习、指点与探讨。

一、第三届首都高校统计学研究生论坛论文选登

非对称分布的最优置信区间

清华大学数学科学系    苟江涛

摘要:对于非对称分布的双侧假设检验问题,传统方法简单的把显著性水平平均分配在两侧。本文给出了另一种处理方式:通过最小化置信区间长度来确定置信区间。本文尝试分析利用何种指标可以决定这两种计算置信区间的方法间的差异大小,并以 分布和 分布为例进行了计算验证。

关键词:双侧检验,非对称分布,偏度, 分布, 分布

Rare Event Detection via Improved SMOTE Weighted Random Forest

School of Statistics, Renmin University of China    CHENG Xiaoyue

Abstract:Rare event detection is a difficult problem in machine learning. To better the predict effect, this paper provides a method incorporating an improved SMOTE over-sampling technique and weighted random forest. The method is applied to a real hypothyroid data set, and shown to improve the prediction accuracy of the minority class.

Keywords: rare event detection, SMOTE, random forest

统计数据质量成本关系模型研究

中国人民大学统计学院    陶然

摘要:在统计数据质量成本概念基础上,本文根据统计数据质量成本管理理论推导出统计数据质量成本模型的理论形式;结合统计数据生产过程的特点,具体论证了抽样设计阶段和统计信息生产阶段的统计数据质量成本与不同质量特性的质量成本关系模型,为有效地实施统计数据质量成本的管理,从而不断改进统计数据质量提供了理论基础。

关键词:统计数据质量,质量成本,质量成本关系模型

二、创新杯论文选登

BMS的最优保费尺度实证分析

中国人民大学统计学院    叶芳

摘要:本文将回顾四种最优保费尺度,并引入开模型。在针对中国保险公司的具体规则,比较其实际尺度与最优尺度,以及各保险公司系统保费尺度的优劣。

关键词:奖惩系,BMS,最优尺度,开模型,闭模型,纯奖励系统,有罚的系统

FDI结构与中国产业内贸易发展水平的关系研究——以制造业21行业为例

程红莉  谢蕾蕾

摘要:本文运用产业内贸易系列指数对中国制造业部分行业的产业内贸易发展水平进行测度,并进一步将产业内贸易类型划分为水平型产业内贸易、上垂直型产业内贸易和下垂直型产业内贸易,分析产业内贸易的内在结构特征;运用FDI的行业结构以及利用外资方式的结构作为对FDI的结构度量;在此基础上,通过面板模型和回归模型,结合2002-2007年数据分析FDI结构是否促进了中国产业内贸易发展水平的提高。结论显示,我国制造业的产业内贸易程度有一定的提高,但是各产业的贸易模式并未发生显著变化;绝大部分行业的FDI比重有了显著提高,说明外资对我国制造业各行业的渗透进一步加深,这很可能是入世产生的效应;FDI一定程度上促进了产业内贸易程度的提高,但是主要促进了垂直型产业内贸易尤其是下垂直产业内贸易程度,不利于我国各产业的长远发展,也威胁到产业安全;FDI的实际利用方式对产业内贸易程度也存在一定的负面影响,独资化阻碍了水平型产业内贸易程度的提高。

关键词:FDI,独资化,水平型产业内贸易,垂直型产业内贸易

三、我们的功课

企业寿命生命表的编制初探

中国人民大学统计学院    刘崇光

摘要:对企业寿命的研究已有多年,虽然在企业生命周期理论方面已经有较为成熟的理论成果,但是大多学者都仅仅将研究精力放在探讨影响企业寿命的因素上。对“企业的年龄是什么?企业的年龄为多少?企业的年龄应该如何进行测度?”等问题鲜有人问津。究其原因,一方面是现阶段对企业年龄的测度方法还缺乏公允认同,另一方面是研究者难以得到用以测度企业寿命的地区性数据。将企业看成一个生命体而非纯经济体的视角引出了企业生态学的研究新领域,本文正是循着这条思路,依托独有的全国企业寿命数据展开讨论。主要创新之处在于:1、总结了企业寿命研究的两种思路。2、从人口学生命表的方法出发,完整系统地提出了编制企业生命表的方法。3、公布了第一张中国全国企业寿命生命表。4、重新探讨了涉及企业寿命的相关概念。5、对比人口寿命,总结了企业寿命所显现的特征。

关键词:企业仿生学,企业寿命,生命表

我国基本养老保险制度的代内收入再分配效应分析

中国人民大学统计学院    康博威

摘要:养老保险制度的目标是在与社会经济发展程度相适应的前提下,最大限度地满足退休职工的养老需求,为其提供基本生活保障和一定的收入替代。养老保险所实现的再分配功能对满足低收入阶层的养老需求,缩小贫富差距有重要意义。本文将对我国城镇职工基本养老保险的收入再分配情况进行分析,运用绝对转移额、内部收益率和个人替代率等分析方法,剖析代内不同收入阶层间的收入再分配程度和效果,从定量的角度分析我国社会养老保险的公平效应。

关键词:基本养老保险,收入再分配,公平和效率

关联规则与相关分析的共性研究

中国人民大学统计学院    张璞

摘要:在购物篮分析中,我们主要使用数据挖掘中的关联分析寻找强关联规则。目前,关联规则的理论和算法研究日趋成熟,但仅限于数据挖掘方面。这里,我们从统计学中的相关分析角度来研究关联规则,探讨关联规则与相关分析的共性。强关联规则在一定程度上又表现为较高的正相关系数,通过对关联规则中的增益与相关系数之间的定性及定量分析,最终得出增益与二态变量的相关系数之间的等式关系。该结论为数据挖掘与统计学之间的沟通搭建一座桥梁。

关键词:关联规则,增益,相关系数

四、大学生创新实验计划2009我院参赛获奖论文摘要

城市生活垃圾分类回收和处理的现状调查及改进措施

郝明月  叶舟  魏鑫  张肖阳

摘要:本课题主要研究目前北京市垃圾分类的现状和居民的意识行为关系。从环境社会学和心理学视角,创新性地在环境意识的基础上,提出心理角色定位的概念,用来描述居民在环境行为中的不同动机,有针对性选择居民可参与治理的生活垃圾分类为研究切入点。通过对北京市居民的电脑辅助电话调查(CATI)和深度访谈,运用多种统计学方法聚类分析等对数据进行分析,初步建立了理论模型,提出了居民心理定位的假设。同时,设计全面的入户调查对模型理论验证假设,通过结构方程模型等方法对其验证补充,深入瓦挖掘居民心理动机的内外因,完善了居民意识和行为的关系理论。

关键词:生活垃圾分类,废品回收,环境意识,CATI,入户调查,结构方程模型

内蒙古牧区老龄人口生存现状以及基本养老保险需求的调查——以西乌珠穆沁旗为例

袁嘉蔓  杨光  李杨  任燕  戴维

摘要:内蒙古牧区处于我国北方,气候复杂多变,传统蒙古族聚居区以畜牧及乳制品制造业作为主要经济支柱, 牧民居住分散、收入不稳定且来源单一、与外界交流较少以及蒙古族特有的传统文化等诸多特殊性使得内蒙古牧区并非传统意义上的“农村”,因此传统意义上的农村社会保障系统在此并不完全适用。在充分考虑了这些特殊性的基础上,我们通过对西乌旗的四个嘎查进行入户调查和深入访谈,得到牧区老龄人口生存状况、牧区中老年养老状况和医疗状况三方面的第一手信息。运用列联分析、逐步回归、logistic回归等多种统计学分析方法,从养老和医疗两个角度分析影响牧民参加基本养老保险和新型牧区合作医疗制度的显著因素。通过对比牧区中年人养老观念和老年人的生存现状,预测未来牧区养老模式的变化趋势。综合以上各方面信息,向当地政府和保险公司提出可行性建议,为政府进一步完善现行的社会保障体系、为保险公司研发适合内蒙古牧区养老和医疗的保险产品提供参考。

关键词:基本养老保险,新型牧区合作医疗,logistic回归,列联分析,老龄人口生存现状

新农村建设中高校毕业生基层工作的调查研究

周芳  张波  崔学勤  陈瑜

摘要:引导和鼓励高校毕业生面向基层就业是中央提出一项重要的国家人才战略政策,其实质是新农村建设中人才资源的开发问题。然而,该政策在具体的实施过程中却存在诸多问题,效果并不如想象中理想,供给和需求方都存在着一些消极的态度。本文正是要通过实地调查,从人才供给和市场需求两个方向研究并思考该政策的实施现状,发现问题并尝试提出改进意见。本次调查分为三个部分:1、对在校大学生的调查,即为对“供给方”的调查;2、对当地干部群众的调查,即为对“需求方”的调查;3、对在基层工作的大学生的调查。基于调查中存在的实际困难较多,本调查主要采用了方便抽样和滚雪球抽样的抽样方法,调查方式以问卷形式为主,兼有访谈。通过调查我们得到的主要结论有:1、影响“供给方”的主要因素依次为:工资待遇、未来发展、社会保障;2、投身基层的意愿和高校毕业生的背景信息有着密切的关系,并且通过调查我们发现,背景信息对投身基层的意愿影响程度由强到弱的顺序依次是:家乡、性别、专业,另外我们发现,来自农村与县城的高校毕业生更愿意到基层工作;3、困扰基层工作大学生的最主要问题是将来的去向问题;4、基层干部群众对这一政策的认识水平还停留在表层,且反响不高;5、农村最需要的是法律和农业科学方面的人才;5、到基层工作最需要的能力依次是:个人的沟通能力、村干部的支持、良好的社会关系;6、影响基层工作大学生续留的主要因素依次是:生源地、政治面貌、家乡、学历、性别。

关键词:大学生“村官”,基层工作,法制化,保障机制

五、首届中国R语言会议摘要汇编

详见 http://cos.name/2008/12/1st-chinese-r-conference-summary/

六、2008——2009学年统计学院主要学术活动

§ 学术会议

  • 2008年6月21—22日,“2008统计学国际论坛”在中国人民大学逸夫会议中心举行。
  • 2008年11月16日,由北京市社会科学届联合会和北京市统计学会主办,中国人民大学统计学院协办的“2008学术前沿论坛——统计学分论坛”会议在公共教学一楼1204教室召开。
  • 2008年11月29日,由教育部重点研究基地中国人民大学应用统计科学研究中心与世界中医药学会联合会临床疗效评价专业委员会主办,中国人民大学统计咨询研究中心承办的“第二届临床医学研究中的统计方法学术研讨会”在中国人民大学逸夫会议中心举行。
  • 2008年12月13日—14日,由教育部重点研究基地中国人民大学应用统计科学研究中心与中国人民大学统计学院主办的“第一届中国R语言会议”在中国人民大学明德商学楼0402教室成功召开。
  • 2009年1月9日下午,由中国人民大学统计学院国民经济核算研究所主办的“对外经济统计计量与分析”研讨会在统计学院成功召开。

§ 学术交流与访问

  • 2008年6月,美国华盛顿大学公共卫生和社区医学院生物统计系教授周晓华应邀访问中国人民大学统计学院,并为我院研究生学生开设生物统计课程。
  • 2008年6月5日—8月31日,田茂再老师前往德国洪堡大学进行合作研究。
  • 2008年6月11—13日,浙江大学举行了IMS-China International Conference on Statistics and Probability 2008会议,我院教师吴喜之,张波,金阳,吕晓玲,学生田金方参加会议并做了报告。
  • 2008年6月30日—7月2日,首届生物制药统计学国际学术研讨会(ISBS2008)在上海召开。我院易丹辉教授受邀参加并在会上专题报告近期研究成果,受到各界与会代表的肯定与重视。
  • 2008年8月14日—8月17日,2008国际应用统计研讨会(2008 International Institute of Applied Statistics Studies)在山东烟台召开。我院易丹辉教授、杜子芳教授,博士研究生魏秋萍、李扬参加会议并做报告。
  • 2008年9月23日-10月6日,王晓军老师前往英国城市大学、荷兰阿姆斯特丹进行合作研究。
  • 2008年12月9日——14日赵彦云教授应台湾政治大学的邀请,前往台湾出席“2008产业创新调查国际研讨会”国际学术会议。并做“大陆产业创新研究”报告。
  • 2008年12月19日—20日,金勇进教授应日本东北大学经济学部长Yoshihiko Tsukuda教授的邀请,参加了由东北大学主办的“第二届服务业创新和顾客满意度测评国际研讨会”,并在会议上作为特邀代表做了“National Residential Satisfaction Survey——A Case Study”的专题报告。
  • 2008年12月14日—21日,应辅仁大学谢邦昌教授和政治大学郑宇庭教授的邀请,孟生旺教授带领大陆四所高校(中国人民大学,中央财经大学,首都经贸大学,安徽财经大学)的38名(其中我院师生11名)研究生代表团赴台湾辅仁大学参加“海峡两岸学者暨研究生应用统计研讨会”与考察活动。
  • 2009年4月28日—5月2日,应韩国成钧馆大学(Sungyunkwan University)邀请,统计学院院长金勇进率团成功访问了具有600年校史的成钧馆大学。

§ 学生活动

  • 2008年10月17日至10月19日,2008年第四次全国生存分析与应用统计研讨会在贵州省贵阳民族学院召开。我院博士研究生徐美萍和硕士研究生钟玉洁参加会议并分别做了题为“基于DEA的基金绩效评价研究”和“基于HAR-RV模型的中国股票市场长记忆性研究”的报告。
  • 2008年10月18日至10月19日,第五届风险管理国际研讨会暨第六届金融系统工程研讨会在重庆大学召开。我院博士研究生李标参加会议并做了题为“On A Class of Quadratic Growth RBSDE with Jumps and Its Application”的报告。
  • 海峡两岸学者及研究生应用统计研讨会于2008年12月15日在台湾辅仁大学举行并圆满完成。我院孟生旺教授为团长,带领大陆四所高校(中国人民大学,中央财经大学,首都经贸大学,安徽财经大学)的38名师生参加了本次研讨会,其中我院有11名师生参加。
  • 2008年12月23日,中国人民大学统计学院主办的“第三届首都高校研究生统计论坛”在中国人民大学明德主楼1030召开。

§ 近期活动预告

  • 2009(第六届)中国数据挖掘与商业智能研讨会暨海峡两岸应用统计研讨会
  • 第三届临床评价方法与应用国际研讨会暨临床研究设计与数据分析新进展及其应用国际会议(2009)

中国人民大学统计学院研究生会学术期刊《统计功课》第四期(2008)摘要

期刊简介:本刊是中国人民大学统计学院研究生会的学术类期刊,一年出版一期。其目的是为统计学院各专业的硕士博士生提供一个学术交流和展示的平台,同时也为本科生提供一个学习的机会。本刊收录的文章全部是由统计学院各级研究生自主撰写,其中也包括一些专业课的作业。现应允发表其摘要于统计之都,以供广大统计人士学习、指点与探讨。

一、第二届首都高校统计学研究生论坛论文选登

多重假设检验方法及其在经济计量中的应用

天津财经大学统计学院  中国人民大学统计学院
刘乐平  张龙  蔡正高

摘要:复杂数据和复杂模型的统计推断问题现已成为国内外统计学研究的重要问题。本文以高维复杂数据为研究对象,以多重假设检验的错误控制为主线,对多重假设检验问题的错误控制理论、方法和过程及最新进展进行综述,并对多重假设检验方法在经济计量研究中的应用进行展望。

关键词:多重假设检验,错误发现率,经济计量学,q-值

捕获记忆呈指数消退的捕获反应模型

北京大学概率论与数理统计系 丁丹丹

摘要:本文提出了一个直接估计模型,主要想法是假设动物对陷阱的记忆只与距离最近一次被捕获的时间间隔有关,不同时间间隔代表了动物对陷阱记忆的不同状态,我们假定同一状态的动物具有相同的再捕获概率,并用似然函数求解参数的估计。当假定动物具有永久记忆时,得到传统Mb模型;当假定动物同时具有长期和短期记忆时,得到MM2(B)模型;当假定动物只具有短期记忆时,得到MM1(B)模型。除此之外,该模型还可以描述动物具有更复杂的捕获记忆的情况,本文对其两种扩展模型——中长期记忆模型和中短期记忆模型作了详细讨论。本文同时还提出了动物的捕获记忆呈指数消退的捕获反应模型,用来详细刻画动物的捕获反应。该模型假设动物对于陷阱的记忆随时间的增长呈指数消退,基于这种思想建立参数模型,用最大似然函数方法求解。最后本文对各种模型做随机模拟,并比较其结果,同时根据AIC准则做模型选择,讨论如何挑选最适合的模型。

关键词:中长期记忆模型,中短期记忆模型,指数消退的捕获反应模型,随机模拟

统计数据质量的综合评价

首都经济贸易大学统计学院统计学专业 胡迪

摘要:本文在建立数据质量评价指标体系的基础上,通过层次分析法和模糊综合评判对我国统计数据质量进行了系统分析,以提高我国统计数据质量管理水平及其评估体系的科学性。

关键词:数据质量,层次分析法,模糊综合评价

二、数据挖掘小组研究报告选登

基于贝叶斯分类的保险赔付问题研究

中国人民大学统计学院
王旭  刘冬  石磊 朱建旭

摘要:在理财意识和自我保护意识不断提高的今天,保险业已经收到了越来越多人的关注,成为21世纪的朝阳产业。对保险行业而言,如何通过特定的人群属性来辨别高赔付风险的人群,其意义不言而喻。从而,本文的目的是根据相应的人群属性来对保险赔付情况进行研究。由于贝叶斯分类法具有坚实的数学理论基础,是公认的较为有效和常用的一种分类方法,所以,本文在充分考虑了数据自身的特点之后,将贝叶斯分类器作为主要的分析工具。结合保险行业1981年至2002年的实际赔付数据,本文首先尝试了朴素贝叶斯方法,分析了多个人群属性特征变量对赔付概率的影响,进而利用Cooper和Herskovits在1992年提出的K2算法训练贝叶斯网络模型,并将模型预测结果与传统分类器(如cart、logistic回归等)及朴素贝叶斯进行比较。鉴于K2算法自身存在的一些缺陷,本文进一步提出了基于关联规则的贝叶斯网络模型,并通过学习得到了预测能力良好且较为鲁棒的保险赔付测算模型。

关键词:保险业,数据挖掘,赔付,贝叶斯网络

健康食品消费人群细分与广告营销模式探讨

中国人民大学统计学院 杨晨  钱政超  苏晶晶  程冬旭

摘要:近年来,随着经济发展和人们生活水平的提高,越来越多的人开始关注健康、投资健康,健康消费已经成为一种时尚。在这种大环境下,不少厂商开始试图拓展健康食品的市场。本研究报告时受某健康食品厂委托,针对现有健康食品消费者进行特征分析,考察其潜在客户,预测市场份额并试图提出合适且有针对性的营销策略。

关键词:健康食品,人群细分,营销模式

数据挖掘技术在信用卡违约风险中的应用

中国人民大学统计学院 冯靓

摘要:随着世界经济的不断增长和信息技术的迅猛发展,全球的信用卡使用量持续上升,信用卡已经成为支付领域的主要媒介。信用卡的消费信贷功能具有解决持卡人临时资金短缺、提高即时购买力、满足大众消费信贷等优势,同时还有利于调整和改善银行资产结构。但与此同时,高风险用户也随着信用卡业务量的不断扩大不断积累,给银行带来极大的经济损失。本文力图运用数据挖掘技术中的决策树、Logistic Regression方法从现有数据库中提取出潜在的有效分类信息,为甄别高风险用户提供决策依据。

关键词:信用卡,数据挖掘,决策树模型,Logistic Regression模型

三、我们的功课

稀有事件变点问题的Bayes分析

中国人民大学统计学院 钟颖

摘要:本文针对稀有事件的变点问题,根据Bayes发建立了判断变点是否存在、计算变点位置的合理模型,并利用基于Gibbs抽样的MCMC模拟抽样,估计出变点和分布参数之值。然后引用美国煤矿灾难和我国关中地区干旱灾害的实际数据,检验了文中提出方法的可行性。

关键词:稀有事件,变点,Bayes法,Gibbs抽样

分层抽样下的西蒙斯随机化回答模型

中国人民大学统计学院  谢佳斌

摘要:本文通过结合分层抽样技术和西蒙斯模型,提出了分层抽样下奈曼分配时的西蒙斯随机化回答模型。该模型在应用于总体为分层总体的时候比简单随机抽样下的西蒙斯模型有着更高的精度,在实际的调查操作中也有着更强的可行性。此外,本文还探讨了受访者在不完全真实回答情况下的情形,并对模型进行了改进。

关键词:分层抽样,西蒙斯模型,随机化回答技术

煤炭价格波动对新疆工业的影响——基于CGE模型的分析

中国人民大学统计学院 邢瑞军

摘要:本文通过建立可计算一般均衡(CGE)模型,模拟了宏观经济的运行情况。并在假定其它因素不变的情况下,分析煤炭价格的波动对新疆工业的影响,对政府部门的宏观经济政策提供了决策上的支持。

关键词:可计算一般均衡,宏观经济模拟,煤炭价格