现代统计主要起源于研究总体(population),变异(variation)和简化数据(reduction of data)。
第一个经典文献属于John Graunt(1620-1674),他注意到在非瘟疫时期,一个大城市每年死亡数有统计规律,而且出生儿的性别比为1.08,大城市的死亡率比农村地区要高,估计出了六岁之前儿童的死亡率,并相当合理地估计出了母亲的死亡率为1.5%。他还给出了一个新的寿命表。
瑞士数学家 Leonhard Euler(欧拉)(1707-1783)提出了平稳生命表的概念。John DeWitt(625-1672)等人最早讨论退休金和人寿保险的方案。
当时在研究诸如死亡等时间序列时,Graunt注意到了随机的起伏;这种不规则的变化也影响赌博和天文学。因此,其后进一步导致了随机误差的误差分布概念的出现。
赌博产生了第一个机会事件的模型:Abraham de Moivre(棣美佛)(1667-1754)导出了对二项分布的一个近似;这使每一个概率都等于正态曲线下的一块面积,这是一种中心极限定理。
Ladislaus von Bortkiewicz(1868-1931)报告了在普鲁士兵团中由马踢受伤事故,发现Poisson分布和官方统计学有关。Poisson分布也被 Ernst Abbe(1840-1905)用在计算血红细胞数目上。
Johann Gregor Mendel(孟德尔)(1822-1884)认识到某些主要遗传基因的存在,它们在0,l和2三个水平显现,其中水平0(双隐性)能和水平1和2区别开来。他能确定有相同或不相同的水平的个体之间交配的结果,而且提出了某些生物学事件等价于掷一个硬币的模型;他能对任意交配的结果给出概率并用实验来验证其假设。
Philippe Pinel(1745-1826)和 Pierre Charles alexandre Louis(1787-1872)开始了建立疾病分类的困难课题;这些工作人员保存了精确和完整的所有病例的记录,并且能给出和预后有关的统计数字。
Louis利用跟踪调查的方法,反驳以当时广泛滥用的放血疗法。
Francis Galton(1822一1911)在1886年研究了两代豌豆重量之间的相关时发现了Y关于一个正态变量X的线性回归及类似于椭圆的等概率线。他发明了百分位数法,提出了相关与回归。
正态分布在理论统计中扮演了一个非常重要角色。一般来说,如果一个模型包含着正态分布的几个非一般特性,则它一定具备所有的特性。
1890-1920年为止的英国生物统计学派的主要成就:
(i)收集并化简了许多经验数据;
(ii)定义了具有多重和总相关系数ρ的联合正态分布,还定义了估计误差的联合分布;
(iii)关于拟合度的χ2检验,比较观察分布和理论分布,包括由 Herbert Edward Soper(1865-1930)引进的条件Poisson变量;
(iV)分析列联表,特别是利用χ2统计量;
(V)当边缘分布充分细分时由最大似然法估计ρ;
(Vi)当边缘分布没有充分定义时估计ρ;
(Vii)由一个统一的参数估计系统来描述一组曲线,即矩方法;
(Viii)利用正态定理到遗传选择问题;
(iX)独立性一般定理的某些进展;
(X)估计和检验估计精确性的一个理论的进展;
(Xi)构造了适当的表。
William Sealy Gosset(1876一1937)导出了一个检验;按照R.A.Fisher的建议,该检验在作了一个变换之后成为现在熟知的t-检验,使得小样本统计成为可能。
Neyman-Pearson(1894-1981)及 Egon sharpe Pearson(1895一1980)在一系列著名的文章中澄清了推断理论,特别是有关显著性检验的基本原理。早期的显著性检验为关于二项变量之间或均值之间的,它们被 K.Pearson推广至χ2检验,被R.A.Fisher推广到F-检验,推广了Student T-检验。Neyman和 E.S.Fearson看出,为了更有效,应该考虑与待检验的零假设相对应的备择假设。他们验证了大多数常见的显著性检验的应用,还引进了置信限。
现代统计学发展了除了很多专业应用,包括决策论,时间序列,多元分析,经济计量学,博奕论,临床试验,非参数推断,序贯分析,数学生物分类学等。
1948年,郭祖超(1912-1999)出版中国第一部医学统计学教材《医学与生物统计学方法》
联系客服