医学统计学简史

现代统计主要起源于研究总体（population），变异（variation）和简化数据（reduction of data）。

第一个经典文献属于John Graunt（1620－1674），他注意到在非瘟疫时期，一个大城市每年死亡数有统计规律，而且出生儿的性别比为1.08，大城市的死亡率比农村地区要高，估计出了六岁之前儿童的死亡率，并相当合理地估计出了母亲的死亡率为1.5％。他还给出了一个新的寿命表。

瑞士数学家 Leonhard Euler（欧拉）（1707－1783）提出了平稳生命表的概念。John DeWitt(625－1672)等人最早讨论退休金和人寿保险的方案。

当时在研究诸如死亡等时间序列时，Graunt注意到了随机的起伏；这种不规则的变化也影响赌博和天文学。因此，其后进一步导致了随机误差的误差分布概念的出现。

赌博产生了第一个机会事件的模型：Abraham de Moivre（棣美佛）（1667-1754）导出了对二项分布的一个近似；这使每一个概率都等于正态曲线下的一块面积，这是一种中心极限定理。

Ladislaus von Bortkiewicz（1868－1931）报告了在普鲁士兵团中由马踢受伤事故，发现Poisson分布和官方统计学有关。Poisson分布也被 Ernst Abbe（1840－1905）用在计算血红细胞数目上。

Johann Gregor Mendel（孟德尔）（1822－1884）认识到某些主要遗传基因的存在，它们在0，l和2三个水平显现，其中水平0（双隐性）能和水平1和2区别开来。他能确定有相同或不相同的水平的个体之间交配的结果，而且提出了某些生物学事件等价于掷一个硬币的模型；他能对任意交配的结果给出概率并用实验来验证其假设。

Philippe Pinel（1745-1826）和 Pierre Charles alexandre Louis（1787－1872）开始了建立疾病分类的困难课题；这些工作人员保存了精确和完整的所有病例的记录，并且能给出和预后有关的统计数字。

Louis利用跟踪调查的方法，反驳以当时广泛滥用的放血疗法。

Francis Galton（1822一1911）在1886年研究了两代豌豆重量之间的相关时发现了Y关于一个正态变量X的线性回归及类似于椭圆的等概率线。他发明了百分位数法，提出了相关与回归。

正态分布在理论统计中扮演了一个非常重要角色。一般来说，如果一个模型包含着正态分布的几个非一般特性，则它一定具备所有的特性。

1890－1920年为止的英国生物统计学派的主要成就：

（i）收集并化简了许多经验数据；

（ii）定义了具有多重和总相关系数ρ的联合正态分布，还定义了估计误差的联合分布；

（iii）关于拟合度的χ2检验，比较观察分布和理论分布，包括由 Herbert Edward Soper（1865－1930）引进的条件Poisson变量；

（iV）分析列联表，特别是利用χ2统计量；

（V）当边缘分布充分细分时由最大似然法估计ρ；

（Vi）当边缘分布没有充分定义时估计ρ；

（Vii）由一个统一的参数估计系统来描述一组曲线，即矩方法；

（Viii）利用正态定理到遗传选择问题；

（iX）独立性一般定理的某些进展；

（X）估计和检验估计精确性的一个理论的进展；

（Xi）构造了适当的表。

William Sealy Gosset（1876一1937）导出了一个检验；按照R.A.Fisher的建议，该检验在作了一个变换之后成为现在熟知的t-检验，使得小样本统计成为可能。

Neyman－Pearson（1894－1981）及 Egon sharpe Pearson（1895一1980）在一系列著名的文章中澄清了推断理论，特别是有关显著性检验的基本原理。早期的显著性检验为关于二项变量之间或均值之间的，它们被 K.Pearson推广至χ2检验，被R.A.Fisher推广到F-检验，推广了Student T-检验。Neyman和 E.S.Fearson看出，为了更有效，应该考虑与待检验的零假设相对应的备择假设。他们验证了大多数常见的显著性检验的应用，还引进了置信限。

现代统计学发展了除了很多专业应用，包括决策论，时间序列，多元分析，经济计量学，博奕论，临床试验，非参数推断，序贯分析，数学生物分类学等。

1948年，郭祖超（1912-1999）出版中国第一部医学统计学教材《医学与生物统计学方法》

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。