统计学起源详解
统计学历史

统计学历史1.起源与发展统计学的起源可以追溯到古代,当时人们已经开始收集并整理数据,尝试理解并预测社会和自然现象。
在古代,统计学最初用于人口普查、土地测量和商业计算。
然而,统计学作为一门科学,其真正的起源和发展是在17世纪和18世纪,当时欧洲的社会和政治环境发生了巨变。
在这个时期,政府开始更多地依赖数据来制定政策,而商业界也开始利用数据来理解市场需求和预测市场趋势。
这个时期标志着统计学的诞生。
2.理论与方法随着统计学的发展,各种理论和方法也相继出现。
从最初描述性统计学的概念,例如平均数、中位数和方差等,到后来更复杂的方法如回归分析和时间序列分析,以及多元统计分析等,这些理论和方法的发展都极大地推动了统计学的发展。
同时,计算机科学的发展也为统计学的进步提供了强大的技术支持。
3.应用的扩展统计学在各个领域都有广泛的应用。
在社会科学中,统计学被用于研究社会现象的分布和趋势,如人口统计学、社会调查等。
在医学中,统计学被用于研究疾病的分布和预测,以及临床试验的设计和数据分析。
在商业中,统计学被用于市场调研、质量控制和风险管理等。
此外,统计学还在物理、化学、生物、环境等领域都有广泛的应用。
4.中国统计学的发展在中国,统计学的历史虽然较短,但发展迅速。
中国统计学的发展始于20世纪初,当时主要是学习西方统计学理论和方法,并进行简单的数据分析和解读。
随着中国的改革开放和现代化进程的加速,统计学得到了越来越广泛的应用和发展。
如今,中国的统计学已经在各个领域都有广泛的应用,并且在一些特定领域如社会调查、市场调研和风险管理等方面已经具有了一定的国际影响力。
5.国际统计学的发展国际统计学的发展也经历了多个阶段。
在20世纪初,国际统计学主要是在欧洲和北美地区发展,当时的统计学研究主要集中在描述性统计学的理论和方法的完善上。
随着时间的推移,越来越多的国家和地区开始发展自己的统计学研究和应用。
例如,在亚洲的日本、印度和中国等地,统计学的应用和发展都得到了高度重视和支持。
统计学的产生与发展

统计学的产生与发展统计学的产生与发展是一个悠久且不断演进的过程。
统计学的萌芽产生在欧洲,其原始形态可以追溯到远古社会的“结绳记数”,这是人类统计实践活动的起点,标志着统计学的远古起源。
然而,统计实践上升为理论并形成统计学的时期,则是近代的事情,距今只有300多年的历史。
从17世纪中叶到18世纪中叶,这是统计学的创立时期,也被称为古典统计学时期。
在这一时期,统计学理论初步形成了一定的学术派别,主要有国势学派和政治算术学派。
国势学派又称记述学派,主要产生于17世纪的德国,以文字记述国家的显著事项。
而政治算术学派则更侧重于用数字和分析方法来研究社会经济问题。
从18世纪末到19世纪末,统计学进入了近代时期。
这一时期的主要贡献是建立和完善了统计学的理论体系,并逐步形成了以随机现象的推断统计为主要内容的数理统计学和传统的政治经济现象描述为主要内容的社会统计两大学派。
数理统计并非独立于统计学的新学科,而是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。
从19世纪末开始,统计学进入了现代统计学时期。
在这个时期,数理统计学与社会统计学逐步融合成为统一的现代统计学。
这一时期的统计学不仅在理论和方法上有了更深入的发展,而且应用领域也更为广泛,涵盖了社会科学、自然科学、工程技术等多个领域。
总的来说,统计学的产生与发展是和生产的发展、社会的进步紧密相联的。
它伴随着人类社会的发展,从最初的简单计数到如今的复杂数据分析,经历了从描述性统计到推断性统计,再到现代统计学的演变过程。
如今,统计学已经成为一门重要的方法论科学,广泛应用于各个领域,为人类的科学研究和社会发展提供了有力的支持。
了解统计学的历史和发展

了解统计学的历史和发展统计学是一门研究数据收集、分析和解释的学科,广泛应用于各个领域,如经济学、社会学、医学等。
了解统计学的历史和发展对于理解这门学科的基本概念和方法、掌握其应用的原理和技巧具有重要意义。
本文将带领读者回顾统计学的发展历程,介绍统计学的基本原理和方法,并探讨其在现代社会中的应用。
一、统计学的起源统计学的起源可以追溯到古代社会的人口普查和土地调查。
在古代,人们常常需要对人口数量、财富分配和土地利用等进行统计,以便更好地管理资源和收税。
然而,当时的统计方法较为简单,主要依赖于人工数数和记录。
随着科学方法的发展,统计学逐渐形成了自己的理论体系和方法论。
17世纪,意大利数学家威廉·莱布尼兹和雅各布·贝尔努利等人开始探索数据的收集和分析方法,并提出了一些基本的概率理论。
18世纪,英国政治家约翰·格雷和法国统计学家阿道夫·奥古斯特·奥古斯坦·克尔尼对人口数据进行了深入研究,并提出了一些基本的统计原理。
二、统计学的基本原理和方法统计学的基本原理主要包括概率、抽样和推断。
概率是指随机事件发生的可能性,通过概率理论可以对事件的发生进行量化和分析。
抽样是指从总体中选择一部分样本进行观察和测量,通过对样本数据的分析可以推断总体的特征和规律。
推断是指通过对样本数据进行统计分析,进而推断总体数据的特征和规律。
统计学的方法主要包括描述统计和推断统计。
描述统计是对数据进行汇总、整理和展示,以便更好地理解数据的特征和分布。
常用的描述统计方法包括频数分布表、直方图和散点图等。
推断统计是通过对样本数据的分析,来推断总体数据的特征和规律。
常用的推断统计方法包括参数估计、假设检验和回归分析等。
三、统计学的应用统计学在现代社会中广泛应用于各个领域。
在经济学中,统计学被用来分析经济数据,预测经济走势,评估经济政策的效果。
在社会学中,统计学被用来研究社会现象和社会关系,如人口数量、教育水平和就业情况等。
统计学的历史与发展

统计学的历史与发展统计学是研究数据收集、分析、解释和呈现的科学方法。
它通过使用数学和统计原理来帮助我们理解和解释现实世界中的数据,从而对各种问题做出准确的判断和预测。
本文将介绍统计学的历史发展,详细探讨统计学在不同领域的应用,以及未来统计学的发展趋势。
1. 古代统计学的起源在古代,人们就开始意识到数据的重要性,并通过不同的方式进行数据的收集和分析。
例如,古代中国的黄帝内经中就包含了对人群体质的统计分析,为后世的医学研究提供了有力的依据。
另外,古代埃及和巴比伦也培养了一些数据处理和计算的技术。
2. 统计学的现代起源统计学的现代起源可以追溯到17世纪。
正是在这个时期,人们开始关注经济和人口的统计数据,并意识到这些数据对社会和政府决策的重要性。
1654年,约翰·格劳恩沃尔德在《观察论》中首次提出了一些现代统计学的概念,为统计学的发展奠定了基础。
随着时间的推移,统计学的理论和方法逐渐完善。
3. 统计学的应用领域统计学的应用领域广泛,几乎渗透到各个学科和行业。
在社会科学领域,统计学被用于研究人口、教育、经济等方面的数据,帮助分析社会现象和问题。
在自然科学领域,统计学在物理学、化学、生物学等领域中起着重要作用,帮助科学家通过数据分析和实验设计得出结论。
此外,统计学在医学、工程、金融等领域也有广泛的应用。
4. 统计学的发展趋势随着科技的进步和大数据时代的到来,统计学将面临更多挑战和机遇。
首先,统计学将需要适应和应用新兴技术,例如机器学习和人工智能,以提高数据处理和分析的效率。
其次,统计学将需要更多的跨学科合作,与其他领域的专家共同解决复杂的问题。
此外,统计学还应注重数据伦理和隐私保护,确保数据的合法和安全使用。
综上所述,统计学作为一门重要的科学方法,在数据分析和解释方面发挥着重要作用。
它的历史发展可以追溯到古代,而现代统计学的起源可以从17世纪开始。
统计学在各个学科和行业都有广泛的应用,未来将面临更多的挑战和机遇。
《统计学的起源》课件

2
坎特洛维奇
坎特洛维奇是现代统计学的开创者之一,他提出了概率论与统计学的紧密关系, 奠定了统计学的基本理论。
3
统计学的分支
统计学涵盖了多个分支,包括描述统计、推断统计、回归分析、实验设计等,为 各个学科领域提供了强大的工具。
统计学的应用
社会学
统计学在社会学研究中用于收集和分析人口、教 育、劳动力等数据,帮助研究社会现象和社会结 构。
经济学
经济学家使用统计学来分析经济现象、市场趋势 和预测,为经济决策提供可靠的依据。
医学
医学研究需要使用统计方法来分析疾病的发病率、 治疗效果等数据,帮助制定医疗政策和决策。
生态学
生态学研究需要统计数据来分析物种多样性、生 态系统的稳定性和变化,以及环境管理和保护的 决策。
统计学的未来
1 新技术的应用
随着人工智能、大数据和机器学习等新技术的发展,统计学将在数据处理和分析方面扮 演更重要的角色。
2 数据的快速增长
随。
3 统计学领域的涉及扩展
统计学将进一步涉及到更多的领域,如社交网络分析、生物信息学等。
《统计学的起源》PPT课 件
统计学起源于古代,经历了漫长的发展历史,如今已成为各个学科领域中不 可或缺的工具和方法。
什么是统计学?
统计学是一门研究如何收集、处理、解释和分析数据的学科。它帮助我们理 解数据背后的规律性和关联性。
统计学的起源
古代统计学
在古代,人们就开始使用统计方法来进行人口普 查和资源调查,为决策和规划提供依据。
近代统计学
随着科学方法的发展,统计学逐渐成为一门独立 的学科,并且应用范围不断扩大。
古代统计学的发展
1
古罗马
2
古罗马时期,人们使用统计方法对人口、 军队和土地进行统计和记录。
统计学的发展历程

统计学的发展历程统计学是一门研究数据采集、分析和解释的学科。
它起源于古代人类对数据的记录和分析的需求,并在过去几个世纪中不断发展和演变。
以下是统计学的发展历程的详细描述。
1. 古代统计学的起源统计学的起源可以追溯到古代文明时期,人们开始对人口、土地和财富等数据进行记录和分析。
古代埃及、巴比伦和中国等文明都有相关的统计记录,例如埃及的人口普查和中国的农业产量统计。
2. 概率论的发展17世纪,概率论的发展为统计学的进一步发展奠定了基础。
数学家布莱兹·帕斯卡和皮埃尔·德费尔马特等人对概率论进行了深入研究,为后来的统计学家提供了理论基础。
3. 统计学的早期发展18世纪末到19世纪初,统计学开始成为一门独立的学科。
德国数学家卡尔·高斯和英国统计学家弗朗西斯·高尔顿等人对统计学的理论和方法进行了重要的贡献。
高斯提出了正态分布曲线和最小二乘法等概念,高尔顿则开创了现代统计学的基本原理。
4. 统计学的应用拓展19世纪中叶,统计学开始在各个领域得到广泛应用。
政府机构开始使用统计学方法进行人口普查和经济数据采集。
同时,统计学也在医学、社会学和心理学等学科中得到应用,为这些学科的研究提供了数据支持。
5. 现代统计学的兴起20世纪,随着计算机技术的发展,统计学进入了一个新的阶段。
数学家罗纳德·费舍尔和杰拉尔德·韦尔斯等人提出了现代统计学的基本原理和方法,例如假设检验、方差分析和回归分析等。
统计学开始广泛应用于科学研究、工程和商业领域。
6. 统计学的发展与创新近年来,随着大数据时代的到来,统计学又面临了新的挑战和机遇。
统计学家们不断创新和发展新的统计方法和模型,以适应大数据分析的需求。
机器学习、数据挖掘和人工智能等技术的发展也为统计学带来了新的发展机遇。
总结:统计学的发展历程经历了数千年的演变和创新。
从古代的数据记录到现代的大数据分析,统计学在科学研究、社会和经济发展中发挥着重要的作用。
统计学发展历程简述

统计学发展历程简述
统计学是一门通过搜索、整理、分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。
其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。
据权威统计学史记载,从17世纪开始就有了“政治算术”、“国势学”,即初级的社会统计学,起源于英国、德国。
几乎同时在意大利出现了“赌博数学”,即初级的概率论。
直到19世纪,由于概率论出现了大数定理和误差理论,才形成了初级的数理统计学。
也就是说,社会统计学的形成早于数理统计学两个世纪。
由于社会统计学广泛地用于经济和政治,所以得到各国历届政府的极大重视,并得到系统的发展。
而数理统计在20世纪40年代以后,由于概率论的发展,而得到飞速发展。
经过近400年的变迁,目前世界上已形成社会统计学和数理统计学两大体系。
两体系争论不休,难分伯仲。
浅析统计学的起源

浅析统计学的起源浅析统计学的起源摘要从逻辑和历史两个角度对推断统计学的起源进行了尝试性的索关键词:统计史;起源引言:史学研究历来受思想家们的重视,说史学研究应成为任何学科永恒的研究主题丝毫也不过分,因为早在两千多年前,中国古代伟大的思想家孔子,在论语中就曾留下了温故而知新的至理名言,而16世纪著名的英国哲学家培根也曾说过,读史使人明智。
如果套用统计学里的一句专业术语,那就是历史具有遍历性。
任何历史研究都必须首先限定其研究的时间范畴,对于推断统计史而言,一个首要问题就是:推断统计学的历史应该从哪里开始?为说明这个问题,我们首先探究一下统计学是什么。
按一般统计学教材或百科全书上的定义:统计学是一门关于如何有效地收集、整理、表述、分析和解释数据的学科。
其中的数据即为统计学的研究对象,因此统计学也被认为是一门从数据中获得有用信息的数据分析学科。
需要强调的是,统计学研究的数据一定要具有随机性,也就是说可以通过某种概率分布规律来描述数据的分布状态,这一点也是统计学有别于其他处理数据学科的最重要特征。
在上述统计学的定义下,统计学又可划分为描述统计与推断统计。
描述统计是一种通过图形、列表、数量化度量等方法描述样本数据基本特征的统计方法,其作用是对样本数据进行初步精炼,虽然在很多情况下样本数据的特征可用来推断总体的特征,但这需要给出推断的误差精度,由于描述统计中不包含任何关于误差精度的陈述,故其结论也就仅局限于样本数据,与总体无关,从而也不存在推断问题。
不过统计学的终极目的是希望通过样本来获取总体信息,故推断统计,即利用样本信息以及其它信息,获取有关样本所处总体信息的推断理论,就成为描述统计进一步发展的必然产物。
下面我们引述有关文献给出的几个相当久远的例子加以说明。
古印度部落国王图潘纳为了炫耀自己的数学能力,他告诉自己的马车夫纳拉一个被放逐的国王,说他猜测出了一颗巨大果树两个枝干上的树叶与果实的数量,纳拉经过一夜的计算,吃惊地发现图潘纳的猜测非常接近实际的真实数量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1章绪论§1.1 统计学的产生和发展一般认为,统计学于十七世纪中叶在英国产生。
关于统计学的创始人,一种说法认为是英国人约翰·格朗脱(John Graunt,1620~1674)①,另一种说法认为是英国人威廉·配第(William Patty,1623~1687)②。
统计史中把他们两人开创的学派叫作“政治算术学派”并称他们二人为政治算术学派的创始人(参见[1]第10页,[2]第29页)。
因此,也可以说,十七世纪中叶政治算术学派在英国的创立,标志着统计学的诞生。
不过,政治算术学派时代的统计学当时在英国叫作“政治算术”而不叫“统计学”。
大体上与政治算术学派同时,在德国有所谓“国势学派”。
这个学派曾使用statistik一词(“统计学”一词的德文原形)作为国势学的名称。
政治算术学派与国势学派在学术主张上的主要区别是:前者主张用数量来研究国情而后者主张用文字来记述国情。
经过百余年的争论,学术界公认把statistik的英译文statistics作为政治算术活动的同义语来使用([1]第67页,[2]第70页)。
这样,政治算术学派的活动以及在这种活动的基础上进一步发展的各种新进展便都有了“统计学”的名称。
配第的主要著作有:《赋税论》(1662),《政治算术》(可能完成于1676年,于1690年出版),《献给英明人士》(1664年完成,1691年出版),《爱尔兰的政治解剖》(1672年完成,1691年出版),《货币略论》(1682年完成,1695年出版)([2]第33~34页,[4]第107页)。
在这些著作中,从统计学的角度来看,配第的主要贡献是:(1)提出了“政治算术”方法。
这种方法的特点是:用数字来描述一国的经济状态和水平,并以此为依据为执政者提出建议。
如《政治算术》一书中用数字叙述荷兰和法国、英国和法国国力的对比以及英国国力的增长,论证“英格兰的情况和各种问题,并非处于可悲的状态”,为英国争夺世界霸权出谋划策([1]第11~13页)。
(2)提出了国民收入概念并对英国国民收入进行了估算([4]第109页,[25]第1~2页,[26]第8~9页)。
这是首次用一个指标反应一国经济总规模的尝试。
(3)在配第进行的国民收入的计算中,可以见到现代国民经济核算中计算国民收入的支出法和收入法以及利用复式记账反应经济活动方法的雏型。
配第把国民收入(他称作“人民的收入”)定义为每年人民劳动的价值与每年国民财富的收入之和。
后者他所指的是地租、利息和利润。
与总收入平衡的另一方是总支出,就是人民每年的费用或消费支出,包括私人的和集体的,指食物、住房、衣着及其它等等,然后留下一部分盈余([4]第109页,[25]第1~2页,[26]第8~9页)。
(4)提出了根据经济联系推算统计数据的方法。
配第在作国情研究的时候,有许多需用的数据在当时很难找到,于是他就通过间接的途径去估算它们。
例如,要计算伦敦的人口,他就用30乘以安葬人数——假定每年30人中有1人死亡([4]第108页)。
格朗脱的代表著作是《关于死亡表的自然与政治的观察》(1662)。
该著作对统计学的贡献是([3],1999年第3期第61~62页):(1)提出了“数据简约”的概念。
即把数量庞大的杂乱无章的数据,依据种种分类标准整理成一些意义明晰的表格,使数据中包含的有用信息凸现出来。
这种工作直到今天仍被统计学家视为基础性工作。
(2)提出并举例处理了数据的可信性问题。
数据的可信性指的是,是否有人出于某种目的而对数据作了篡改,或在获取数据的过程中出现重大的失误(如仪器未调准或登录时书写有误)。
样本中这样的数值叫作异常值。
鉴别数据中是否有及何者可能为异常值,直到今天仍然是一个在应用上很重要,并在方法研究上受到重视的问题。
(3)有了频率稳定性的意识。
频率稳定性是说某种特性出现的频率会随着观察次数(样本量)的增加而趋于稳定。
格朗脱在书中并未用明确的语言把这作为一个一般原则提出来,但通过他对数据的具体处理,显示了他的统计分析是基于这样一个原则。
他应用伦敦和罗蒙塞两地的男女出生(洗礼)数和死亡数,以8年为一时期,算出在伦敦男、女出生率之比为14:13,在罗蒙塞为16:15。
这是在历史上首次通过具体资料证明男、女出生率各自有其稳定值且略有差异。
(4)编制生命表。
生命表是指现存人口的年龄分布。
这有多方面的用途。
例如可以计算出在某一年龄间隔内的人数的百分比,可以计算活到某一年龄a的人中,至少再活b年的百分比,而这对于保险金、年金等的计算有直接的关系。
格朗脱在本书中首次提出了生命表的概念,并计算了现已知的第一个生命表。
虽则它的推理粗糙甚至有些想当然的成分,但仅是引进这个概念,就已对后世有了很大的影响。
从上面所介绍配第和格朗脱所作的工作可以看到,统计学从其产生的时候起就有着两种不同的研究任务③。
后面我们还要说到,随着统计学的发展,后来在研究任务上又有了进一步的拓展。
下面依照统计学的不同研究任务来勾勒统计学的发展进程。
第一种研究任务统计学的第一种研究任务是从配第开始的。
配第自己提出的任务是用数字描述国家的社会经济状态。
这就必须首先设计科学的可操作的统计指标和指标体系。
配第做了这样的工作。
他提出了国民收入的概念,并设计了这个指标的计算方法。
与《政治算术》类似,英国人金(Gregory King,1648~1712)于1696年写成《对英格兰国势的自然观察和政治观察的结论》。
他在该书中提供了英格兰、苏格兰、爱尔兰、德国、法国、意大利、荷兰、中国、欧洲、亚洲、非洲和美洲的每人占地亩数和居住亩数;编制出英国各社会集团的收支平衡表;他还估计英国当时的全国国民收入数字为43,500,000镑而支出为41,700,000镑,等等([2],第43~44页)。
到19世纪,随着时代的推移,经济生活日趋复杂,人们对于经济问题的关注也与日俱增。
首先是国家的需要,为测定经济增长速度和人民生活水平,制订经济、财政和税收计划等,需要有及时、确实的统计数字资料作为依据。
其次是社会的需要:经济盛衰的变化,就业机会的多寡,物价的升降,关系到社会上的每一个人,他们希望看到这方面的统计数字。
再次是科研的需要:经济学家为实证或建立新的理论,不能不借助于经济统计数字资料。
因此,国家统计机关和民间统计组织——包括物产交易所,证券交易所,经济、统计研究机构,大学的经济、统计研究所,都定期或不定期地举办各种经济调查,包括农业统计调查、工业统计调查、商业统计调查等;同时,国民收入核算理论方法的研究和应用、指数理论方法的研究和应用到这时也有了长足的发展 (参见[2],第172~189页)。
从上面的叙述中,我们可以看出现今人们所称的经济统计学形成的大致过程。
第二种研究任务统计学的第二种研究任务是从格朗脱开始的。
前面列举了格朗脱对统计学的若干贡献。
这些贡献说到底就是如何处理对同类现象不同个体的观察数据,并找出数据中隐藏的规律。
在格朗脱工作的影响下,德国牧师约翰·彼得·苏斯密尔希(Johann Peter Süssmilch,1707~1767)继续研究人口数据中的规律,写了一本书叫做《神的秩序》(1741)。
他在这本书中比格朗脱进了一步,明确提出,数据中隐藏的规律(他称之为“神定的秩序”)必须在大量的数据中才能揭示出来。
所以统计史公认他是明确倡导大量观察法的第一人④(参见[1]第22~26页,[2]第46~49页,[4]第117页)。
十九世纪中叶,比利时统计学家亚道尔夫·凯特勒(L.A.J.Quetelet,1796~1874)继续倡导大量观察法,认为“对性质相同的事物作大量的观察和数量的比较”,可以得到“平均人”(转引自[2],第89页)。
他所说的“平均人”是指用我们作大量观察的人群中得到的各种特征的平均值表示的一个典型化、抽象化了的人。
实际上这是在大量观察数据中揭示出来的人的各种特征的规律值。
无疑(凯特勒自己也指出),进行大量观察的数据应当是同质的。
那么,当我们面临一批我们对其背景不很了解的数据时,如何根据数据本身去判断其同质性呢?凯特勒把高斯发现的反复测量同一物体得到的测量误差分布的规律——正态分布——移植到统计数据(对不同对象的观测值)中来,试图把一批数据是否能充分好地拟合一个正态分布作为该批数据是否同质的一个判据⑤。
凯特勒这项工作的重要意义在于他倡导并身体力行将正态分布用于(连续型)统计数据(而不是对同一物体的测量误差数据)的分析(描述)。
到十九世纪后期,人们注意到并非所有的数据都能用正态分布拟合,相反,有些数据的分布是偏态的。
卡尔·皮尔逊(Karl Pearson,1857~1936)希望找出一些分布去拟合从实际问题中来的数据,以便在正态分布不适用时可供选择使用。
他在1892~1895年间以一组论文发表了他的研究成果——皮尔逊曲线族。
回归与相关理论的形成是描述统计阶段向推断统计转变的契机。
文献[3](1999年第5期第57~64页)在介绍了这一段史实后指出,十九世纪七十年代至二十世纪初由遗传学家费朗西斯·高尔登(Francis Galton,1822~1911)开始并由卡尔·皮尔逊和乔治·尤德尼·约尔(George Udny Yule,1871~1951)使之完善化的回归与相关理论的产生与发展是统计学史上的一个具有重大意义的事件。
这项发现沟通了原来互不相干的两个领域——误差论线性模型和统计学(参看本章注释④),成为二十世纪上半叶统计方法重大发展的契机。
由于回归与相关涉及问题的复杂和多方面,因而促进了一个严整的统计学框架的建立。
所以从某种意义上可以说,这项发展标志着统计学描述时期的结束和推断时期的开端。
在二十世纪,首先有英国人戈塞特(William Sealy Gosset,1876~1937)于1907年提出了小样本统计量的t分布理论。
后来经过R·费希尔(Ronald Aylmer Fisher,1890~1962)、内曼(Jerzy Splawa Neyman,1894~1981)、E·S·皮尔逊(E S Pearson,1895~1980)、沃尔德(A Wald,1902~1950)等人的努力,到二十世纪中叶,构筑了推断统计学(数理统计学)的基本框架。
总结来说,统计学的第二种任务是从研究大量同质数据中的数量规律开始的。
事实上,这些数据(它们无论是对同一对象的多次观测结果还是对不同对象的观测结果)是某一个可以重复进行的随机试验的的试验结果,而我们要寻找的数量规律则是这个随机试验的统计规律。
从理论上说,这种规律可以在无限重复同一试验的过程中表现出来,可是,“无限重复”地试验实际上是不可能的,人们能够做到的只能是有限次试验。