统计规律

合集下载

统计规律性是社会现象发展规律在量上的反映

统计规律性是社会现象发展规律在量上的反映
. , , , ,
例关 系 因 此 统计 也 应 将这 些联 系 的许多单位进 行
定 性 分析 拟 定 联 系 中 同一 的 稳 定 的和 必 然 联 系的

单 位 初 步 作为 主要 的 调 查单位
.
,

对 现 象发展 中主 要 单位进行分析 也有 主要
.
方 面 和 次 要 方 面 的单 位
, 。
都 渊 源于
必 有一 方 面是 主要 的 它 方 面 是 次要 的 、 , , ` 妞 认。 。 , 。 , * 二 曰 、 。、 ……” ② 胃统计 应 用这 种 观 点对 现 象 进 行具 体分析
,, 。
统计科学 是认识社会现 象最有力的武 器 对社会 现 象 开 展 正确 的调查研究 认识 材 料
。 ,

民 盟中央
李 宇
律 的表 物 的发 展过 程 中
,
有 许 多的 矛 盾存 在
” 、 “
,
其 中必 有一
,
关 系 又 为统 计所
.
种 是 主 要 的矛 盾 中
_ _ _
,
由于 它的 存 在和 发 展
规 定和 影
社 会现

响着其 它 矛盾 的存在 和 发展
, ,
_ _ _
矛盾 的 两 方 面
。 : ,
综 合 的 定性分 析 选择 最 后 的统计 调 查现 象的单 位
. , 。
这 些 最 后 决定的调查单位也是 承担调 查 标 志的 唯一 来源 和 承担 者 它 就成 为反 映现 象 发 展的 基 本情 况


统 计规 律性 的形成
,
必 须 价 湘 同 农业
.

质量特性数据的统计规律

质量特性数据的统计规律

质量特性数据的统计规律质量特性数据的统计规律一、总体、个体与样本产品的质量可以用一个或多个质量特性来表示。

这里的特性可以是定量的,也可以是定性的。

例如灯泡的寿命,钢的成分等都是定量特性;而按规范判定产品为“合格”或“不合格”,则是一种定性特征。

在质量管理中,通常研究一个过程中生产的全体产品。

在统计中,将研究、考察对象的全体称为总体。

例如某个工厂在一个月内按照一定材料及一定工艺生产的一批灯泡。

总体是由个体组成的。

在上例中,这批灯泡中的每个特定的灯泡都是一个个体。

如果总体中包含的个体数不大,而对产品质量特性的观测(例如测量)手段不是破坏性的,工作量也不大,那么有可能对总体中的每个个体都进行观测,以得到每个个体的质量特性值。

但是如果总体中的个体数N很大,甚至是无限的,或者观测是破坏性的或观测的费用很大,那么不可能对总体中的每个个体都进行观测。

通常的做法是从总体中抽取一个或多个个体来进行观测。

抽出来的这一部分个体组成一个样本,样本中所包含的个体数目称为样本量。

通过对样本的观测来对总体特性进行研究,是统计的核心。

上述总体、个体和样本的概念是统计的基本概念,从上面的叙述中,这些概念都可以是具体的产品。

但有时为了表达的方便,当研究产品某个特定的质量特性X时,也常把全体产品的特性看做为总体,而把一个具体产品的特性值x视为个体,把从总体中抽出的由n个产品的特性值x1,x2,…,x n看做为一个样本。

[例1.1-1]从一个工厂一个月内生产的一批灯泡中抽取n=8个灯泡,进行寿命试验,得到这8个灯泡的使用寿命为(单位为小时): 325,84,1244,870,645,1423,1071,992 这8个灯泡或相应的使用寿命即为一个样本,样本量n=8。

从总体中抽取样本的方法称为抽样。

为使抽取的样本对总体有代表性,样本不能是有选择的,最好应是随机抽取的,关于这一点,以后我们还要详细解释。

二、频数(频率)直方图及累积频数(频率)直方图为研究一批产品的质量情况,需要研究它的某个质量特性(这里为了叙述简单起见,仅讨论一个质量特性,有必要时也可以同时讨论多个质量特性)X的变化规律。

究随机现象的统计规律性的数学理论和方法-随机数学简介

究随机现象的统计规律性的数学理论和方法-随机数学简介

随机数学简介随机数学是描述和研究随机现象的统计规律性的数学理论和方法随机现象是最早被关注的一种不确定现象。

数学家在400多年前开始研究赌博现象,由此形成了概率的早期概念乃至古典概率论(大部分同学在本科学过古典概率论),一批数学家对此作出了贡献。

到19世纪末,数学的发展要求对古典概率论的逻辑基础(象微积分一样)作出严格化。

做出概率严格化第一步的有伯恩斯坦,布雷尔等人,尤其是布雷尔,作为测度论的奠基者,首先指出将测度论方法引入概率论的重要性。

布雷尔的工作激起了数学家沿着这一新方向探索的行动。

其中,原苏联数学家哥尔莫戈罗夫在上世纪30年代前后的工作最杰出,他推导了弱大数定理和强大数定理的最一般的结果,在这些研究中,与可测函数论的类比起了极重要的作用,这成为以测度论为基础的概率论公理化的前奏。

由此,现代概率论与随机过程理论建立在一个坚实的基础上。

直到上世纪60年代,第二种不确定现象——模糊现象才被认识到并系统地加以研究,形成了模糊数学。

不确定数学和确定数学(又称为经典数学)在逻辑上存在两大区别:一是经典数学属于{0, 1}二值逻辑,而不确定数学则属于[0,1]无限逻辑;二是确定数学满足形式逻辑的四大定律,而不确定数学不满足其中的排中律。

随着数学和整个科学的现代化进程,具有种种不确定性的现象不断发现,从而发展成有关的理论。

例如,混沌理论,耗散理论,非线性理论,计算复杂性中的P = ?NP问题等,它们的共同逻辑特征都不属于典型的形式逻辑范畴,“四大定律”不完全满足。

现在统称这些领域为复杂性数学。

这样,不确定数学现在包括随机数学,模糊数学和复杂性数学。

我们在研究生数学课程体系中集中安排了随机数学的几门重要课程。

随机数学一般被认为由概率论,随机过程,数理统计,时间序列分析,多元统计分析等分支组成(它们自己分成程度不同的课程),这些分支还与其它学科结合,构成了很多应用性很强的学科,如随机运筹学等,包括排队论,Markov 决策论,库存论等。

统计规律在生活中的使用与判断

统计规律在生活中的使用与判断

本科毕业论文论文题目:统计规律在生活中的使用与判断学生姓名:戚德鹏学号:200600910136专业:物理学指导教师:李健学院:物理与电子科学学院2010年5月20日毕业论文(设计)内容介绍目录摘要 (1)Abstract: (1)一、引言 (2)二、统计规律概念的引入及阐述 (2)三、统计规律的特点 (4)四、统计规律在生活中的使用 (5)五、总结 (7)参考文献: (8)统计规律在生活中的使用与判断戚德鹏(山东师范大学物理与电子科学学院,济南,250014)摘要:随着社会与科技的发展,统计规律被大量应用到社会国民经济,工业生产等各个领域,也逐渐的显示出统计规律的重要性。

统计规律是对大量偶然事件整体起作用的一种客观规律,它反映了事物整体的本质和必然的联系。

本文依据统计规律的基本概念,从其在生活中的实例,总结出它的基本特点,使大家在理论和实际生活中对统计规律有一个比较深刻的认识,进而可以使大家在日常生活中有所启发。

关键词:统计规律,偶然事件,大量,概率,联系The use and judgment of statistical rule in lifeQi Depeng(College of Physics and Electronics,Shandong Normal University,Jinan,250014) Abstract:As society and technology development, Statistical law is applied to a large number of social economy, industrial production and other fields, Also gradually show the importance of statistical law. Statistical law is a whole lot of chance events play a role as an objective law, it reflects the nature of matter as a whole and the necessary link. This basic concept of law based on statistics from its instances in life, summed up the basic characteristics of it, so that people living in the theoretical and practical rules on statistics have a more profound understanding of, and then you can have in everyday life inspired. Keywords: statistical law, incident, a great quantity, probability, connection一、引言早在1654年,有一个赌徒梅累向当时的数学家帕斯卡提出一个使他苦恼了很久的问题:“两个赌徒相约赌若干局,谁先赢m局就算赢,全部赌本就归谁。

分子热运动的速度和速率统计分布规律

分子热运动的速度和速率统计分布规律

f (v )
C
o
vo
v
解:


0
f (v)dv Cdv Cvo 1
0
vo
1 C vo
v vf (v)dv
0

vo
0
vo 1 v vo 2 2
2 o
2 vo Cvdv C 2
v v f (v)dv
2 2 0

voΒιβλιοθήκη 01 2 Cv dv vo 3
S1
Ag
例:利用麦克斯韦速率分布求:V
m 3 2 ) e 解: f (V ) 4π( 2πkT m 2 V 2 kT
p
V2 V
V2
kT 1.41 m
1.60 kT m
df (V ) 0 dV
2kT 2 RT Vp m M
8kT 8RT V πm πM
V V 2 f (V )dV
5
P 1.013 10 25 -3 N n 2.7 10 m -23 kT 1.38 10 273.15
M 28 10 kg mol
-3
-3
-1
M 28 10 -26 m 4.65 10 kg 23 N A 6.022 10
2 m N N e 2πkT
2 y
) g (v
2 z
)
2
+ v
2 y
g (v ) e
2 -av x
F (V ,V ,V ) Ae -aV
x y z
2
常数的确定:

---
F(v ,v ,v )dvdv dv 1
x y z x y z

数据分布规律

数据分布规律

数据分布规律
数据分布规律是指数据在统计上的分布特征和规律。

在统计学中,常见的数据分布规律有以下几种:
1. 均匀分布:数据在各个取值上的概率相等,呈现出均匀的分布形态。

2. 正态分布:也被称为高斯分布,是最常见的数据分布规律之一。

数据围绕着均值对称分布,呈现出钟形曲线的形态。

3. 偏态分布:数据在某一侧的分布比另一侧更为集中,呈现出偏态或斜态。

4. 厚尾分布:数据有较大的概率出现在远离平均值的位置,尾部比较厚。

5. 轻尾分布:数据在远离平均值的位置出现的概率较小,尾部比较缩短。

6. 泊松分布:用于描述随机事件在某个时间或空间单位内发生的次数的概率分布。

7. 指数分布:描述变量的持续时间在各个时间间隔内发生的概率分布,常用于描述事件发生的间隔时间。

以上仅为常见的几种数据分布规律,实际数据可能还会存在其他类型的分布规律。

数据分布规律的掌握和分析能够帮助我们
更好地理解和解释数据的特征,从而进行准确的数据分析和预测。

统计学数字0到9的规律

统计学数字0到9的规律

统计学数字0到9的规律摘要:1.统计学与数字0 到9 的概念2.数字0 到9 的规律及特点3.实际应用案例4.总结正文:【统计学与数字0 到9 的概念】统计学是一门研究数据收集、整理、分析、解释以及推断的科学。

在统计学中,数字0 到9 是最基本的数字,它们构成了所有数字和数据。

【数字0 到9 的规律及特点】数字0 到9 有其独特的规律和特点,如下所示:- 数字0:作为数字的起点,它既不是正数也不是负数,但它在数学运算中占有重要地位。

- 数字1:它是最小的正整数,也是自然数和整数的基本单位。

- 数字2:它是唯一的偶数质数,也是第一个大于1 的质数。

- 数字3:它是奇数,也是一个三角形数。

- 数字4:它是偶数,且可以被2 整除,同时它也是第一个可以被4 整除的数。

- 数字5:它是一个质数,也是第一个大于2 的质数。

- 数字6:它是偶数,可以被2 和3 整除,同时它也是第一个可以被6整除的数。

- 数字7:它是一个质数,也是第一个大于5 的质数。

- 数字8:它是偶数,可以被2 整除,同时它也是第一个可以被8 整除的数。

- 数字9:它是奇数,也是数字0 到9 中最大的数。

【实际应用案例】在实际生活中,数字0 到9 的规律和特点被广泛应用在各种场景,例如:- 在计算机科学中,数字0 到9 被用来表示数值、字符以及二进制代码。

- 在金融领域,数字0 到9 被用来表示货币的数量,如元、角、分等。

- 在数学题中,数字0 到9 经常被用来作为题目的元素,如加减乘除等运算。

【总结】数字0 到9 是统计学中最基本的数字,它们具有独特的规律和特点,被广泛应用在各个领域。

2023年高考数学复习----《统计图表》规律方法与典型例题讲解

2023年高考数学复习----《统计图表》规律方法与典型例题讲解

2023年高考数学复习----《统计图表》规律方法与典型例题讲解【规律方法】1、制作频率分布直方图的步骤.第一步:求极差,决定组数和组距,组距=极差组数第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表;第四步:画频率分布直方图.2、解决频率分布直方图问题时要抓住3个要点.(1)直方图中各小矩形的面积之和为1;(2)直方图中纵轴表示频率组距,故每组样本的频率为组距⨯频率组距(3)直方图中每组样本的频数为频率⨯总体个数.3、用频率分布直方图估计众数、中位数、平均数的方法.(1)众数为频率分布直方图中最高矩形底边中点的横坐标;(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;(3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和.【典型例题】例1.(2022·云南昆明·昆明一中模拟预测)为了响应教育部门疫情期间“停课不停学”的号召,某校实施网络授课,为了检验学生上网课的效果,在高三年级进行了一次网络模拟考试,从中抽取了100人的数学成绩,绘制成频率分布直方图(如下图所示),其中数学成绩落在区间[110,120),[120,130),[130,140]的频率之比为4:2:1.(1)根据频率分布直方图求学生成绩在区间[110,120)的频率,并求抽取的这100名同学数学成绩的中位数(2)若将频率视为概率,从全校高三年级学生中随机抽取3个人,记抽取的3人成绩在[100,130)内的学生人数为X ,求X 的分布列与数学期望.【解析】(1)由直方图可知,数学成绩落在区间[70,110)内的频率为(0.0040.0120.0190.030)10+++⨯=0.65,所以数学成绩落在区间[110,140]内的频率为10.650.35−=,因为数学成绩落在区间[110,120),[120,130),[130,140]的频率之比为4:2:1,所以数学成绩落在区间[110,120)的频率为40.35421⨯++0.2=, 数学成绩落在区间[70,100)的频率为(0.0040.0120.019)100.35++⨯=, 所以中位数落在区间[100,110)内,设中位数为x ,则(100)0.0300.50.35x −⨯=−,解得105x =, 所以抽取的这100名同学数学成绩的中位数为105.(2)由(1)知,数学成绩落在区间[100,130)内的频率为0.0310⨯+0.2+20.35421⨯++0.6=,由题意可知,3~(3,)5X B ,X 的所有可能取值为0,1,2,3,033338(0)C ()(1)55125P X ==⋅−=,12333(1)C (1)55P X ==⋅⋅−36125=, 22333(2)C ()(1)55P X ==⋅⋅−54125=,330333(3)C ()(1)55P X ==⋅−27125=,所以X 的分布列为:所以数学期望8365427()0123125125125125E X =⨯+⨯+⨯+⨯95=.例2.(2022·贵州贵阳·贵阳六中校考一模)某校组织1000名学生进行科学探索知识竞赛,成绩分成5组:[)50,60,[)60,70,[)70,80,[)80,90,[]90,100,得到如图所示的频率分布直方图.若图中未知的数据a ,b ,c 成等差数列,成绩落在区间[)60,70内的人数为400.(1)求出直方图中a ,b ,c 的值;(2)估计中位数(精确到0.1)和平均数(同一组中的数据用该组区间的中点值代替); (3)若用频率估计概率,设从这1000人中抽取的6人,得分在区间[]90,100内的学生人数为X ,求X 的数学期望.【解析】(1)依题意可得:4001000100.04a =÷÷=,又a ,b ,c 成等差数列,所以2b a c =+且(0.0050.005)101a b c ++++⨯=,解得:0.02,0.03c b == 所以0.04,0.03,0.02a b c ===.(2)因为(0.0050.04)100.450.5+⨯=<,设中位数为x , 则[70,80)x ∈,所以()()0.0050.0410700.030.5x +⨯+−⨯=,解得:71.7x ≈,即中位数约为71.7,平均数为(550.005650.04750.03850.02950.005)1073⨯+⨯+⨯+⨯+⨯⨯=. (3)由题意可知:得分在区间[]90,100内概率为10.0051020⨯=, 根据条件可知:X 的所有可能值为0,1,2,3,4,5,6,且1(6,)20X ,所以1()60.320E X np ==⨯=.例3.(2022·全国·高三专题练习)为丰富学生课外生活,某市组织了高中生钢笔书法比赛,比赛分两个阶段进行:第一阶段由评委为所有参赛作品评分,并确定优胜者;第二阶段为附加赛,参赛人员由组委会按规则另行确定.数据统计员对第一阶段的分数进行了统计分析,这些分数X 都在[75,100)内,再以5为组距画分数的频率分布直方图(设“Y=频率组距”)时,发现Y 满足:7,15,15019,16,30011,16,1520n Y n k n n ⎧=⎪⎪⎪==⎨⎪⎪−⋅>⎪−⎩,55(1)n N n X n *∈≤<+. (1)试确定n 的所有取值,并求k ;(2)组委会确定:在第一阶段比赛中低于85分的同学无缘获奖也不能参加附加赛;分数在[95,100)内的同学评为一等奖;分数在[90,95)内的同学评为二等奖,但通过附加赛有111的概率提升为一等奖;分数在[85,90)内的同学评为三等奖,但通过附加赛有17的概率提升为二等奖(所有参加附加赛的获奖人员均不降低获奖等级,且附加赛获奖等级在第一阶段获奖等级基础上,最多升高一级).已知学生A 和B 均参加了本次比赛,且学生A 在第一阶段获得二等奖.①求学生B 最终获奖等级不低于学生A 最终获奖等级的概率;②已知学生A 和B 都获奖,记A ,B 两位同学最终获得一等奖的人数为ξ,求ξ的分布列和数学期望.【解析】(1)根据题意,X 在[75,100)内,按5为组距可分成5个小区间, 分别是[75,80),[80,85),[85,90),[90,95),[95,100),因为75100X ≤<,由55(1)n X n ≤<+,n N *∈,所以15,16,17,18,19n =.每个小区间的频率值分别是7,15,30195,1660115,17,18,19320n P Y n k n n ⎧=⎪⎪⎪===⎨⎪⎪−⋅=⎪−⎩由719111511306032k ⎛⎫++−++= ⎪⎝⎭,解得350k =. (2)①由于参赛学生很多,可以把频率视为概率.由(1)知,学生B 的分数属于区间[75,80),[80,85),[85,90),[90,95),[95,100)的概率分别是:730,1960,1460,1160,260.我们用符号ijA (或ijB )表示学生A (或B )在第一轮获奖等级为i ,通过附加赛最终获奖等级为j ,其中(,1,2,3)j i i j ≤=记“学生B 最终获奖等级不低于学生A 的最终获奖等级”为事件W , 则()12122223222()P W P B B B A B A =+++()()()()()()12122223222P B P B P B P A P B P A =+++2111111010141105160601160111160711220=+⋅+⋅⋅+⋅⋅=.②学生A 最终获得一等奖的概率是111A P =,学生B 最终获得一等奖的概率是21112116060272711272796060B P =+⋅=+=,1180(0)1111999P ξ⎛⎫⎛⎫==−−= ⎪⎪⎝⎭⎝⎭,111118(1)1111911999P ξ⎛⎫⎛⎫==⋅−+−⋅=⎪ ⎪⎝⎭⎝⎭, 111(2)11999P ξ==⋅=.所以ξ的分布列为:801812001299999999E ξ=⋅+⋅+⋅=.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计规律1问题的提出在统计学中有大数定律如下:定义11 若L L ,,,,21n ξξξ是随机变量序列,如果存在常数列,使对任意的L L ,,,,21n a a a 0>ε,有1P lim 1=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧<−∑=∞→εξn n i i n a n 成立,则称随机变量序列{}n ξ服从大数定律。

贝努里定理是所述这类大数定律中著名的一个。

设n μ是n 重贝努里试验中事件A 出现的次数,又A 在每次试验中出现的概率为)10(<<p p ,则对任意的0>ε,有1lim =⎭⎬⎫⎩⎨⎧<−∞→εμp n p n n显然,这种大数定律并不能告诉我们:为什么每次试验中A 出现的概率是p 以及当时,为什么p A p =)(n Aμ服从二项式分布。

这里的大数定律,实际上仅是数学的演绎,并非实证的规律,就是说,只要我们给出了随机变量序列(当然是包含足够的关于其分布的信息),就可以证明它们是否有上述定义和定理的结论成立。

但在实证研究中,我们实际上是通过对实际数据的分析来论证统计规律的存在的。

同时,教科书中又这样描述统计规律:在一定条件组实现时,有多种可能的结果发生,事前人们不能预言将出现哪种结果,但大量重复观察时,所得的结果却呈现某种规律,称为随机现象的统计规律性2。

这种描述显然是不符合科学规范的,有含糊其词之嫌。

如“某种规律”与“统计规律性”是何关系,与概率又有何联系。

下面我们以概率的定义和假设检验为基础,来定义统计规律,使统计规律以科学的规范性,成为可通过实践检验真假的命题。

2假设检验解释数理统计中的假设检验包括参数和非参数两部分,下面仅对参数检验做出某些讨论。

一般参数检验系统可描述如下3:设总体ξ的分布函数);(θx F 中含有未知参数θ,参数空间记作Ω,即Ω∈θ,则考虑如下假设的检验问题0H :0Ω∈θ,:1H 0Ω−Ω∈θ1华东师范大学数学系.概率论与数理统计教程. 北京:高等教育出版社,1983年,第196页。

2中山大学数学力学系.概率论与数理统计(上册). 人民教育出版社,1980年,第2页。

3中山大学数学力学系.概率论与数理统计(下册). 人民教育出版社,1980年,第165页。

检验的法则一般如下:将样本空间χ剖分为互不相交的两部分0χ及0χχ−,对,令Ω∈∀∗θ{}{}0010),,(),(χθθχξξθχθ∗∗∗==∈=p p M n L 若令0χ为否定假设的否定域(又称拒绝域),则在假设检验的抉择中可能犯两类错误,其中第一类错误是:当0H 0Ω∈θ时,),,(1n ξξL 的观察值01,,χ∈n x x L 即犯拒真错误;第二类错误是:当0Ω∈θ时,),,(1n ξξL 的观察值 01,,χχ−∈n x x L 即犯认假错误。

通常记犯第一类错误的概率为α,即{}αθχξξθχ=Ω∈∈=0010),,(),(0n H p M L而犯第二类错误的概率为{}{}1),(1),,(1),,(001001H n n M p p θχθχξξθχχξξ−=Ω∈∈−=Ω∈−∈L L 对于以上所述检验法则,通常都认为其基本思想是所谓小概率事件原理:“小概率事件(或概率很小的事件)在一次试验或观察中是几乎不可能发生的”。

然而,仔细想一下上述确定否定域的逻辑过程,就会发现,它实质上与小概率事件原理根本无关。

在显著性检验中,它的基本思想不过是在控制犯第一类错误的情况下使犯第二类错误的概率尽可能小。

然而,即使对于这种确定否定域的逻辑,当我们考虑它的经验意义时,仍然是可置疑的。

因为:当实际上0Ω∈θ时,我们有何必要去考虑0Ω−Ω∈θ时犯错误的概率呢?我们不可能同时犯两类错误,也就是,实际上两类错误是不相容的独立事件。

所以,这里有实际经验意义的问题是:当为真时,什么样的否定域是最合理的否定域?是使0H α最小的否定域吗?似乎也不妥,因为,对同一α,在正态总体检验中会有无穷多的对应区间。

而且,拒绝域越小,α越小。

实质上,这个问题的答案不能纯粹依赖于数学演绎,而必须凭借经验判断。

以正态总体均值双尾检验为例:0H :0μμ= :1H 1μμ≠此种检验一是用来检验一批产品是否合格,二是用来检验生产工艺技术系统是否处于正常状态。

在假定总体为正态分布的情况下,这两种检验必然要以0μ作为接受区间的中心值,而对的否定临界点通常是要在允许误差值以内。

在T 检验中,样本标准差越大越容易被接受,这显然与质量检验的目的相违背,所以,在质量规格中必须对标准差0H s σ有所限制,从而首先要进行标准差或方差检验。

再说显著性水平α的经验意义。

对否定域{}αθθχξξχ==∈0010),,(,n p L ,说明0θθ=为真时,),,(1n ξξL 的观察值落在0χ内从而被拒绝的可能性即概率为0H α,而为真时被接受的概率为0H α−1。

所以,只要确实为真,当0H α为小数时,它一般不会被否定。

从而,大的α−1对接受有利。

由此,我们也可发现,0H α并不是越小越好,而要看实际工作的需要而定。

所以,一般来说,假设检验仅能告诉我们一种选择的概率情况,而如何选择,要借助于经验。

如在教育与生物调查统计的均值双尾检验中,α定大一些,将使为真时接受的概率较小(相对较小,并不一定很小), 而一旦接受, 其犯错误的概率就比较小,从而使研究结果更可信。

这显然不能用小概率原理思想来解释。

H 0H 3统计规律的定义定义2 (基本统计规律) 设A 是一个随机试验E 的可能结果,A μ是A 在一次n 重贝努里试验中出现的次数,如果(1)在试验中,A 的概率存在,即:存在10≤≤p ,使n A n μ∞→lim c p成立,或(2)做组重贝努里试验,假设N n H :n f AA μ=p =在显著性水平α下通过假设检验,那么,我们就称随机试验E 的结果A 的发生服从统计规律。

而命题“A 在一次随机试验E 中发生的概率为”就是一个统计规律。

p “c ”在这里称为“公认等于”,即“一定范围的专家的公认结论”。

这种逻辑正是现实社会逻辑(包括科学活动)的表现。

在实际中,有两种类型的统计规律。

比如说,)(x f y =是一个统计规律,那么在试验中它可能以两种方式之一出现:(1)在试验中,)(x f y =一发生,就是完全准确的;(2) 只是一种近似平均关系。

)(x f y =由此,我们区分出如下两类统计规律,其中)(x f y ∝表示和之间存在某种逻辑关系。

y )(x f 定义3 (第一类统计规律) 在一项试验的结果中,若有关系式)(x f y ∝在次同样试验中(准确)成立的次数n A μ服从定义2中的(1)或(2),则称)(x f y ∝为第一类统计规律。

设有一变量η,当成立时,)(x f y ∝1=η,当)(x f y ∝不成立时,0=η,则第一类统计规律实际上是说,η是一个服从某二点分布的随机变量。

而“η服从二点分布”这一关于其具体分布的命题则是下面的第二类统计规律。

),(q p 为了叙述第二类统计规律,我们首先给出“统计成立”的定义。

定义4 (在统计意义下成立) 设在试验E 中有变量y 和x ,若假设在显著性水平)(:0x f y H ∝α下成立,则称试验E 中)(x f y ∝在统计意义下成立,简称统计成立。

定义5 (第二类统计规律) 在一项试验的结果中,若有关系式)(x f y ∝在次同样试验中统计成立的次数N A μ服从定义2中的(1)或(2)式,则说)(x f y ∝为第二类统计规律。

如“某人的英语词汇量为6000”。

首先,测量词汇量的方法有多种,每种的结果都会稍有不同;其次,即使同种方法,在随机抽样的情况下,每次测量的结果也会有所不同,并且极少可能有一次的结果恰为6000。

所以,这个关于词汇量的命题只能是一个第二类统计规律。

说明:(1)在上述定义中,当N A →μ或时,人们就可以抽象出一个决定性的定律:,当然,这种抽象也不是严格的数学逻辑,所以其结果就可能是一定精确度下的。

1→p )(x f y ∝(2)在第二种统计规律中,次试验中的每一次一般是一个n 重贝努里试验。

N 在科学和生产社会实践中,大量存在的是第二类统计规律。

当试验结果与的差别仅被解释为测量误差时,就被认为是一种确定性的规律或科学定律。

如:当)(x f y ∝)(x f y ∝定义2中的试验E 是抛掷一枚绝对均匀的硬币,那么,“正面在一次抛掷中朝上的概率为21”就是一个第二类统计规律。

大量的物理学定律在实验的意义下也只是一定精度的第二类统计规律。

4大数定律与统计规律的关系数理统计学中的大数定律实际上是一种统计规律的抽象反映。

下面分别对大数定律的定义和贝努里大数定律予以说明。

4.1关于定义大数定律的定义实际上说的是这样一种统计规律: 令∑==ni i n n S 11ξ,则当定义1中的结论成立时,应有这样一种统计规律:序列{和具有相同的极限。

}n S {}n a 但是这个统计规律不能用严格的数学逻辑来检验,只有用试验来检验, 它可表述为下面的公理。

公理1 若随机变量序列{}n ξ服从大数定律,即存在常数列{}n a ,使对任意0>ε,有 11=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<−∑=∞→εξn n i i n a n P lim 成立,则有统计规律“⎭⎬⎫⎩⎨⎧=∑=n i i n x n S 11和{}n a 极限相同”。

其中{}i x 是{}i ξ的观测值。

公理1 的一个应用是“均值估计”,即有下面的推论:推论 设是一个统计总体,Ωξ是定义在Ω上的单值函数,ξ表示ξ的总体均值,若E 是对的一个容量为的简单随机抽样,则Ω∞<n ξ的样本均值n X 存在如下的统计规律:“{n X }的极限是ξ”。

这个推论是用样本均值估计总体均值的理论依据,而估计的精度不仅与 有关,而且与n ξ在Ω上的分布标准差或方差有关。

对于相同的,总体方差越小,估计的精度越高,这就是区间估计的基本性质。

n 相对于大数定律, 上述公理可称为大数公理。

4.2关于贝努里大数定律构造变量i δ,使当A 在第次试验中出现时i 1=i δ,当A 在第次试验中不出现时i 0=i δ,则贝努里大数定律是说随机变量序列{}i δ服从大数定律,而其相应的统计规律是“{∑=ni i n 11δ}的极限是”。

p 这个统计规律可以作为用样本分布估计总体分布的理论依据,如估计球袋中各色球的分布比例。

同样,这种估计的精度与和总体分布n p 有关。

对既定n ,21=p 时,精度最差,p 越小,精度会越高。

综上可推知:大数定律反映的是一种极限统计规律, 这种极限可看作是实证极限. 而作为统计规律, 它可以直接通过增大试验次数来检验,也可检验下面的 ),(εN 命题,即:“有一序列{,对}n s 0>ε,, 使当时,0>∃N N n >εα<−n s 。

相关文档
最新文档