概率统计及统计案例知识点汇总

合集下载

概率初步例题和知识点总结

概率初步例题和知识点总结

概率初步例题和知识点总结一、概率的定义在一定条件下,重复进行试验,如果随着试验次数的增加,事件 A 发生的频率稳定在某个常数 p 附近,那么这个常数 p 就叫做事件 A 的概率,记作 P(A) = p。

概率是对随机事件发生可能性大小的度量。

例如,抛一枚均匀的硬币,正面朝上和反面朝上的概率都是 05。

二、概率的基本性质1、0 ≤ P(A) ≤ 1:任何事件的概率都在 0 到 1 之间,0 表示不可能发生,1 表示必然发生。

2、P(Ω) = 1:必然事件的概率为 1,其中Ω 表示样本空间,即所有可能结果的集合。

3、 P(∅)= 0:不可能事件的概率为 0,∅表示空集。

4、如果事件 A 与事件 B 互斥(即 A 和 B 不能同时发生),那么P(A∪B) = P(A) + P(B)。

三、古典概型古典概型是一种最简单的概率模型,具有以下两个特点:1、试验中所有可能出现的基本事件只有有限个。

2、每个基本事件出现的可能性相等。

古典概型的概率计算公式为:P(A) = A 包含的基本事件个数/基本事件的总数。

例如,一个盒子里有 3 个红球和 2 个白球,从中随机取出一个球,求取出红球的概率。

基本事件的总数为 5(3 个红球+ 2 个白球),取出红球包含的基本事件个数为 3,所以取出红球的概率为 3/5。

四、例题解析例 1:掷一枚质地均匀的骰子,求点数为奇数的概率。

解:掷一枚骰子,出现的点数有 1、2、3、4、5、6 共 6 种可能,其中奇数有 1、3、5 共 3 种。

所以点数为奇数的概率为 3/6 = 1/2。

例 2:从 1、2、3、4 这 4 个数字中,任意取出两个数字,求取出的两个数字都是奇数的概率。

解:从4 个数字中任意取出两个数字,共有6 种可能的结果:(1,2)、(1,3)、(1,4)、(2,3)、(2,4)、(3,4)。

其中两个数字都是奇数的结果有(1,3),共 1 种。

所以取出的两个数字都是奇数的概率为 1/6。

概率与统计知识点总结

概率与统计知识点总结

概率与统计知识点总结一、概率的基本概念概率,简单来说,就是衡量某个事件发生可能性大小的一个数值。

比如抛硬币,正面朝上的概率是 05,意思是在大量重复抛硬币的实验中,正面朝上的次数大约占总次数的一半。

随机事件,就是在一定条件下,可能出现也可能不出现,而在大量重复试验中具有某种规律性的事件。

比如掷骰子得到的点数就是随机事件。

必然事件,就是在一定条件下必然会发生的事件。

比如太阳从东方升起,这就是必然事件。

不可能事件,就是在一定条件下不可能发生的事件。

比如在地球上,水往高处流就是不可能事件。

概率的取值范围在 0 到 1 之间。

0 表示事件不可能发生,1 表示事件必然发生。

二、古典概型古典概型是一种最简单、最基本的概率模型。

它具有两个特点:试验中所有可能出现的基本事件只有有限个;每个基本事件出现的可能性相等。

计算古典概型中事件 A 的概率公式为:P(A) = A 包含的基本事件个数/基本事件的总数。

例如,一个袋子里有 5 个红球和 3 个白球,从中随机摸出一个球是红球的概率,基本事件总数是 8(5 个红球+ 3 个白球),红球的个数是 5,所以摸到红球的概率就是 5/8。

三、几何概型与古典概型不同,几何概型中的基本事件个数是无限的。

比如在一个时间段内等可能地到达某一地点,或者在一个区域内等可能地取点。

几何概型的概率计算公式是:P(A) =构成事件 A 的区域长度(面积或体积)/试验的全部结果所构成的区域长度(面积或体积)。

举个例子,在区间0, 10中随机取一个数,这个数小于 5 的概率就是 5/10 = 05。

四、条件概率条件概率是在已知某个事件发生的条件下,另一个事件发生的概率。

记事件 A 在事件 B 发生的条件下发生的概率为 P(A|B)。

计算公式为:P(A|B) = P(AB) / P(B) ,其中 P(AB) 表示事件 A 和事件 B 同时发生的概率。

比如说,已知今天下雨,明天也下雨的概率就是一个条件概率。

初中概率统计实际应用知识点汇总

初中概率统计实际应用知识点汇总

初中概率统计实际应用知识点汇总概率统计是数学中的一个重要分支,它研究的是随机现象的规律性和不确定性。

在初中阶段,学生学习了一些概率统计的基本概念和方法,这些知识点不仅在数学学科中有应用,而且在日常生活中也有广泛的应用。

本文将对初中概率统计实际应用的知识点进行汇总和归纳。

1. 抽样调查抽样调查是统计学中常用的一种方法,它通过从总体中选取一部分样本来获得总体的某种特征。

在实际生活中,我们经常参与各种抽样调查活动,比如市场调研、问卷调查等。

学生可以通过学习概率统计知识,了解如何进行随机抽样、分析抽样误差和提高调查的可靠性。

2. 事件与概率概率统计的核心概念之一就是事件与概率的关系。

在实际应用中,我们经常需要计算事件的概率,例如投掷骰子得到某个点数的概率、从一副牌中抽到某个花色的概率等。

了解概率的基本概念和计算方法有助于我们在日常生活中做出理性的决策,比如在购买彩票时判断中奖的可能性。

3. 随机变量与概率分布随机变量是概率统计中另一个重要的概念,它描述的是一个随机实验的结果。

在实际应用中,我们经常需要研究随机变量的概率分布,如二项分布、正态分布等。

这些概率分布的特征可以用来描述一些现象的规律性,比如身高、考试成绩等。

学生通过学习概率统计知识,可以更好地理解这些现象的分布特征,并进行相关的数据分析。

4. 样本空间与事件样本空间是随机实验可能结果的全体,事件是样本空间的一个子集。

在实际应用中,我们常常需要对样本空间进行划分,并计算事件的概率。

例如,在一次摇奖活动中,样本空间是所有可能的奖项组合,而事件是中奖的具体奖项。

学生通过学习概率统计知识,可以更好地理解事件的概念,并计算事件发生的可能性。

5. 实际问题的概率计算除了以上基本的概率统计知识点外,学生还需要学会如何将概率统计的方法运用到实际问题中。

例如,在黄金周旅游出行中,我们可以使用排列组合的方法计算不同出行路线的排列数;在购买彩票中,我们可以运用条件概率计算中奖的可能性。

概率与统计实际问题经典题总结

概率与统计实际问题经典题总结

概率与统计实际问题经典题总结在我们的日常生活中,概率与统计的知识无处不在。

从预测天气变化到评估投资风险,从医学研究到质量控制,概率与统计为我们提供了理解和解决各种问题的有力工具。

接下来,让我们一起探讨一些经典的概率与统计实际问题。

一、抽奖问题假设在一个抽奖活动中,总共有 1000 张奖券,其中只有 10 张是一等奖。

小明随机抽取了一张奖券,那么他抽中一等奖的概率是多少?这是一个简单的古典概型问题。

古典概型的概率计算公式是:P(A) =事件 A 包含的基本事件数÷基本事件总数。

在这个例子中,事件 A 就是抽中一等奖,包含的基本事件数是 10,基本事件总数是 1000。

所以小明抽中一等奖的概率是 10÷1000 = 001,即 1%。

再复杂一点,如果抽奖规则变为先抽一次,如果没中,再放回奖池重新抽,连续抽 5 次,每次都没抽中的概率是多少?因为每次抽奖都是独立事件,每次没抽中的概率都是 990÷1000 = 099。

所以连续 5 次都没抽中的概率就是099×099×099×099×099 ≈ 095。

二、产品质量检测问题一家工厂生产了 10000 个零件,已知其中有 500 个是次品。

现在从这批零件中随机抽取 100 个进行检测,求抽到次品的概率。

这里可以用频率来估计概率。

抽到次品的频率约为 500÷10000 =005。

当抽取的样本数量足够大时,频率会趋近于概率。

所以抽取 100 个零件时,抽到次品的概率大约也是 005。

如果要控制这批零件的次品率不超过 2%,至少需要再检测多少个零件,并且没有检测到次品?设还需要检测 x 个零件,根据次品率的计算公式,可列出不等式:(500÷(10000 + x))≤ 002,解得x ≥ 15000。

也就是说,至少需要再检测 15000 个零件且没有检测到次品,才能将次品率控制在 2%以内。

概率论与数理统计案例分析

概率论与数理统计案例分析

概率论与数理统计案例分析概率论与数理统计作为数学的一个重要分支,广泛应用于各个领域。

本文将通过一些具体案例来分析概率论和数理统计在实际中的应用。

案例一:市场营销中的A/B测试在市场营销领域,A/B测试是一种常见的实验设计方法,用于比较两种不同的营销策略、广告设计或产品设计等。

假设某电商公司希望提高其网站用户的转化率,他们可以设计一个A/B测试来比较两种不同的促销活动对用户购买行为的影响。

首先,将用户随机分为两组,一组接受A方案,另一组接受B方案。

然后通过收集和分析用户的购买数据,可以利用概率论和数理统计方法来评估两种方案的效果。

通过统计显著性检验和置信区间分析,可以得出结论,哪种方案对用户购买行为影响更大,从而指导公司的营销策略。

案例二:医学研究中的双盲试验在医学研究领域,双盲试验是一种常用的研究设计,用于评估新药物的疗效。

在一次双盲试验中,研究者和参与者都不知道哪些人接受了治疗,哪些人接受了安慰剂。

通过随机分组和盲法设计,可以最大程度地减少实验结果的偏倚。

利用概率论和数理统计方法,研究人员可以对试验数据进行分析,来评估新药物的疗效是否显著,以及是否出现不良反应等情况。

通过以上案例分析,可以看出概率论和数理统计在实际中的重要性和应用价值。

无论是市场营销领域还是医学研究领域,都离不开对数据的收集、分析和解释。

掌握好概率论和数理统计知识,对于提高决策的科学性和准确性有着重要的意义。

希望本文的案例分析能够让读者更深入地理解概率论和数理统计的实际应用,为他们在相关领域的工作和研究提供一定的启发和帮助。

概率论与数理统计重点总结及例题解析

概率论与数理统计重点总结及例题解析

概率论与数理统计重点总结及例题解析(总15页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--概率论与数理统计重点总结及例题解析一:全概率公式和贝叶斯公式例:某厂由甲、乙、丙三个车间生产同一种产品,它们的产量之比为3:2:1,各车间产品的不合格率依次为8%,9%, 12% 。

现从该厂产品中任意抽取一件,求:(1)取到不合格产品的概率;(2)若取到的是不合格品,求它是由甲车间生产的概率。

(同步45页三、1)解:设A1,A2,A3分别表示产品由甲、乙、丙车间生产,B表示产品不合格,则A1,A2,A3为一个完备事件组。

P(A1)=1/2, P(A2)=1/3, P(A3)=1/6,P(B| A1)=,P(B| A2)=,P(B| A3)=。

由全概率公式P(B) = P(A1)P(B| A1)+ P(A2)P(B| A2)+ P(A3)P(B| A3) = 由贝叶斯公式:P(A1| B)=P(A1B)/P(B) = 4/9练习:市场上出售的某种商品由三个厂家同时供货,其供应量第一厂家为第二厂家的2倍,第二、三两厂家相等,而且第一、二、三厂家的次品率依次为2%,2%,4%。

若在市场上随机购买一件商品为次品,问该件商品是第一厂家生产的概率是多少(同步49页三、1)【】练习:设两箱内装有同种零件,第一箱装50件,有10件一等品,第二箱装30件,有18件一等品,先从两箱中任挑一箱,再从此箱中前后不放回地任取2个零件,求:(同步29页三、5)(1)取出的零件是一等品的概率;(2)在先取的是一等品的条件下,后取的仍是一等品的条件概率。

解:设事件i A ={从第i 箱取的零件},i B ={第i 次取的零件是一等品}(1)P(1B )=P(1A )P(1B |1A )+P(2A )P(1B |2A )=52301821501021=+ (2)P(1B 2B )=194.02121230218250210=+C C C C ,则P(2B |1B )=)()(121B P B B P = 二、连续型随机变量的综合题例:设随机变量X 的概率密度函数为⎩⎨⎧<<=othersx x x f 020)(λ求:(1)常数λ;(2)EX ;(3)P{1<X<3};(4)X 的分布函数F(x)(同步47页三、2)解:(1)由⎰⎰==∞+∞-201)(xdx dx x f λ得到λ=1/2 (2)3421)(22===⎰⎰∞+∞-dx x dx x xf EX (3)⎰⎰===<<31214321)(}31{xdx dx x f x P(4)当x<0时,⎰∞-==xdt x F 00)( 当0≤x<2时,⎰⎰⎰∞-∞-=+==xxx tdt dx dt t f x F 00241210)()( 当x ≥2时,F (x )=1故201()02412x F x x x x <⎧⎪⎪=≤<⎨⎪≥⎪⎩练习:已知随机变量X 的密度函数为⎩⎨⎧≤≤+=others x b ax x f 010)( 且E(X)=7/12。

概率论与数理统计知识点总结免费超详细版

概率论与数理统计知识点总结免费超详细版

概率论与数理统计知识点总结免费超详细版概率论与数理统计是一门研究随机现象数量规律的学科,它在众多领域都有着广泛的应用,如统计学、物理学、工程学、经济学等。

以下是对概率论与数理统计知识点的超详细总结。

一、随机事件与概率(一)随机事件随机事件是指在一定条件下,可能出现也可能不出现的事件。

随机事件通常用大写字母 A、B、C 等来表示。

(二)样本空间样本空间是指随机试验的所有可能结果组成的集合,通常用Ω表示。

(三)事件的关系与运算1、包含关系:若事件 A 发生必然导致事件 B 发生,则称事件 B 包含事件 A,记作 A⊂B。

2、相等关系:若 A⊂B 且 B⊂A,则称事件 A 与事件 B 相等,记作A = B。

3、并事件:事件 A 与事件 B 至少有一个发生的事件称为 A 与 B的并事件,记作 A∪B。

4、交事件:事件 A 与事件 B 同时发生的事件称为 A 与 B 的交事件,记作A∩B 或 AB。

5、互斥事件:若事件 A 与事件 B 不能同时发生,则称 A 与 B 为互斥事件,即 AB =∅。

6、对立事件:若事件 A 与事件 B 满足 A∪B =Ω 且 AB =∅,则称 A 与 B 为对立事件,记作 B =A。

(四)概率的定义与性质1、概率的古典定义:若随机试验的样本空间Ω只包含有限个基本事件,且每个基本事件发生的可能性相等,则事件 A 的概率为 P(A) =n(A) /n(Ω) ,其中 n(A) 为事件 A 包含的基本事件个数,n(Ω) 为样本空间Ω包含的基本事件个数。

2、概率的统计定义:在大量重复试验中,事件 A 发生的频率稳定在某个常数 p 附近,则称 p 为事件 A 的概率,即 P(A) = p 。

3、概率的公理化定义:设随机试验的样本空间为Ω,对于Ω中的每一个事件 A,都赋予一个实数 P(A),如果满足以下三个条件:(1)非负性:0 ≤ P(A) ≤ 1 ;(2)规范性:P(Ω) = 1 ;(3)可列可加性:对于两两互斥的事件 A1,A2,,有P(A1∪A2∪)= P(A1) + P(A2) +,则称 P(A) 为事件 A 的概率。

高中数学概率与统计知识点总结

高中数学概率与统计知识点总结

概率与统计一、概率及随机变量的分布列、期望与方差(一)概率及其计算1.几个互斥事件和事件概率的加法公式①如果事件A 与事件B 互斥,则()P A B =()()P A P B +.推广:如果事件1A ,2A ,…,n A 两两互斥(彼此互斥),那么事件12n A A A +++发生的概率,等于这n 个事件分别发生的概率的和,即()12n P A A A +++=()()()12n P A P A P A ++.②若事件B 与事件A 互为对立事件,则()P A =()1P B -. 2.古典概型的概率公式P (A )=A 包含的基本事件的个数基本事件的总数.(二)随机变量的分布列、期望与方差1. 常用的离散型随机变量的分布列(1)二项分布如果随机变量X 的可能取值为0,1,2,…,n ,且X 取值的概率()P X k ==C k k n kn p q-(其中0,1,2,,,1k n q p ==-),其随机变量分布列为X 0 1 …k…nP0C nnp q111C n np q-…C k k n knp q-…0C n n n p q则称X 服从二项分布,记为(),X B n p ~.(2)超几何分布在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品,则事件{}X k =发生的概率为C C C k n kM N Mn N--()0,10,1,2,,2,,k m =,其中{}min ,m M n =,且n N …,M N …,n ,M ,*N ÎN .此时称随机变量X 的分布列为超几何分布列,称随机变量X 服从超几何分布.2.条件概率及相互独立事件同时发生的概率 I.条件概率条件概率一般地,设A ,B 为两个事件,且()0P A >,称()()()P ABP B A P A=为事件A 发生的条件下,事件B 发生的条件概率.在古典概型中,若用()n A 表示事件A 中基本事件的个数,则()()()()()n AB P AB P B A n A P A ==. II .相互独立事件相互独立事件(1)若,A B 相互独立.则()P AB =()()P A P B .(3)若A 与B 相互独立,则A 与B ,A 与B ,A 与B 也都相互独立. III .独立重复试验与二项分布独立重复试验与二项分布在n 次独立重复试验中,事件A 发生k 次的概率为(每次试验中事件A 发生的概率为p)()C 1n kkknp p --,事件A 发生的次数是一个随机变量X ,其分布列为()01)2()C 1(n kk knP X k k n p p -===-¼,,,,,此时称随机变量X 服从二项分布. 学科*网3.离散型随机变量的数学期望(均值)与方差 (1)若离散型随机变量X 的概率分布列为的概率分布列为X x 1 x 2 … x i … x n P p 1 p 2 … p i … p n则称EX =1122i i n n x p x p x p x p ++++¼+¼为随机变量X 的均值或数学期望. (2)若Y aX b =+,则EY =aEX b +,)(D aX b +=2a DX (3)若()X B n p ~,,则EX np =.()(1)D X np p -=. 4.正态分布(1)正态曲线的性质:正态曲线的性质:①曲线位于x 轴上方,与x 轴不相交;②曲线是单峰的,它关于直线x m =对称;③曲线在x m=处达到峰值12πs;④曲线与x 轴之间的面积为1;⑤当s 一定时,曲线的位置由m 确定,曲线随着m 的变化而沿x 轴平移,⑥当m 一定时,曲线的形状由s 确定,s 越小,曲线越“瘦高”,表示总体的分布越集中;s 越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示.(3)服从正态分布的变量在三个特殊区间内取值的概率服从正态分布的变量在三个特殊区间内取值的概率 ①0().6826P X m s m s -<+=…;②2209().544P X m s m s -<+=…; ③3309().974P X m s m s -<+=…. 二、统计与统计案例 (一)抽样方法 1.简单随机抽样设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本()n N …,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,最常用的简单随机抽样的方法:抽签法和随机数表法.最常用的简单随机抽样的方法:抽签法和随机数表法. 2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本.的样本.(1)先将总体的N 个个体编号.(2)确定分段间隔k ,对编号进行分段,当Nn是整数时,取N k n =.如果遇到Nn不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除得总体中剩余的个体数能被样本容量整除(3)在第1段用简单随机抽样确定第一个个体编号()l l k ….(4)按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号()l k +,再加k 得到第3个个体编号()2l k +,依次进行下去,直到获取整个样本.直到获取整个样本.3.分层抽样在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.分层抽样的应用范围:当总体是由差异明显的几个部分组成的,往往选用分层抽样.层抽样.注:注:不论哪种抽样方法不论哪种抽样方法,总体中的每一个个体入样的概率是相同的. (二)统计图表的含义 1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差).(2)决定组距和组数.(3)将数据分组.(4)列频率分布表.列频率分布表. (5)画频率分布直方图.画频率分布直方图. (三)样本的数字特征1.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.出现次数最多的数据叫做这组数据的众数.2.中位数:将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数叫做这组数据的中位数3.平均数:样本数据的算术平均数,即x =()121n x x x n+++.4.方差:()()()2222121n s x x x x x x n éù=-+-++-êúëû(n x 是样本数据,n 是样本容量,x 是样本平均数).5.标准差:()()()222121ns x x x x x x n éù=-+-++-êúëû.(四)线性回归直线方程 1.两个变量的线性相关(1)如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫回归直线.(2)从散点图上看,如果点分布在从左下角到右上角的区域内,那么两个变量的这种相关关系称为正相关;如果点分布在从左上角到右下角的区域内,那么两个变量的这种相关关系称为负相关. (3)相关系数相关系数r =ååå===----ni nj jini i i y y x x y y x x 11221)()())((,当0r >时,表示两个变量正相关;当0r <时,表示两个变量负相关.r 的绝对值越接近1,表示两个变量的线性相关性越强;r 的绝对值越接近0,表示两个变量的线性相关性越弱.通常当r 的绝对值大于0.75时,便认为两个变量具有很强的线性相关关系.当1r =时,两个变量在回归直线上两个变量在回归直线上 2.回归直线方程 (1)通过求21()ni i i Qy x a b ==--å的最小值而得出回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.该式取最小值时的a ,b 的值即分别为aˆ,b ˆ. (2)两个具有线性相关关系的变量的一组数据:11(,)x y ,22(,)x y ,…,()n n x y ,,其回归方程为a x b y ˆˆˆ+=,则1122211()()ˆ()ˆˆnn i i i i i i n ni ii i x x y y x y nx yb x x x nxa y bx ====ì---×ï==ïí--ïï=-ïîåååå.注:样本点的中心(),x y 一定在回归直线上. (3)相关系数22121ˆ()1()n i ii ni i y yR y y ==-å=--å.2R 越大,说明残差平方和越小,即模型的拟合效果越好;2R 越小,残差平方和越大,即模型的拟合效果越差.在线性回归模型中,2R表示解释变量对于预报变量变化的贡献率,2R 越接近于1,表示回归的效果越好. (六)独立性检验(1)变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.像这样的变量称为分类变量.(2)像下表所示列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y ,它们的可能取值分别为12(,)x x 和12(,)y y ,其样本频数列联表(称为22´列联表)为表)为y 1 y 2 总计总计x 1 a b a b + x 2 cdc d +总计a c +b d +a b c d +++构造一个随机变量()()()()()22n ad bc K a b c d a c b d -=++++ ,其中n a b c d =+++为样本容量.确定临界值0k ,如果2K 的观测值0k k …,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量之间没有关系”.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

概率统计及统计案例知识点汇总
知识点一随机抽样
(一)、1.定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫作简单随机抽样.
2.最常用的简单随机抽样的方法:抽签法和随机数法.
3.应用范围:总体中的个体数较少.
(二)、系统抽样
1.定义:当总体中的个体数目较多时,可将总体分成均衡的几个部分,然后按照事先定出的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样.
2.系统抽样的操作步骤
第一步编号:先将总体的N个个体编号;
第二步分段:确定分段间隔k,对编号进行分段,当N
n(n是样本容量)是整数时,
取k=N n;
第三步确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(l≤k);第四步获取样本:按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.
3.应用范围:总体中的个体数较多.
(三)、分层抽样
1.定义:在抽样时,将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本,这种抽样方法叫作分层抽样,有时也称为类型抽样.
2.应用范围:当总体是由差异明显的若干类型组成时,往往选用分层抽样.
知识点二用样本估计总体
(一)、用样本的频率分布估计总体分布
1.频率分布表与频率分布直方图
频率分布表与频率分布直方图的绘制步骤如下:
①求极差(即一组数据中最大值与最小值的差);
②定组距与组数;③将数据分组;④列频率分布表;
⑤画频率分布直方图.
2.频率折线图
在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
3.茎叶图
①茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
②对于样本数据较少,但较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶,样本数据为小数时做类似处理.
(二)、用样本的数字特征估计总体的数字特征
1.众数
在一组数据中,出现次数最多的数据叫作这组数据的众数.体现了样本数据的最大集中点,不受极端值的影响而且不唯一.
2.中位数
将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.它不受极端值的影响,仅利用了排在中间数据的信息,只有一个,且在频率分布直方图中,中位数左边和右边的直方图的面积相等.
3.平均数:样本数据的算术平均数,即x=1
n(x1+x2+…+x n),它与每一个样本
数据有关,仅有一个.
4.极差:一组数值中最大值与最小值的差,它反映一组数据的波动情况,但极差只考虑两个极端值,可靠性极差.
5.标准差:①考查样本数据的分散程度的大小,最常用的统计量是标准差,标准差是样本数据到平均数的一种平均距离,一般用s表示:
s =
1n
[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. ②标准差的平方s 2叫作方差:
s 2=1
n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].
知识点三 变量间的相关关系及统计案例
(一)、回归直线方程:
a x
b y
ˆˆˆ+=,其中),(,),,(),,(2211n n y x y x y x 为样本点,线性回归方程a x b y ˆˆˆ+=中系数计算公式:
则∑∑====n
i i n
i i y n y x n x 1
1
1,
1
相关系数1
2222
11n
i i
i n
n
i i i i x y nx y
r x nx y ny ===-=
⎛⎫⎛⎫-- ⎪⎪⎝⎭⎝⎭∑∑∑
(二)、相关系数
当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关. r 的绝对值越接近于1,表明两个变量的线性相关性越强.
r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.
(三)、独立性检验
1.设A ,B 为两个变量,每一个变量都可以取两个值,变量A :A 1,A 2=A 1;
变量B :B 1,B 2=B 1. 2×2列联表
构造一个随机变量χ2=(a +b )(c +d )(a +c )(b +d )
,其中n =a +b +c +d 为样本容
量.
2.独立性检验:利用随机变量来判断“两个变量有关联”的方法称为独立性检验.3.当数据量较大时,在统计中,用以下结果对变量的独立性进行判断
①当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B 是没有关联的;
②当χ2>2.706时,有90%的把握判定变量A,B有关联;
③当χ2>3.841时,有95%的把握判定变量A,B有关联;
④当χ2>6.635时,有99%的把握判定变量A,B有关联.
知识点四随机事件的概率
(一)、事件的分类
(二)、频率与概率
1.在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次试验中
事件A出现的次数n A为事件A出现的频数,称事件A出现的比例f n(A)=n A
n为事
件A出现的频率.
2.在相同的条件下,大量重复进行同一试验时,随机事件A发生的频率会在某个常数附近摆动,即随机事件A发生的频率具有稳定性.这时我们把这个常数叫作随机事件A的概率,记作P(A).
(三)、事件的关系与运算
和事件(并事件)若某事件发生当且仅当事件A发生或事件B
发生,称此事件为事件A与事件B的和事件
(或并事件)
A+B
(或A∪B)
交事件(积事件)若某事件发生当且仅当事件A发生且事件B
发生,则称此事件为事件A与事件B的交事
件(或积事件)
A∩B(或AB)
互斥事件若A∩B为不可能事件,则称事件A与事件B
互斥
A∩B=∅
对立事件若A∩B为不可能事件,A+B为必然事件,
那么称事件A与事件B互为对立事件
A∩B=∅
P(A+B)=
P(A)+P(B)=1
(四)、概率的几个基本性质
1.概率的取值范围:0≤P(A)≤1.
2.必然事件的概率P(E)=1.
3.不可能事件的概率P(F)=0.
4.互斥事件概率的加法公式①如果事件A与事件B互斥,则P(A+B)=P(A)+P(B).
②若事件B与事件A互为对立事件,则P(A)=1-P(B).
知识点五古典概型与几何概型
(一)、基本事件的特点
1.任何两个基本事件是互斥的.(2)任何事件(除不可能事件)都可以表示成基本事件的和.
(二)、古典概型
1.定义:具有以下两个特征的概率模型称为古典的概率模型,简称古典概型.
①试验的所有可能结果只有有限个,每次试验只出现其中的一个结果.
②每一个试验结果出现的可能性相同.
2.概率公式:P(A)=事件A包含的可能结果数试验的所有可能结果数
.
(三)、几何概型
向平面上有限区域(集合)G内随机地投掷点M,若点M落在子区域G1G的概
率与G1的面积成正比,而与G的形状、位置无关,即P(点M落在G1)=G1的面积G的面积,
则称这种模型为几何概型.
(四)、几何概型中,事件A的概率计算公式的扩展
P(A)=
构成事件A的区域长度(面积或体积)
试验的全部结果所构成的区域长度(面积或体积)
.
(五)、几何概型试验的两个基本特点
1.无限性:在一次试验中,可能出现的结果有无限多个;2.等可能性:每个结果的发生具有等可能性.。

相关文档
最新文档