28.2 统计的意义

合集下载

计量地理学第三章统计分析方法1相关分析

计量地理学第三章统计分析方法1相关分析

13. 2
14. 5
20. 2
22. 3
24. 2
26. 9
26. 0
28. 2
24. 6
26. 5
19. 5
21. 1
12. 5
13. 4
用导出公式
rxy
l xy l xx l yy


x y xy
i i i i 2
xi 2 xi n
i
v )( yi y )
2
(v
i 1
53
i
v)
(y
i 1
53

2
60527.59 16274170.6 290.19 0
i
y)
60527.59 0.8808 = 4034.13 17.03
计算结果表明,降水量(p)和纬度(y) 之间异向相关,而蒸发量(v)与纬度(y) 之间同向相关。
(1)对伦敦市月平均气温(T)与降水量(P)之 间的相关系数,f=12-2=10,在显著性水平
r0 0上,查表3.1.3,得知:.10 0.4973。 .10
因为 rTP 0.4895 r 0.4973 ,所以,伦敦市月 平均气温(T)与降水量(P)之间的相关性并不显
著。
2、顺序(等级)相关系数计算
– rxy>0,表示正相关,即两要素同向发展 – rxy<0,表示负相关,即两要素异向发展 – rxy 的绝对值越接近于1,表示两要素的关系 越密切; 越接近于0,表示两要素的关系越 不密切
1 l xy ( xi x )( yi y ) xi yi xi n 2 1 2 2 l xx ( xi x ) xi xi n 2 1 2 2 l yy ( yi y ) yi yi n

研究生医学统计学随机区组设计和析因设计的方差分析课件.ppt

研究生医学统计学随机区组设计和析因设计的方差分析课件.ppt
18
表 9-3 护 士 进 行 家 庭 访 视 所 花 费 的 时 间 (分 钟 )
因 素 B : 护 士 年 龄 组 : 岁 ( j)
按 A 水平合计
因 素 A : 病 种 (i)
1
(20~ )
1.心 脏 病 2.肿 瘤 3.脑 血 管 意 外 4.结 核 病
20 25 22 27 21
115
30 45 30 35 36
15
一、两因素析因设计的ANOVA
符号
两个处理因素:A、B
A、B因素各有a、b个水平,共有a×b种组合
每一组合下有n个受试对象
全部实验受试对象总数为a×b×n
i (i=1,2…,α)表示因素A的水平号, j (j=1,2,…,b)表示因素B的水平号, k (k=1,2,…,n)表示在每一组合下的受试对象号
(3)处理因素间交互作用的假设:
H0
:
ij
0
无交互作用 ;
H1
:
ij
0有交互作用
α=0.01
20
3. 计算离均差平方和及自由度
SS总
57456 18122
60
2733.6 ;

60 1 59
SS A
1 [3882 (3 5)
5252
5342
+ 3652 ] 18122 60
an
SS总 Yij2 C 110447.5 1591.12 / 24 4964.21
i1 j1
n
SS处理
a (
Y )2 ij
j1
i1 n
C
1 (500.72 8
523.42
567.02)
1591.12

血清降钙素原和C_反应蛋白在细菌感染性疾病诊断中的意义

血清降钙素原和C_反应蛋白在细菌感染性疾病诊断中的意义

阳性率 28.2 31.3
表 3 血清 PCT 和 CRP 筛检试验的评价比较(%,n)
指标
灵敏度
特异度
阳性预测值
阴性预测值
PCT
85.5(106/124)
93.9(92/98)
94.6(106/112)
83.6(92/110)
CRP
53.0(35/66)*
50.6(79/156)*
31.2(35/112)*
【关键词】 降钙素原 C-反应蛋白 细菌感染
Clinical value of serum procalcitonin and C -reactive protein in diagnosis of bacterial infections Wu Shaoqing, Wen Daolin, Cao Wenping. Gongming Hospital of Guangming New District, Shenzhen 518106
69 例,女 43 例;年龄 47.3~77.1(平均 51.0±11.8)岁; SPSS13.0 统计分析软件,P<0.05 为差异有统计学意
其中细菌性上呼吸道炎 36 例, 泌尿系感染 31 例, 义。 计算试验结果对细菌感染诊断的敏感性和特异
细菌性痢疾 25 例, 菌血症 11 例, 其性感染疾病 9 性等指标。
· 66 ·
中国现代医药杂志 2009 年 4 月第 11 卷第 4 期 MMJC, Apr 2009, Vol 11, No.4
血清降钙素原和 C-反应蛋白在细菌感染性 疾病诊断中的意义
吴少卿 文道林 曹文平
【摘要】 目的 评价血清降钙素原(PCT)和 C-反应蛋白(CRP)对细菌感染性疾病诊断的临床价值。 方法 112 例重 症监护病房(ICU)细菌感染的患者作为 感 染 组 ,并 以 110 例 ICU 非 细 菌 感 染 性 患 者 作 为 对 照 组 ,测 定 并 比 较 分 析 两 组 患 者血清 PCT 和 CRP 结果。 结果 ①感染组血清 PCT 水平显著高于对照组(P<0.05);感染组的 PCT 检测阳性率为 94.6%, 高于对照组(16.4%)(P<0.05);②感染组血清 CRP 水平显著高于对照组(P<0.05);感染组的 CRP 检测阳性率为 31.3%,高 于对照组 (28.2%),但两组差异无统计学意义(P>0.05);③PCT 检测对细菌感染性 诊 断 的 灵 敏 度 、特 异 度 、阳 性 预 测 值 、阴 性预测值和诊断符合率均高于 CRP 检测结果,相比较有显著性差异(P<0.05)。 结论 PCT 对于严重细菌感染性疾病的诊 断较 CRP 敏感,监测血清 PCT 水平可以作为严重细菌感染的特异性监测指标,对临床诊治具有指导意义。

2019_2020学年新教材高中数学第九章统计9.2.2总体百分位数的估计9.2.3总体集中趋势的估计9.2.4总体离散程度

2019_2020学年新教材高中数学第九章统计9.2.2总体百分位数的估计9.2.3总体集中趋势的估计9.2.4总体离散程度

s
2


1 6
[(99

100)2

(100

100)2

(102

100)2

(99

100)2

(100-100)2+(100-100)2]=1.
(2)两台机床所加工零件的直径的平均值相同,又 s2甲>s乙2 ,
所以乙机床加工零件的质量更稳定.
方法归纳 在实际应用中,常常把平均数与标准差结合起来进行决策,在 平均值相等的情况下,比较方差或标准差以确定稳定性.
A.平均数>中位数>众数 B.平均数<中位数<众数 C.中位数<众数<平均数 D.众数=中位数=平均数
解析:平均数、中位数、众数皆为 50,故选 D. 答案:D
3.已知一组数据为-3,5,7,x,11,且这组数的众数为 5,那么 该组数据的中位数是( )
A.7 B.5 C.6 D.11
解析:由这组数据的众数为 5,可知 x=5,把这组数据由小到 大排列为-3,5,5,7,11,则可知中位数为 5.
方法归纳
(1)平均数计算方法 ①定义法:n 个数据 a1,a2,…,an 的平均数 a =a1+a2+n …+an. ②利用加权平均数公式: 在 n 个数据中,如果 x1 出现 f1 次,x2 出现 f2 次,…,xk 出现 fk 次 (f1 + f2 + … + fk = n) , 则 这 n 个 数 的 平 均 数 为 : x = x1f1+x2f2+n …+xkfk. ③当数据较大时,用公式 x = x ′+a 简化计算.
元)
(2)假设副董事长的月工资从 5 000 元提升到 20 000 元,董事长

统计学原理第四章动态数列

统计学原理第四章动态数列

第三节 动态数列速度分析指标
动态数列的速度分析指标,也即反映国 民经济速度的主要指标有发展速度 增 发展速度、增 发展速度 长速度、平均发展速度 平均增长速度。 平均发展速度和平均增长速度 长速度 平均发展速度 平均增长速度 其中发展速度是最基本的速度分析指标。
一、发展速度和增长速度 (一)发展速度
(2)由时点数列计算序时平均数。 1 根据连续时点数列计算序时平均数。 a 对连续变动的连续时点数列求序时平均数。 简单算术平均数
∑a a=
n
b 对非连续变动的连续时点数列求序时平均数。 加权算术平均数
∑ af a= ∑f
2 根据间断时点数列计算序时平均数。 a 对间隔相等的间隔时点数列求序时平均数。 简单算术平均数 某企业1998年第二季度商品库存额 某企业 年第二季度商品库存额
这种计算方法称为“首末折半法 首末折半法”。 首末折半法
b 对间隔不等的间隔时点数列求序时平均数。 a1 + a2 a2 + a3 an−1 + an f1 + f2 +L+ fn−1 2 2 a= 2
∑f
i =1
n−1
i
某农场某年生猪存栏数
1月1日 3月1日 8月1日 10月1日 12月31日 日期 月 日 月 日 月 日 月 日 月 日 生猪存栏数(头 1200 1250 1460 生猪存栏数 头) 1420 1400
特点: (1)数列中各个指标的数值是可以相加的,即相 加具有一定的经济意义。 (2)数列中每一个指标数值的大小与所属的时期 长短有直接的联系。 (3)数列中每个指标的数值,通常是通过连续不 断的登记而取得的。
2、时点数列 在绝对数动态数列中,如果各项指标都是反映某 种现象在某一时点(瞬间)上所处的数量水平, 这种绝对数动态数列就称为时点数列。 特点: (1)数列中各个指标的数值是不能相加的,相加 不具有实际经济意义。 (2)数列中每一个指标数值的大小与其时间间隔 长短没有直接联系。 (3)数列中每个指标的数值,通常是通过一定时 期登记一次而取得的。

第九章 第三节 变量间的相关关系、统计案例

第九章  第三节  变量间的相关关系、统计案例

A.变量x与y正相关,u与v正相关 .变量 与 正相关 正相关, 与 正相关 B.变量x与y正相关,u与v负相关 .变量 与 正相关 正相关, 与 负相关 C.变量x与y负相关,u与v正相关 .变量 与 负相关 负相关, 与 正相关 D.变量x与y负相关,u与v负相关 .变量 与 负相关 负相关, 与 负相关
[究 疑 点] 究 1.相关关系与函数关系有何异同点? .相关关系与函数关系有何异同点? 提示:相同点:两者均是指两个变量的关系. 提示:相同点:两者均是指两个变量的关系. 不同点:(1)函数关系是一种确定关系,相关关系是一 函数关系是一种确定关系, 不同点: 函数关系是一种确定关系 种非确定的关系; 种非确定的关系; (2)函数关系是一种因果关系,而相关关系不一定是因 函数关系是一种因果关系, 函数关系是一种因果关系 果关系,也可能是伴随关系. 果关系,也可能是伴随关系.
2.根据独立性检验的基本思想,得出的两个分类变量有 .根据独立性检验的基本思想, 关系,这样的结论一定是正确的吗? 关系,这样的结论一定是正确的吗? 提示:在实际问题中, 提示:在实际问题中,独立性检验的结论仅仅是一种 数学关系,得出的结论也可能犯错误,比如: 数学关系,得出的结论也可能犯错误,比如:在推测 吸烟与肺癌是否有关时,通过收集、整理、分析数据, 吸烟与肺癌是否有关时,通过收集、整理、分析数据, 我们得到“吸烟与患肺癌有关”的结论, 我们得到“吸烟与患肺癌有关”的结论,并且有超过 99%的把握说明吸烟与患肺癌有关系,或者这个结论 的把握说明吸烟与患肺癌有关系, 的把握说明吸烟与患肺癌有关系 出错的概率为0.01以下.但实际上一个人吸烟也不一 以下. 出错的概率为 以下 定会患肺癌, 定会患肺癌,这是数学中的统计思维与确定性思维差 异的反映. 异的反映.

卵巢恶性风险计算法预测盆腔包块患者卵巢癌风险

卵巢恶性风险计算法预测盆腔包块患者卵巢癌风险张双革摘要目的:探讨血清人附睾蛋白4(Human epididymis protein4HE4)和癌抗原125(CA125)联合检测(卵巢恶性风险计算法ROMA)预测盆腔包块患者上皮性卵巢癌(EOC)风险。

方法:采用电化学发光法检测因盆腔包块或卵巢囊肿住院拟行手术的患者血清HE4和CA125水平,根据是否绝经,采用ROMA方法计算卵巢癌预测概率(PP),绘制受试者工作曲线(ROC),分别确定绝经前后临界值,并将患者划分至高危组和低危组,评估预测模型的应用价值。

结果:评估了1683例患者,其中1448例盆腔良性疾病,235例盆腔恶性肿瘤,包括106例EOC。

在经病理确诊为良性盆腔包块患者中有1356例被划分至低危组,特异性93.6%;盆腔恶性肿瘤中121例划分至高危组,敏感度80.7%;卵巢交界性上皮瘤20例划分至高危组,敏感度28.2%;EOC中93例划分至高危组,敏感度87.7%,未划分至高危组包括黏液性腺癌2例,透明细胞癌11例。

卵巢非上皮性恶性肿瘤患者中5例划分至高危组,敏感度38.5%;非卵巢恶性肿瘤患者中35例划分至高危组,敏感度85.3%;转移性卵巢癌患者中1例划分至高危组,敏感度25.0%。

结论:ROMA较成功地将盆腔恶性肿瘤患者划分至高危组,其中EOC患者大部分被正确地划分至高危组,ROMA在诊断恶性肿瘤尤其是EOC方面具有较高的应用价值。

关键词卵巢肿瘤肿瘤标记生物学CA-125抗原危险性评估预测人附睾蛋白4doi:10.3969/j.issn.1000-8179.20130586卵巢癌是一种常见的妇科恶性肿瘤,预后差,死亡率高。

血清肿瘤标记物CA125是临床应用最广泛的卵巢癌预测指标,但对早期卵巢癌患者敏感度较低,特异性不高。

人附睾蛋白4(human epididymisprotein4,HE4)是新兴的肿瘤标记物,对卵巢癌的敏感度和特异度都有显著提高。

成对数据的统计分析


x3 3 4 5 5 6 6 8 y 10 12 13 18 19 21 24 27
②当实际值与估计值的差的绝对值与估计值的比值不超过10%时,认为 发放的该轮消费券助力消费复苏是理想的.若该省A城市8月份发放额度为 10百万元的消费券后,经过一个月的统计,发现实际带动的消费为30百 万元,请问发放的该轮消费券助力消费复苏是否理想?若不理想,请分 析可能存在的原因.
知识梳理
2.样本相关系数
(1)r=
n
xi- x yi- y
i=1
.
n
xi- x 2
n
yi- y 2
i=1
i=1
(2)当r>0时,称成对样本数据 正相关 ;当r<0时,称成对样本数据 负相关 . (3)|r|≤1;当|r|越接近1时,成对样本数据的线性相关程度越 强 ;当|r|越接 近0时,成对样本数据的线性相关程度越 弱 .
说明:对于经验回归方程的样本相关系数r,当|r|>0.75时,两个变量之间 具有很强的线性相关关系.参考数据: 35 ≈5.9.
x3 3 4 5 5 6 6 8
y 10 12 13 18 19 21 24 27
因为 x =3+3+4+5+8 5+6+6+8=5, y =10+12+13+18+8 19+21+24+27=18.
√^lt;r2
^^
B.b1>b2 D.R21>R22
身高的平均数为165+168+170+172+1731+0174+175+177+179+182 =173.5, 因为离群点(168,89)的横坐标168小于平均值173.5,纵坐标89相对过大, 所以去掉离群点后经验回归直线的截距变小而斜率变大, 所以a^ 1>a^ 2,b^ 1<b^ 2,所以 A 正确,B 错误;

高考统计题的热点题型与解法

ʏ山西省吕梁市贺昌中学 刘鹏飞近几年高考关于统计问题越来越注重对数据的分析处理能力的考查,考查知识点比较全面,如频率分布直方图㊁回归分析㊁独立性检验等㊂这需要同学们认真读题,读懂题意,尤其是理清题目中数据的特点,这样就能利用所学的统计知识来解决㊂题型一㊁统计图表中的数据分析问题统计图表的类型非常丰富,扇形图直观显示各部分所占总体的百分比,折线图直观显示数据的变化趋势,直方图直观显示数据的分布情况等㊂解答这类题目时,要准确识图,分析数据的变化或分布规律,从图表中提取关键信息进行定性判断或定量计算,如求样本数据的众数㊁中位数㊁平均数㊁方差等㊂例1 某校1500名学生参加交通安图1全知识竞赛,随机抽取了100名学生的竞赛成绩(单位:分),成绩的频率分布直方图如图1所示,则下列说法正确的是( )㊂A.频率分布直方图中a 的值为0.0045B .估计这100名学生竞赛成绩的第60百分位数为80C .估计这100名学生竞赛成绩的众数为80D .估计总体中成绩落在[70,80)内的学生人数为500解析:由10ˑ(2a +3a +7a +6a +2a )=1,可得a =0.005,故A 错误;可知每组的频率依次为0.10,0.15,0.35,0.30,0.10,前三组的频率和为0.10+0.15+0.35=0.6,所以这100名学生竞赛成绩的第60百分位数为80,故B 正确;因为[70,80)的频率最大,所以这100名学生竞赛成绩的众数为75,故C 错误;总体中成绩落在[70,80)内的学生人数为0.35ˑ1500=525,故D 错误㊂故选B ㊂点评:频率分布直方图的纵轴表示频率组距,所以每组样本的频率是对应矩形的面积㊂此题先根据频率之和为1求出a 的值,然后根据各组的频率求第60百分位数㊁众数,以及在[70,80)内的学生人数㊂题型二㊁回归模型的分析与建立问题根据两个变量的散点图,如果样本点分布在一条直线附近,那么两个变量具有线性相关性,可以建立一元线性回归模型㊂如果两个变量非线性相关,那么可以根据散点图的具体特征,通过换元,转化成线性回归模型㊂同时,要会根据题目给出的公式计算相关系数和决定系数㊂例2 为了研究某种细菌随天数x 变化的繁殖个数y ,收集数据如表1所示:表1天数x 123456繁殖个数y36132545100(1)判断^y =^b x +^a (^a ,^b 为常数)与^y =^c 1e ^c x (^c 1,^c 2为常数,且^c 1>0,^c 2ʂ0)哪一个适宜作为繁殖个数y 关于天数x 变化的回归方程类型?(2)对于非线性回归方程^y =^c 1e ^c x (^c 1,^c 2为常数,且^c 1>0,^c 2ʂ0),令z =l n y ,可以得到繁殖个数的对数z 关于天数x 具有线性关系及一些统计量的值(表2)㊂表2x3.50 y32z2.85ð6i =1(x i - x )217.5ð6i =1(x i - x )(y i - y )307ð6i =1(x i- x )(z i -z )12.12 ①证明:对于非线性回归方程^y =^c 1e ^c x ,令z =l n y ,可以得到繁殖个数的对数z 关于天数x 具有线性关系(即^z =^βx +^α,^β,^α为常数);②根据①的判断结果及表中数据,建立y 关于x 的回归方程(系数保留2位小数)㊂附:对于一组数据(u 1,v 1),(u 2,v 2), ,(u n ,v n ),其回归直线方程^v =^βu +^α的斜率和截距的最小二乘法估计公式分别为^β=ðni =1(u i- u )(v i - v )ðni =1(u i -u )2,^α= v -^βu ㊂解析:(1)如图2,作出繁殖个数y 关于图2天数x 变化的散点图㊂观察散点图知,样本点分布在一条指数型曲线周围,所以^y =^c 1e ^c x 更适宜作为繁殖个数y 关于天数x 变化的回归方程类型㊂(2)①由(1)知,^y =^c 1e ^c x(^c 1,^c 2为常数,且^c 1>0,^c 2ʂ0),又z =l n y ,因此l n ^y =l n (^c 1e ^c x )=l n ^c 1+l n e ^c x =l n ^c 1+^c 2x ㊂令^α=l n ^c 1,^β=^c 2,则有^z =^βx +^α,其中^β,^α为常数,所以繁殖个数的对数z 关于天数x 具有线性关系㊂②由①知,^c 2=^β=ð6i =1(x i- x )(z i - z )ð6i =1(x i-x )2=12.1217.5ʈ0.69,l n ^c 1=^α= z -^βx =2.85-0.69ˑ3.50ʈ0.44,因此^z =0.69x +0.44㊂所以y 关于x 的回归方程为^y =e0.69x +0.44㊂点评:第一问根据给定的数据作出散点图,再借助散点图即可判断指数型函数更适宜作为回归方程㊂第二问由选定的回归方程类型,取对数即可得z 关于天数x 具有线性关系,然后利用最小二乘法计算回归方程中的未知系数,最后要注意把方程还原成y 关于x 变化的回归方程㊂题型三、独立性检验问题独立性检验是对两个变量有关系的可信程度的判断,用独立性检验解决实际问题时,首先,提出零假设H 0:X 和Y 互相独立,并给出在实际问题中的解释㊂其次,根据2ˑ2列联表,计算χ2的值㊂最后,将χ2的值与临界值x α进行比较,得出推断结论:当χ2ȡx α时,推断H 0不成立,即认为X 和Y 不独立,该推断犯错误的概率不超过α;当χ2<x α时,推断H 0不成立,可以认为X 和Y 独立㊂例3 (2023年全国甲卷文19)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g)㊂试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.2,18.8,20.2,21.3,22.5,23.2,25.8,26.5,27.5,30.1,32.6,34.3,34.8,35.6,35.6,35.8,36.2,37.3,40.5,43.2;试验组的小白鼠体重的增加量从小到大排序为7.8,9.2,11.4,12.4,13.2,15.5,16.5,18.0,18.8,19.2,19.8,20.2,21.6,22.8,23.6,23.9,25.1,28.2,32.3,36.5㊂(1)计算试验组的样本平均数㊂(2)①求40只小白鼠体重的增加量的中位数m ,再分别统计两样本中小于m 与不小于m 的数据的个数,完成表3所示的列联表:表3<m ȡm对照组试验组②根据①中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异附:χ2=n (a d -b c )2(a +b )(c +d )(a +c )(b +d )㊂表4P (χ2ȡk )0.1000.0500.010k2.7063.8416.635解析:(1)试验组样本平均数为120(7.8+9.2+11.4+12.4+13.2+15.5+16.5+18.0+18.8+19.2+19.8+20.2+21.6+22.8+23.6+23.9+25.1+28.2+32.3+36.5)=39620=19.8㊂(2)①依题意,可知这40只小白鼠体重的中位数是将两组数据合在一起,从小到大排后第20位与第21位数据的平均数,由原数据可得第11位数据为18.8,后续依次为19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,23.6, ,故第20位数据为23.2,第21位数据为23.6,所以m =23.2+23.62=23.4㊂故列联表为表5:表5<m ȡm 合计对照组61420试验组14620合计202040②由①得,χ2=40ˑ(6ˑ6-14ˑ14)220ˑ20ˑ20ˑ20=6.400>3.841,所以能有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异㊂点评:第一问直接根据平均数的定义进行计算;第二问是要将两组共40个数据合在一起,从小到大排序后再求中位数,考差了中位数的概念和计算;第三问根据已知公式计算χ2的值,查表即可得出答案㊂因此,正确完成列联表和计算χ2的值是解决独立性检验问题的关键㊂题型四㊁新定义㊁新情境问题在近几年高考中,出现了以新定义为背景的统计题,体现了统计在现实生活中的应用㊂解决这类问题要读懂题意,尤其是理解题目给出的新参数㊁新统计量的含义,合理地分析和处理数据,运用统计知识解决实际问题㊂例4 (2023年新高考Ⅱ卷19)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如图3和图4所示的患病者和未患病者该指标的频率分布直方图㊂图3利用该指标制定一个检测标准,需要确定临界值c ,将该指标大于c 的人判定为阳性,小于或等于c 的人判定为阴性㊂此检测标准的漏诊率是将患病者判定为阴图4性的概率,记为p (c );误诊率是将未患病者判定为阳性的概率,记为q (c )㊂假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率㊂(1)当漏诊率p (c )=0.5%时,求临界值c 和误诊率q (c );(2)设函数f (c )=p (c )+q (c ),当c ɪ[95,105]时,求f (c )的解析式,并求f (c )在区间[95,105]内的最小值㊂解析:(1)依题可知,图3中第一个小矩形的面积为5ˑ0.002>0.5%,所以95<c <100,所以(c -95)ˑ0.002=0.5%,解得c =97.5㊂q (c )=0.01ˑ(100-97.5)+5ˑ0.002=0.035=3.5%㊂(2)当c ɪ[95,100]时,f (c )=p (c )+q (c )=(c -95)ˑ0.002+(100-c )ˑ0.01+5ˑ0.002=-0.008c +0.82ȡ0.02;当c ɪ(100,105]时,f (c )=p (c )+q (c )=5ˑ0.002+(c -100)ˑ0.012+(105-c )ˑ0.002=0.01c -0.98>0.02㊂综上可得,函数f(c )=-0.008c +0.82,95ɤc ɤ100,0.01c -0.98,100<c ɤ105㊂所以f (c )在区间[95,105]内的最小值为0.02㊂点评:本题新定义了两个统计量:医学检测的漏诊率p (c )和误诊率q (c )㊂第一问由第一个频率分布直方图可先求出c ,再根据第二个频率分布直方图求出c ȡ97.5的矩形面积即可解出;第二问根据题意确定分段点100,即可得出f (c )的解析式,再根据分段函数的最值求法即可解出㊂本题不仅考查在新情境中运用统计知识解决问题,还与函数知识产生交汇,是一道值得好好研究的能力题㊂(责任编辑 王福华)强化数学运算,聚焦统计策略,提升核心素养以2023年高考数学全国乙卷第17题的解法溯源及拓展探究为例ʏ广东省广州市广州大同中学 袁 安2023年高考数学全国乙卷第17题貌似平淡无奇,实则韵味十足,蕴藏了众多的计算方法和数学思想㊂符合基础性㊁综合性㊁应用性㊁创新性的高考试题原则,是检测数学运算㊁数据分析等核心素养,选拔人才的基础好题㊂本文通过对新高考乙卷统计试题的分析㊁解答㊁溯源和再研究,为同学们解答高考试题提供思路和方法㊂一㊁真题呈现题目 (2023年全国乙卷17)某厂为比较甲㊁乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选择其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率㊂甲㊁乙两种工艺处理后的橡胶产品的伸缩率分别记为x i ,y i (i =1,2, ,10)㊂试验结果如表1:表1试验序号i 12345678910伸缩率x i 545533551522575544541568596548伸缩率y i 536527543530560533522550576536 记z i =x i -y i (i =1,2, ,10),记z 1,z 2,,z 10的样本平均数为 z ,样本方差为s 2㊂(1)求 z ,s 2;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果 z ȡ2s 210,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)㊂赏析:试题是通过公平的工业背景收集大量的数据,需要认真读题和审题,理解符号x i ,y i (i =1,2, ,10)及定义新符号z i =x i -y i (i =1,2, ,10)的意义,再根据统计分析,发现规律,解答问题㊂第(1)问比较简单,通过分析可知需要求10个数的均值与方差,但在高考的压力下,选择什么方法和策略是非常关键的㊂第(2)问是新定义题型,要求考生在理解给出数学符号及意义的基础上,对知识进行及时应用,并做出正确㊁合理的判断㊂这两个问题层层递进,步步提升,每一步都要求考生有较强的数据分析与处理能力㊂二㊁多角度解法荟萃(1)分析:求收集到的两组数据x i ,y i (i =1,2, ,10)对应的差值z i =x i -y i (i =1,2, ,10)的平均数与方差㊂可以根据试题要求,在原表格基础上快速求出对应的值,再通过相应的计算公式求解㊂解法一:妙用配凑,化零为整㊂由题意可得表2:表2试验序号i 12345678910伸缩率x i 545533551522575544541568596548伸缩率y i 536527543530560533522550576536z i968-8151119182012。

统计学 析因设计

在评价药物疗效时,除需知道A药和B药各 剂量的疗效外(主效应),还需知道两种药 同时使用的协同疗效。析因设计及相应的方 差分析能分析药物的单独效应、主效应和交 互效应。

一、析因设计
实例1:甲乙两药治疗高胆固醇血症的疗效(胆固 醇降低值mg%),问①甲乙两药是否有降低胆固醇 的作用?②两种药间有无交互作用
第17章 析因设计
Factorial design
基本概念

析因设计:一种在试验设计中同时考虑多个 因素对应变量的影响的设计方法。几个因素 间存在交互作用时,析因试验设计是一种 理想的设计。

完全随机设计(单因素)


随机区组设计(两因素, 无重复)
析因设计(两因素以上, 至少重复2次以上)
析因设计的意义
主效应(main effects):某因素各单独效应 的平均效应 交互作用(Interaction):某一因素效应随着 另一因素变化而变化的情况。(如一级交互 作用AB、二级交互作用ABC…


例:

(1)单独的效应。 (2)主效应:某因素各水平的平均差别。 (3)交互效应:某因素各水平的单独效应随另一 因素水平变化而变化,则称两因素间存在交互 效应。如果,存在交互效应。


如果 ( ab 0 ) ( a 0 ) ( b 0 ) ,协同作用。
如果 ( ab 0 ) ( a 0 ) ( b 0 ) ,拮抗作用。

如果不存在交互效应,则只需考虑各因素的主 效应。 在方差分析中,如果存在交互效应,解释结果 时,要逐一分析各因素的单独效应,找出最优 搭配。 在两因素析因设计时,只需考虑一阶交互效应。 三因素以上时,除一阶交互效应外,还需考虑 二阶、三阶等高阶交互效应,解释将更复杂。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档