数据比对1公式
一级注册计量师习题解答思路_六_罗兆斌

=228.0
加 权算 术平均 值 的实 验 标准 偏差 为
% m
γ11=
x10-x9 10.0012-10.0007 = =0.625 x10-x2 10.0012-10.0004
x2-x1 10.0004-10.0003 γ′11= = =0.25 x9-x1 10.0007-10.0003 γ11>γ11 ′ ,γ11=0.625>D (0.05,10)=0.530,x10=10.0012Ω
=
姨
%
姨
∑ W (x -x
i i i=1 m i=1
W
)2
(m-1 )∑ Wi
3×(215.3-228.0)2+3×(236.0-228.0)2+1×(289.7-228.0)2+4×(216.0-228.0)2 (4-1)×(3+3+1+4)
=12
提示 : 本 题 的 计 算 在 数 据 处 理 中 经 常 用 到 , 应 用 时首先要牢记公式 , 其次要 仔 细 计 算 , 第 三 应 注 意 合 理表达计算结果 。 案例 3: 某法定计量机构为得到质量 m=300g 的计 量 标 准 , 采 用 了 两 个 质 量 分 别 为 m1=100g 、 m2=200g , 相互独立的砝码 。 m1 与 m2 校准的相对标准不确定度
管 理 MANAGEMENT
基础知识讲座
一级注册计量师习题
□ 北京邮政科学研究设计院
罗兆斌
解答思路 (六 )
结 果 从 小 到 大 排 为 :10.0003Ω 、10.0004Ω 、10.0004Ω 、
( 接上期 )
第三章
四 、 案例分析题
计量综合知识
序列分析(一)一一序列比对

1. 可以找到两个序列间所有可能的残基匹配; 2. 简单、易懂 3. 直观、整体性强
工具:
/Tools/emboss/index.html
例1:自身的比对
AKG F KC A D E
A1 0 0 0 0 0 1 0 0
K 10010000
G
1000000
V -11 Sij
E -22 要求解Sij的分数,我们必须先知道
S -33
L
-44
Si-1, j-1, Si-1, j, Si, j-1的分数,这种方法叫 做递归算法;
C -55 采用这种方法,可以把大的问题分割 Y -66 成小的问题逐一解决,即动态规划算
法;需要存储如何得到Sij分数的过程。
全局比对 (3)
例5:不同序列的比对
P KD F CKA LV
P1 0 0 0 0 0 0 0 0
K 10001000
F
0100000
T
00000
K1
1000
A
100
I
00
V
1
PKDFCKALV PK - FTKAIV
字符的关系: 1. 匹配 2. 删除或插入 3. 替换
对于例五中的情况:
PKDFCKALV PK – FTKA I V 1 1 -11 0 1 1 0 1 Score=1+1+(-1)+1+0+1+1+0+1
序列分析(一)
一一序列比对
生物信息学研究的三个层面
初级层面:
基于现有的生物信息数据库和资源,利用成熟的生 物信息学工具(专业网站、软件)解决生物信息学 问题
——生物信息数据库(NCBI、EBI、DDBJ、UniProt等) ——基因组序列分析、序列比对软件(BLAST、CLUSTAL 等) ——系统发育树构建软件的简单使用(PHYLIP、PALM等) ——搜集、整理有特色的生物信息学数据库
污染源监督性监测比对监测技术规范

附件1:四川省污染源监督性监测比对监测技术规范1 内容与适用范围根据国家有关污染源在线监测系统技术规范和我省污染源在线监测系统的安装、运行情况,结合污染源监督性监测的要求,在进行污染源监督性监测的同时,对废水在线监测系统和固定污染源废气在线监测系统开展比对监测。
线监测系统开展比对监测。
本规范规定了四川省污染源监督性监测中废水在线监测系统和固定污染源废气在线监测系统比对监测的监测项目、固定污染源废气在线监测系统比对监测的监测项目、监测频次、监测频次、采样及分析、数据处理、判别指标、判别要求和评价结果表述等的技术要求。
求。
本规范适用于在四川省污染源监督性监测过程中,对废水在线监测系统和固定污染源废气在线监测系统进行比对监测的活动。
测系统和固定污染源废气在线监测系统进行比对监测的活动。
2 规范性引用文件本标准内容引用了下列文件中的条款。
凡是不注日期的引用文件,其有效版本适用于本标准。
件,其有效版本适用于本标准。
HJ/T 353 《水污染源在线监测系统安装技术规范》《水污染源在线监测系统安装技术规范》HJ/T 354 《水污染源在线监测系统验收技术规范》《水污染源在线监测系统验收技术规范》HJ/T 355 《水污染源在线监测系统运行与考核技术规范》《水污染源在线监测系统运行与考核技术规范》 HJ/T 356 《水污染源在线监测系统数据有效性判别技术规范》《水污染源在线监测系统数据有效性判别技术规范》 HJ/T 15 《环境保护产品技术要求《环境保护产品技术要求 超声波明渠污水流量计》超声波明渠污水流量计》 CJ/T 3017《潜水电磁流量计》《潜水电磁流量计》HJ/T 75 《固定污染源烟气排放连续监测技术规范》《固定污染源烟气排放连续监测技术规范》HJ/T 76 《固定污染源烟气排放连续监测系统技术要求及检测方法》方法》HJ/T 91 《地表水和污水监测技术规范》《地表水和污水监测技术规范》HJ/T 92 《水污染物排放总量监测技术规范》《水污染物排放总量监测技术规范》HJ/T 397 《固定源废气监测技术规范》《固定源废气监测技术规范》HJ/T 373 《固定污染源监测质量保证与质量控制技术规范》 3 术语和定义3.1 废水在线监测系统是指在污染源现场安装的用于监控、监测污染物排放的化学需氧量在线自动监测仪、氨氮水质自动监测仪、超声波明渠污水流量计、电磁流量计、数据采集传输仪等仪器、仪表及废水在线监测站房。
2023年高考数学一轮复习精讲精练(新高考专用)专题52:列联表独立性检验(讲解版)

专题52:列联表独立性检验精讲温故知新1. 数值变量与分类变量数值变量:数值变量的取值为实数,其大小和运算都有实际含义.分类变量:这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.注意点:分类变量的取值可以用实数来表示,例如男性,女性可以用1,0表示,学生的班级可以用1,2,3来表示.这些数值只作编号使用,并没有大小和运算意义.分类变量是相对于数值变量来说的.变量的不同“值”表示个体所属的不同类别,像这样的变量才是分类变量.2:列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表构造一个随机变量K2=n(ad-bc)(a+b)(a+c)(b+d)(c+d),其中n=a+b+c+d为样本容量.3. 分类变量与列联表的实际应用利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将aa+b与cc+d⎝⎛⎭⎪⎫ba+b与dc+d的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.4. 独立性检验的理解1.独立性检验:利用χ2的取值推断分类变量X 和Y 是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验. 2.χ2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .注意点:(1)卡方越小,独立性越强,相关性越弱;卡方越大,独立性越弱,相关性越强.(2)当χ2≥x α时,我们就推断H 0不成立,即认为X 和Y 不独立,该推断犯错误的概率不超过α;当χ2<x α时,我们没有充分证据推断H 0不成立 ,可以认为X 和Y 独立. 根据所给的观测值,与所给的临界值表中的数据进行比较,即可得出结论. 5. 有关“相关的检验” 用χ2进行“相关的检验”步骤 (1)零假设:即先假设两变量间没关系. (2)计算χ2:套用χ2的公式求得χ2值.(3)查临界值:结合所给小概率值α查得相应的临界值x α. (4)下结论:比较χ2与x α的大小,并作出结论. 6. 有关“无关的检验” 运用独立性检验的方法(1)列出2×2列联表,根据公式计算χ2. (2)比较χ2与x α的大小作出结论题型一:列联表例1:假设有两个变量X 和Y ,他们的取值分别为1x ,2x 和1y ,2y ,其列联表为:则表中a ,b 的值分别是( ) A .94,96 B .54,52C .52,50D .52,60【答案】D【详解】根据列联表知,=732152a -=,又8a b +=,所以60b =, 故选:D举一反三下列是关于出生男婴与女婴调查的22⨯列联表那么D __________.【答案】82【详解】解:由题意,4598E +=,35A D +=,45A B +=,35E C +=,180B C +=47A ∴=,92B =,88C =,82D =,53E =故答案为: 82.题型二:等高条形图例2:为了解户籍性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的调查样本,其中城镇户籍与农村户籍各50人,男性40人,女性60人,绘制不同群体中倾向选择生育二胎与选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则关于样本下列叙述中正确的是( )A .是否倾向选择生育二胎与户籍无关B .是否倾向选择生育二胎与性别有关C .倾向选择生育二胎的人员中,男性人数与女性人数相同D .倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数 【答案】D【详解】对于A ,城镇户籍中40%选择生育二胎,农村户籍中80%选择生育二胎,相差较大,则是否倾向选择生育二胎与户籍有关,A 错误;对于B ,男性和女性中均有60%选择生育二胎,则是否倾向选择生育二胎与性别无关,B 错误; 对于C ,由于男性和女性中均有60%选择生育二胎,但样本中男性40人,女性60人,则倾向选择生育二胎的人员中,男性人数与女性人数不同,C 错误;对于D ,倾向选择不生育二胎的人员中,农村户籍有5020%10⨯=人,城镇户籍有5060%30⨯=人,农村户籍人数少于城镇户籍人数,D 正确.故选:D.举一反三为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如等高条形图:根据图中的信息,下列结论中不正确的是()A.样本中多数男生喜欢手机支付B.样本中的女生数量少于男生数量C.样本中多数女生喜欢现金支付D.样本中喜欢现金支付的数量少于喜欢手机支付的数量【答案】C【详解】对于A,由右图可知,样本中多数男生喜欢手机支付,A对;对于B,由左图可知,样本中的男生数量多于女生数量,B对;对于C,由右图可知,样本中多数女生喜欢手机支付,C错;对于D,由右图可知,样本中喜欢现金支付的数量少于喜欢手机支付的数量,D对.故选:C.题型三:独立性检验的概念及计算例3:(2022·湖北武汉·模拟预测)通过随机询问某中学110名中学生是否爱好跳绳,得到如下列联表:跳绳性别合计男女爱好40 20 60 不爱好20 30 50已知()()()()()22n ad bcKa b c d a c b d-=++++,则以下结论正确的是()A.根据小概率值0.001α=的独立性检验,爱好跳绳与性别无关B.根据小概率值0.001α=的独立性检验,爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001 C.根据小概率值0.01α=的独立性检验,有99%以上的把握认为“爱好跳绳与性别无关”D.根据小概率值0.01α=的独立性检验,在犯错误的概率不超过1%的前提下,认为“爱好跳绳与性别无关”【答案】A【详解】由题知()()()()()22 2110(40302020)7.82260506050n ad bcKa b c d a c b d-⨯-⨯==≈++++⨯⨯⨯因为7.82210.828<,所以爱好跳绳与性别无关且这个结论犯错误的概率超过0.001,故A正确,B错误,又因为7.822 6.635>,所以有99%以上的把握认为“爱好跳绳与性别有关,或在犯错误的概率不超过1%的前提下,认为“爱好跳绳与性别有关.故C和D错误.故选:A.举一反三1.(2022·江西南昌·一模(理))根据分类变量x与y的观察数据,计算得到2 2.974K=,依据下表给出的2K 独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是()A.有95%的把握认为变量x与y独立B.有95%的把握认为变量x与y不独立C.变量x与y独立,这个结论犯错误的概率不超过10%D.变量x与y不独立,这个结论犯错误的概率不超过10%【答案】D【详解】因为2 2.974 2.706K=>,所以变量x与y不相互独立,这个结论犯错误的概率不超过10%.故选:D 2.(2022·四川雅安·三模(文))为考察一种新药预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的22K≈.参照附表,下列结论正确⨯列联表中,由列联表中的数据计算得29.616的是()附表:A.在犯错误的概率不超过0.1%的前提下,认为“药物有效”B.在犯错误的概率不超过0.1%的前提下,认为“药物无效”C.有99%以上的把握认为“药物有效”D.有99%以上的把握认为“药物无效”【答案】C解:因为29.616<<,所以有99%以上的把握认为“药物有效”.K7.87910.828K≈,即2故选:C.题型四:独立性检验的基本思想例4:(2022·江西·二模(文))千百年来,我国劳动人民在生产实践中根据云的形状、走向速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩销云,地上雨淋林”“日落云里走,雨在半夜后”……小明同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下22⨯列联表:并计算得到219.05K=,下列小明对地区天气判断正确的是()A.夜晚下雨的概率约为1 5B.未出现“日落云里走”,但夜晚下雨的概率约为12C.出现“日落云里走”,有99.9%的把握认为夜晚会下雨D.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关【答案】D【详解】根据表中数据可知,夜晚下雨的概率约为252511002P+==,所以A错.未出现“日落云里走”,但夜晚下雨的概率约为255254514P==+,故B错.219.0510.828K=>,对照临界值表可知,有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,但不能说有99.9%的把握认为夜晚会下雨,故C错,D对.故选:D举一反三(2022·安徽省芜湖市教育局模拟预测(理))为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设0H :“这种血清不能起到预防感冒的作用”,利用22⨯列联表计算的结果,认为0H 成立的可能性不足1%,那么2K 的一个可能取值为( )A .7.879B .6.635C .5.024D .3.841【答案】A【详解】若0H 成立的可能性不足1%,则2 6.635K >,由选项知:27.879K =. 故选:A.题型五:独立性检验解决实际问题例5:(2022·全国·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,A 表示事件“选到的人卫生习惯不够良好”,B 表示事件“选到的人患有该疾病”.(|)(|)P B A P B A 与(|)(|)P B A P B A 的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R .(ⅰ)证明:(|)(|)(|)(|)P A B P A B R P A B P A B =⋅;(ⅱ)利用该调查数据,给出(|),(|)P A B P A B 的估计值,并利用(ⅰ)的结果给出R 的估计值.附22()()()()()n ad bc K a b c d a c b d -=++++,【解析】(1)由已知222()200(40906010)=24()()()()50150100100n ad bc K a b c d a c b d -⨯-⨯==++++⨯⨯⨯, 又2( 6.635)=0.01P K ≥,24 6.635>,所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异. (2)(i)因为(|)(|)()()()()=(|)(|)()()()()P B A P B A P AB P A P AB P A R P B A P B A P A P AB P A P AB =⋅⋅⋅⋅,所以()()()()()()()()P AB P B P AB P B R P B P AB P B P AB =⋅⋅⋅ 所以(|)(|)(|)(|)P A B P A B R P A B P A B =⋅,(ii) 由已知40(|)100P A B =,10(|)100P A B =,又60(|)100P A B =,90(|)100P A B =, 所以(|)(|)=6(|)(|)P A B P A B R P A B P A B =⋅举一反三(2021·全国·高考真题(文))甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++【详解】(1)甲机床生产的产品中的一级品的频率为15075% 200=,乙机床生产的产品中的一级品的频率为12060% 200=.(2)()22400150801205040010 6.63527013020020039K⨯-⨯==>>⨯⨯⨯,故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.精练巩固提升一、单选题1.(2022·全国·模拟预测)某初级中学有700名学生,在2021年秋季运动会中,为响应全民健身运动的号召,要求每名学生都必须在“立定跳远”与“坐位体前屈”中选择一项参加比赛.根据报名结果知道,有12的男生选择“立定跳远”,有34的女生选择“坐位体前屈”,且选择“立定跳远”的学生中女生占25,则参照附表,下列结论正确的是()附:()()()()()22n ad bc K a b c d a c b d -=++++,n =a +b +c +d .A .在犯错误的概率不超过2.5%的前提下,认为选择运动项目与性别无关B .在犯错误的概率不超过5%的前提下,认为选择运动项目与性别无关C .有97.5%的把握认为选择运动项目与性别有关D .有95%的把握认为选择运动项目与性别有关【答案】C 【详解】解:由题意得:设该校男生人数为x ,女生人数为y ,则可得如下表格:由题意知12411524y x y =+,即43y x =,又x +y =700,解得300,400,x y =⎧⎨=⎩则()2270015030015010046.67 5.024300400250450K ⨯⨯-⨯=≈>⨯⨯⨯,所以有97.5%的把握认为选择运动项目与性别有关.故选C . 2.(2022·四川成都·三模(理))在某大学一食品超市,随机询问了70名不同性别的大学生在购买食物时是否查看营养说明,得到如下的列联表:附:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.根据列联表的独立性检验,则下列说法正确的是().A.在犯错误的概率不超过0.05的前提下认为该校大学生在购买食物时要查看营养说明的人数中男生人数更多B.在犯错误的概率不超过0.010的前提下认为该校女大学生在购买食物时要查看营养说明的人数与不查看营养说明的人数比为3 4C.在犯错误的概率不超过0.025的前提下认为性别与是否查看营养说明有关系D.在犯错误的概率不超过0.010的前提下认为性别与是否查看营养说明有关系【答案】C【详解】由题可得2270(15102025)= 5.83 5.02435353040K⨯⨯-⨯≈>⨯⨯⨯,∴在犯错误的概率不超过0.025的前提下认为性别与是否查看营养说明有关系.故选:C.3.(2021·全国·模拟预测(理))为了丰富教职工业余文化生活,某校计划在假期组织70名老师外出旅游,并给出了两种方案(方案一和方案二),每位老师均选择且只选择一种方案,其中有50%的男老师选择方案一,有75%的女老师选择方案二,且选择方案一的老师中女老师占40%,则参照附表,得到的正确结论是( )附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.A .在犯错误的概率不超过2.5%的前提下,认为“选择方案与性别有关”B .在犯错误的概率不超过2.5%的前提下,认为“选择方案与性别无关”C .有95%以上的把握认为“选择方案与性别有关”D .有95%以上的把握认为“选择方案与性别无关”【答案】C【详解】设该校男老师的人数为x ,女老师的人数为y ,则可得如下表格:由题意0.40.50.25x y =+,可得43y x =,可得30x =,40y =, 则()227015301510 4.667 3.84125453040K ⨯-⨯=≈>⨯⨯⨯, 但4.667 5.024<,所以无97.5%以上有95%以上的把握认为“选择方案与性别有关”.故选:C.4.(2021·安徽黄山·二模(理))下列命题:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于0,表示回归效果越好;②两个变量相关性越强,则相关系数的绝对值就越接近于1;③两个模型中残差平方和越小的模型拟合的效果越好;④对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说,k 越大,“X 与Y 有关系”的把握程度越大. 其中正确命题的个数是( )A .1个B .2个C .3个D .4个【答案】C解:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于0,表示回归效果越不好,①错误;②两个变量相关性越强,则相关系数的绝对值就越接近于1,②正确;③两个模型中残差平方和越小的模型拟合的效果越好,③正确;④对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说,k 越大,“X 与Y 有关系”的把握程度越大,④正确.故选:C .5.(2022·河南·长葛市第一高级中学模拟预测(理))某校计划在课外活动中新增攀岩项目,为了解学生喜欢攀岩和性别是否有关,面向全体学生开展了一次随机调查,其中参加调查的男、女生人数相同,并绘制成等高条形图(如图所示),则下列说法正确的是( ) ()20P K k ≥ 0.05 0.010k 3.841 6.635参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.A .参与调查的学生中喜欢攀岩的女生人数比喜欢攀岩的男生人数多B .参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多C .若参与调查的男、女生人数均为100人,则能在犯错误的概率不超过0.01的前提下认为喜欢攀岩和性别有关D .无论参与调查的男、女生人数为多少,都能在犯错误的概率不超过0.01的前提下认为喜欢攀岩和性别有关【答案】C【详解】对于选项A :因为参加调查的男、女生人数相同,而男生中喜欢攀岩的占80%,女生中喜欢攀岩的占30%,所以参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多,所以选项A 错误;对于选项B :参与调查的女生中喜欢攀岩的人数占30%,不喜欢攀岩的人数占70%,所以参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数少,所以选项B 错误;对于选项C :若参与调查的男、女生人数均为100人,根据图表,列出2×2列联表如下:所以()2220080702030500050.505 6.6351109010010099K ⨯⨯-⨯==≈>⨯⨯⨯, 所以在犯错误的概率不超过0.01的前提下认为喜欢攀岩和性别有关,C 正确;对于选项D :如果不确定参与调查的男、女生人数,无法计算2K ,D 错误.故选:C .6.(2022·山东聊城·一模)根据分类变量x 与y 的成对样本数据,计算得到2 6.147χ=.依据0.01α=的独立性检验()0.01 6.635x =,结论为( )A .变量x 与y 不独立B .变量x 与y 不独立,这个结论犯错误的概率不超过0.01C .变量x 与y 独立D .变量x 与y 独立,这个结论犯错误的概率不超过0.01【答案】C【详解】按照独立性检验的知识及比对的参数值,当2 6.147χ=,我们可以下结论变量x 与y 独立.故排除选项A,B;依据0.01α=的独立性检验()0.01 6.635x =,6.147<6.635,所以我们不能得到“变量x 与y 独立,这个结论犯错误的概率不超过0.01”这个结论.故C 正确,D 错误.故选:C7.(2022·天津·模拟预测)下列说法错误的是( )A .线性相关系数0r >时,两变量正相关 B .两个随机变量的线性相关性越强,则相关系数r 的值就越接近于1C .在回归直线方程ˆ0.20.8yx =+中,当解释变量x 每增加1个单位时,预报变量ˆy 平增加0.2个单位 D .对分类变量X 与Y ,随机变量2χ的观测值越大,则判断“X 与Y 有关系”的把握程度越大【答案】B【详解】A :线性相关系数0r >时,变量为正相关,正确;B :两个随机变量的线性相关性越强,则相关系数||r 的值就越接近于1,错误;C :在回归直线方程ˆ0.20.8yx =+中,当1x ∆=时,ˆ0.2y ∆=,正确; D :对分类变量X 与Y ,随机变量2χ的观测值越大,变量间的关系把握程度越大,正确.故选:B8.(2020·河南·模拟预测(文))2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( )附:()()()()()2n ad bc a b c d a c b d -++++,其中n a b c d =+++.A .130B .190C .240D .250【答案】B 【解析】【分析】设男、女学生的人数都为5x ,则男、女学生的总人数为10x ,建立22⨯列联表,由独立性检验算出2K ,结合观测值和选项可得答案.【详解】依题意,设男、女学生的人数都为5x ,则男、女学生的总人数为10x ,建立22⨯列联表如下,故()2222108310553721⋅-==⋅⋅⋅x x x x K x x x x ,由题意可得106.63510.82821x <<, 所以139.33510227.388x <<,结合选项可知,只有B 符合题意.故选:B.二、多选题9.(2021·福建福州·一模)“一粥一饭,当思来之不易”,道理虽简单,但每年我国还是有2000多亿元的餐桌浪费,被倒掉的食物相当于2亿多人一年的口粮.为营造“节约光荣,浪费可耻”的氛围,某市发起了“光盘行动”.某机构为调研民众对“光盘行动”的认可情况,在某大型餐厅中随机调查了90位来店就餐的客人,制成如下所示的列联表,通过计算得到K 2的观测值为已知()2 6.6350.010P K =,()210.8280.001P K =,则下列判断正确的是( )A .在该餐厅用餐的客人中大约有66.7%的客人认可“光盘行动”B .在该餐厅用餐的客人中大约有99%的客人认可“光盘行动”C .有99%的把握认为“光盘行动”的认可情况与年龄有关D .在犯错误的概率不超过0.001的前提下,认为“光盘行动”的认可情况与年龄有关【答案】AC【详解】∵K 2的观测值为9,且P (K 2≥6.635)=0.010,P (K 2≥10.828)=0.001,又∵9>6.635,但9<10.828,∴有99%的把握认为“光盘行动”的认可情况与年龄有关,或者说,在犯错误的概率不超过0.010的前提下,认为“光盘行动”的认可情况与年龄有关,所以选项C 正确,选项D 错误,由表可知认可“光盘行动”的人数为60人,所以在该餐厅用餐的客人中认可“光盘行动”的比例为6010090⨯%≈66.7%, 故选项A 正确,选项B 错误.故选:AC.10.(2022·湖南岳阳·三模)下列说法正确的是( )A .线性回归方程y bx a =+必过(,)x yB .设具有线性相关关系的两个变量x ,y 的相关系数为r ,则r 越接近于0,x 和y 之间的线性相关程度越强C .在一个22⨯列联表中,由计算得2K 的值,则2K 的值越小,判断两个变量有关的把握越大D .若()2~1,X N σ,()20.2P X >=,则()010.3P X <<= 【答案】AD【详解】因为线性回归方程y bx a =+必过样本中心点(,)x y ,所以选项A 正确; 因为r 越接近于0,x 和y 之间的线性相关程度越弱,所以选项B 不正确;因为2K 的值越小,确定两个变量有关的把握的程度越小,所以选项C 不正确;因为()2~1,X N σ,所以()()()1011220.32P X P X P X <<=<<=->=,因此选项D 正确,故选:AD 三、填空题11.(2020·宁夏·固原一中模拟预测(文))在独立性检验中,统计量K 2有两个临界值:3.841和6.635.当K 2>3.841时,有95%的把握说明两个事件有关,当K 2>6.635时,有99%的把握说明两个事件有关,当K 2≤3.841时,认为两个事件无关.在一项打鼾与患心脏病的调查中,共调查了2000人,经计算K 2=20.87.根据这一数据分析,我们有理由认为打鼾与患心脏病之间是________的(有关、无关).【答案】有关【详解】K 2=20.87>6.635时,有99%的把握说明打鼾与患心脏病有关.故答案为:有关12.(2022·全国·模拟预测)某大学为了解喜欢看篮球赛是否与性别有关,随机调查了部分学生,在被调查的学生中,男生人数是女生人数的2倍,男生喜欢看篮球赛的人数占男生人数的56,女生喜欢看篮球赛的人数占女生人数的13.若被调查的男生人数为n ,且有95%的把握认为喜欢看篮球赛与性别有关,则n 的最小值为______.【答案】12【详解】由题意得到如下列联表:所以2235263663822n n n n n n n n n n χ⎛⎫⋅-⋅⎪ ⎭⎝==⋅⋅⋅. 因为有95%的把握认为喜欢看篮球赛与性别有关,所以2 3.841χ≥,即3 3.8418n ≥, 3.841810.243n ⨯≥≈. 又2n ,3n ,6n 为整数,所以n 的最小值为12.故答案为:12 13.(2020·山西·大同一中模拟预测(理))某班主任对全班30名男生进行了作业量多少的调查,数据如下表:该班主任据此推断男生认为作业多与喜欢玩电脑游戏有关系,则这种推断犯错误的概率不超过________. 附表及公式:参考公式:K 2=2()()()()()n ad bc a b c d a c b d -++++. 【答案】0.05【详解】计算得K 2的观测值k =230(12828)14162010⨯⨯-⨯⨯⨯⨯≈4.286>3.841,则推断犯错误的概率不超过0.05.故答案为:0.05.14.(2022·辽宁葫芦岛·二模(理))下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<”③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表: 【答案】①④详解:线性回归方程ˆˆˆybx a =+必过样本中心点(),x y ,故①正确. 命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃≥+<” 故②错误③相关系数r 绝对值越小,表明两个变量相关性越弱,故不正确;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系,正确.故答案为①④.四、解答题15.(2022·全国·高考真题(文))甲、乙两城之间的长途客车均由A 和B 两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,()2P K k0.100 0.050 0.010k 2.706 3.841 6.635【解析】(1)根据表中数据,A共有班次260次,准点班次有240次,设A家公司长途客车准点事件为M,则24012 ()26013==P M;B共有班次240次,准点班次有210次,设B家公司长途客车准点事件为N,则210()27840==P N.A家公司长途客车准点的概率为12 13;B家公司长途客车准点的概率为7 8 .(2)列联表22()()()()()n ad bc K a b c d a c b d -=++++=2500(2403021020) 3.205 2.70626024045050⨯⨯-⨯≈>⨯⨯⨯, 根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关. 16.(2020·全国·高考真题(文))某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,【详解】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为216250.43100++=,等级为2的概率为510120.27100++=,等级为3的概率为6780.21100++=,等级为4的概率为7200.09100++=;(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100203003550045350100⨯+⨯+⨯=(3)22⨯列联表如下:()221003383722 5.820 3.84155457030K ⨯⨯-⨯=≈>⨯⨯⨯, 因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.。
伍德里奇《计量经济学导论》(第4版)笔记和课后习题详解-第1~4章【圣才出品】

Байду номын сангаас
2.假设让你进行一项研究,以确定较小的班级规模是否会提高四年级学生的成绩。
4 / 119
圣才电子书 十万种考研考证电子书、题库视频学习平台
(i)如果你能设定你想做的任何实验,你想做些什么?请具体说明。 (ii)更现实地,假设你能搜集到某个州几千名四年级学生的观测数据。你能得到他们 四年级班级规模和四年级末的标准化考试分数。你为什么预计班级规模与考试成绩存在负相 关关系? (iii)负相关关系一定意味着较小的班级规模会导致更好的成绩吗?请解释。 答:(i)假定能够随机的分配学生们去不同规模的班级,也就是说,在不考虑学生诸如 能力和家庭背景等特征的前提下,每个学生被随机的分配到不同的班级。因此可以看到班级 规模(在伦理考量和资源约束条件下的主体)的显著差异。 (ii)负相关关系意味着更大的班级规模与更差的考试成绩是有直接联系的,因此可以 发现班级规模越大,导致考试成绩越差。 通过数据可知,两者之间的负相关关系还有其他的原因。例如,富裕家庭的孩子在学校 可能更多的加入小班,而且他们的成绩优于平均水平。 另外一个可能性是:学校的原则是将成绩较好的学生分配到小班。或者部分父母可能坚 持让自己的孩子进入更小的班级,而同样这些父母也更多的参与子女的教育。 (iii)鉴于潜在的其他混杂因素(如 ii 所列举),负相关关系并不一定意味着较小的班 级规模会导致更好的成绩。控制混杂因素的方法是必要的,而这正是多重回归分析的主题。
如何做不同机台间的数据比对

我们在做不同机台间的数据比对时,需要有一个前期准备工作。
其准备工作的意义就是要定义好比对数据的有效性和准确性。
1. 比对前的准备工作。
1.1 比对范围的确定。
1.1.1 确定产品的实际范围。
1.1.2 在实际产品范围内取数个样品。
样品间的差异,需要大于机台测量分辨率1到两
个数量级。
1.1.3 特别做出两个样品,一个小于下限,一个大于上线。
1.1.4 测量样品并记录数据。
1.2
1.2.1 将样品数据输入到类似于下表中的表格中。
1.2.2 调整数据范围。
要求R²值很接近1。
1.2.3 从前到尾,依次取数据。
每个数据区域就是一个比对区间。
1.2.4 在每个比对区间中间,取3~5个样品。
2. 区域比对系数设定。
2.1 测量此区域内的所有样品。
2.2 将测量数据输入类似于下表中的表格中。
2.3 上图中的“0.9988”和“+0.9888”即为调整系数。
其中“0.9988”为“C”值,“+0.9888”
为“D”值。
3. 一次对所有区域进行2中的设定,并建立不同的比对系数。
4. 完成数据比对并归档。
阿里巴巴网站名词解释

*名词解释询盘(反馈):买家针对您的产品信息和公司信息发送的有效询盘,即不包含系统垃圾询盘。
曝光:您的产品信息或公司信息在搜索结果列表页或类目浏览列表等页面被买家看到的次数。
买家通过其他外部搜索或者收藏等渠道直接找到您的旺铺后浏览公司信息或产品信息,这部分行为不纳入曝光的统计,只统计访客数。
点击:您的产品信息或公司信息在搜索结果列表页或按照类目浏览列表等页面被买家点击的次数。
买家通过其他外部搜索或者收藏等渠道直接找到您的旺铺后点击公司信息或产品信息,这部分行为不纳入点击的统计,只统计访客数。
点击率:点击率=点击量/ 曝光量访客:访问了您的产品页面、公司页面的的买家,或者通过其他页面给您发送询盘或ATM联系的买家。
及时回复率:30天内询盘及时回复+TradeManager及时回复的整体比例,体现卖家的服务态度与意愿。
同行平均:同行所获得的效果总和/同行数。
行业选择中“ALL”下的同行是指与您拥有相同主营行业的付费供应商,其中主营行业是您在线产品数最多的二级行业。
(信保指标中的同行是指与您主营行业相同,并且已开通信保服务的供应商)同行TOP10平均:同行效果前10名付费供应商所获得的效果总和/10。
外贸直通车的行业平均点击率:在相应的时间段内,指定的二级行业下,该行业外贸直通车总点击/该行业外贸直通车总曝光。
外贸直通车曝光:在相应的时间段内,由外贸直通车推广带来的全部曝光量。
外贸直通车点击:在相应的时间段内,由外贸直通车推广带来的全部点击量。
累计信保提交订单数:截止统计周期末,卖家成功提交的信保订单数。
历史累计已付款信保订单数:截止统计周期末,买家完成确认并付款的信保订单数。
有效果产品:在统计周期内,曝光、点击、访客、询盘任意一项大于零的产品。
零效果产品:在统计周期内,曝光、点击、访客、询盘均为零的产品。
*常见问题1、什么是询盘(反馈)?买家针对您的产品信息和公司信息发送的有效询盘。
如买家搜索后,对您的产品或公司发送的有效询盘;或者买家收藏了您的全球旺铺/企业网站,或者通过其他外部搜索等渠道找到您的公司或产品,直接发送的有效询盘(这部分行为不纳入曝光、点击的统计)。
工作总结数据比对

工作总结数据比对
在工作中,数据比对是一个非常重要的环节。
通过比对数据,我们可以清晰地
了解工作的进展和成果,及时发现问题和改进方向。
在工作总结中,数据比对更是必不可少的一环。
本文将从数据比对的重要性、比对方法和应用实例三个方面来探讨工作总结中的数据比对。
首先,数据比对在工作总结中的重要性不言而喻。
只有通过对数据的比对分析,我们才能真正客观地了解工作的情况。
比对数据可以帮助我们发现工作中存在的问题和瓶颈,及时调整工作方向和策略。
同时,比对数据还可以帮助我们评估工作的效果和成果,为下一步的工作提供有力的支持和指导。
其次,数据比对的方法有很多种,常见的包括手工比对和利用专业的数据比对
工具。
手工比对需要耗费大量的时间和精力,而且容易出现错误。
而利用专业的数据比对工具,可以大大提高比对的效率和准确性。
在工作总结中,我们可以根据具体的情况选择合适的比对方法,以确保数据比对的准确性和可靠性。
最后,我们来看一个实际的应用实例。
某公司在进行年度工作总结时,通过对
销售数据的比对分析,发现了产品销售量下降的问题。
经过进一步的调研和分析,他们发现是由于市场竞争加剧和产品质量下降所致。
在总结报告中,他们提出了相应的改进方案,并在下一年的销售数据中取得了明显的改善。
综上所述,数据比对在工作总结中扮演着非常重要的角色。
通过比对数据,我
们可以客观地了解工作的情况,及时发现问题和改进方向。
因此,在进行工作总结时,我们应该重视数据比对这一环节,以确保工作总结的准确性和可靠性。