最新管理统计课后重点习题
《管理统计学》习题参考答案

《管理统计学》作业参考答案统计推断(P147—148)5.解:设7.6:7.6:10>↔≤μμH H11.3200/5.27.625.7/0=-=-=nS x U μ当α=0.01时,33.201.0=>u U ,所以拒绝原假设,即当α=0.01时,现今每个家庭每天看电视的平均时间较10年前显著增大。
6.解:设211210::μμμμ>↔≤H H233.250140165.278224823801121=+-=+-=n n S y x t T当α=0.05时,)88(05.0t t >,拒绝0H ,故在置信水平为95%时可以认为第一分店的营业额高于第二分店的营业额。
当α=0.01时,)88(05.0t t <,接受0H ,故在置信水平为99%时还没有充分的把握说明第一分店的营业额高于第二分店的营业额。
9.解:这是一个成对比较问题设0:0:10>↔≤d d H H μμ且3486.0,375.0==d d s x ,()83311.19t 0.05=402.310/3486.0375.0/*===dd d n S x t当α=0.05时,)9(05.0*t t >,拒绝原假设,即显著性水平为5%时可以判断人的情感更显著地表现在左脸上。
非参数检验1.(P 168)解:设:0H 消费额与分店位置无关,:1H 消费额与分店位置有关根据题意可以计算理论频数得列联表如下:由于()()84146.3)1(,111,2,2205.0==--==χb a b a ,而接受0H ,即有95%的把握说明消费额与分店位置无关。
84146.3)1(07788.2)(205.022=<=-=∑χχEE O回归分析和相关分析(P136)1.解:图中数据如下:x y nx bnyx b y a S S b y x n y x y y x x S y n y y y S x n x x x S n y x y x y xiixxxy ii i i i n i i xy i i ni i yy i i ni i xx i i i i i i0535.49491.243因此9491.243103270535.4103765,0535.41.4505.1824故5.182437653271011249401))((5.900237651011426525)(1)(1.45032710111143)(1)(10,1426525,11143,124940,3765,327122*********2+==⨯-=-=-=====⨯⨯-=-=--==⨯-=-=-==⨯-=-=-=======∧∧∧∧∧===∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑直线回归方程为:(1)相关系数906375.05.90021.4505.1824 =⨯==yyxx xy S S S r(2)当广告费为30万元时,该周销售额的区间估计为:()()()()()()0817.400,0265.3311.4507.32301011306.21722.14300535.49491.243)(11)2(1722.148/81.1606210/7.32,81.16065.9002906375.011,306.22102202/0222/05.0=-++⨯⨯±⨯+=⎪⎪⎭⎫ ⎝⎛-++-±+∈==-===⨯-=-==-∧∧xx yy S x x n n st x b a y RSS s x S r RSS t α(3)当广告费为42万时周平均销售额的95%置信区间为:()()8607.431,5315.3961.4507.3242101306.21722.14420535.49491.243)(1)2(2202/0=-+⨯⨯±⨯+= ⎝⎛⎪⎪⎭⎫-+-±+∈+∧∧xx S x x n n st x b a bx a α时间序列(P219)解:题中数据可整理如下:(1)、因此有:ty n t b n y t b y a t t n y t ty n S Sb n t ty y t tttttty tt835.0595.94趋势故595.9414105835.0141412835.01102510151414121051078014)(14,1015,10780,1412,105222+==⨯-=-=-==-⨯⨯-⨯=--=======∧∧∧∧∧∑∑∑∑∑∑∑∑∑∑∑方程为:直线(2)、对于加法模型,有S=y-T ,根据实际数据和直线趋势方程,得下表:把同一季节的因子作一平均,得季度平均值,如下表所示:因5.310+(-6.025)+(-9.440)+10.392=0.237,故修正因子05925.04237.0==L ,每个季节因子减去L 得修正后季节因子为:5.251,-6.084,-9.499,10.333。
管理统计学课后习题答案

管理统计学课后习题答案第一章:统计学基础1. 描述统计与推断统计的区别是什么?- 描述统计关注的是对数据集的描述和总结,如均值、中位数、众数、方差等;而推断统计则使用样本数据来推断总体特征,包括参数估计和假设检验。
2. 什么是正态分布?- 正态分布是一种连续概率分布,其形状呈钟形曲线,具有对称性,其数学表达式为 \( N(\mu, \sigma^2) \),其中 \( \mu \) 为均值,\( \sigma^2 \) 为方差。
第二章:数据收集与处理1. 抽样误差和非抽样误差的区别是什么?- 抽样误差是由于样本不能完全代表总体而产生的误差;非抽样误差则来源于数据收集和处理过程中的其他问题,如测量误差、数据录入错误等。
2. 描述数据清洗的步骤。
- 数据清洗通常包括:识别和处理缺失值、异常值检测与处理、数据标准化和归一化、数据整合等步骤。
第三章:描述性统计分析1. 计算给定数据集的均值和标准差。
- 均值是数据集中所有数值的总和除以数据点的数量。
标准差是衡量数据点偏离均值的程度,计算公式为 \( \sigma =\sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2} \)。
2. 解释箱型图(Boxplot)的作用。
- 箱型图是一种图形表示方法,用于展示数据的分布情况,包括中位数、四分位数、异常值等,有助于快速识别数据的集中趋势和离散程度。
第四章:概率分布1. 什么是二项分布?- 二项分布是一种离散概率分布,用于描述在固定次数 \( n \) 的独立实验中,每次实验成功的概率为 \( p \) 时,成功次数的概率分布。
2. 正态分布的数学性质有哪些?- 正态分布具有许多重要性质,如对称性、均值等于中位数、68-95-99.7规则等。
第五章:参数估计1. 解释点估计和区间估计的区别。
- 点估计是用样本统计量来估计总体参数的单个值;区间估计是在一定置信水平下,给出总体参数可能落在的区间范围。
管理统计学必做答案

1.某班学生数学考试成绩分别为65分、71分、80分和87分,那末,这四个数字是:A 指标;B 标志;C 变量;D 标志值2.在方差分析中,反映样本数据与其组平均值差异的是:A 总体离差平方和;B 组间误差;C 抽样误差;D 组内误差3.某产品规定的标准寿命为1300小时,甲厂称其产品超过此规定。
随机选取甲厂100件产品,测得均值为1345小时,已知标准差为300小时,计算得到样本均值大于等于1345的概率是0.067,则在:μ=1300,:μ>1300的情况下,下列各式中成立的是:A 若=0.05,则接受;B 若=0.05,则接受;C 若=0.10,则接受;D 若=0.10,则拒绝4.抽样允许误差越大,抽样估计的精确度就:A 越高;B 越低;C 无法确定;D 两者之间没有关系5.用于描述样本特征的概括性数字称为:A 参数;B 统计量;C 变量;D 变量值6.在组距式数列中,对组限值的处理原则是:A 上组限不在内,下组限在内;B 下组限不在内,上组限在内;C 上下组限均不在内;D 上下组限均在内7.在方差分析中,若不同水平对结果没有影响,则:A 组间方差接近于组内方差;B 组间方差大于组内方差;C 组间方差小于组内方差; D 不具有可比性8.以下属于数量综合指数的是:A 产量综合指数;B 价格综合指数;C 销售额综合指数;D 成本综合9.编制数量指标综合指数所采用的同度量因素是:A 质量指标;B 数量指标;C 综合指标;D 相对指标10.某商场2009年空调销售量为6500台,库存年末比年初减少100台,这两个总量指标:A 时期指标;B 时点指标;C 前者是时期指标,后者是时点指标;11.在组距式数列中,用组中值来代表组内的一般水平的假定条件:A 各个组的次数相等;B 各个组的组距相等;C 组内变量值相等;D 组内变量值呈均匀分布12.以下属于定距尺度的数据资料是:A 温度;B 受教育年限;C 职业技能等级;D ISBN号(书号)13.一个管理统计总体:A 只能有一个标志;B 只能有一个指标;C 可以有多个标志;D 可以有多个指标14.统计总体的基本特征是:A 同质性,数量性,变异性;B 大量性,变异性,同质性;C 数量性,具体性,综合性;D 总体性,社会性,大量性15.定基发展速度与环比发展速度之间的关系表现为定基发展速度等于相应各环比发展速度:A 的连乘积;B 的连乘积再减去100%;C 之和;D 之和再减去100%16.某商品价格发生变化,现在的100元只值原来的90元,则价格指数为:A 10%;B 90%;C 110%;D 111%17.抽样分布是指:A 一个样本各观察值的分布;B 总体中各观察值的分布;C 样本统计量的分布;D 样本数量的分布18.对50名职工的工资收入情况进行调查,则总体单位是:A 50名职工;B 50名职工的工资总额;C 每一名职工;D 每一名职工的工资19.平均差(A.D)的取值范围是:A A.D=0;B A.D<=0;C A.D>=0;D 0<=A.D<=120.某市工业总产值增长了10%,同期价格水平提高了3%,则该市工业生产指数为:A 107%;B 13%;C 106.8%;D 10%21.自变量为X的一元回归直线方程中,X的系数的取值:A 只能取正值;B 只能取负值;C 既可能取正值,也可能取负值;D 只能是022.在以下几个指标中,最不受极端值影响的平均数是:A 众数;B 均值;C 中位数;D 标准差23.某连续变量数列,其末组为500以上。
《管理统计学》习题及标准答案

《管理统计学》作业集习题集及答案第一章导论*1-1 对50名职工的工资收入情况进行调查,则总体单位是(单选)( 3 )(1)50名职工(2)50名职工的工资总额(3)每一名职工(4)每一名职工的工资*1-2 一个统计总体(单选)( 4 )(1)只能有一个标志(2)只能有一个指标(3)可以有多个标志(4)可以有多个指标*1-3 某班学生数学考试成绩分别为65分、71分、80分和87分,这四个数字是(单选)( 4 ) (1)指标(2)标志(3)变量(4)标志值第二章统计数据的调查与收集*2-1 非全面调查包括(多项选择题)(12 4 )(1)重点调查(2)抽样调查(3)快速普查(4)典型调查(5)统计年报*2-2 统计调查按搜集资料的方法不同,可以分为(多项选择题)( 12 3 ) (1)采访法(2)抽样调查法(3)直接观察法(4)典型调查法(5)报告法*2-3 某市进行工业企业生产设备状况普查,要求在7月1日至7月5日全部调查完毕。
则规定的这一时间是(单项选择题)(2)(1) 调查时间(2) 调查期限(3) 标准时间(4) 登记期限*2-4 某城市拟对占全市储蓄额五分之四的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是(单项选择题)(4)(1) 普查(2) 典型调查(3) 抽样调查(4) 重点调查*2-5 下列判断中,不正确的有(多项选择题)(23 4 )(1)重点调查是一种非全面调查,既可用于经常性调查,也可用于一次性调查;(2)抽样调查是非全面调查中最科学的方法,因此它适用于完成任何调查任务;(3)在非全面调查中,抽样调查最重要,重点调查次之,典型调查最不重要;(4)如果典型调查的目的是为了近似地估计总体的数值,则可以选择若干中等的典型单位进行调查;(5)普查是取得全面统计资料的主要调查方法。
*2-6 下列属于品质标志的是(单项选择题)( 2 )(1)工人年龄(2)工人性别(3)工人体重(4)工人工资*2-7 下列标志中,属于数量标志的有(多项选择题)(3)(1)性别(2)工种(3)工资(4)民族(5)年龄*2-8 下列指标中属于质量指标的有(多项选择题)(13 4 )(1)劳动生产率(2)废品量(3)单位产品成本(1)资金利润率(5)上缴税利额第三章统计数据的整理*3-1 区分下列几组基本概念:(1)频数和频率;答:A、频数:在一组依大小顺序排列的测量值中,当按一定的组距将其分组时出现在各组内的测量值的数目。
《管理统计学》习题参考答案

《管理统计学》作业参考答案统计推断(P147—148)5.解:设7.6:7.6:10>↔≤μμH H 11.3200/5.27.625.7/0=-=-=nS x U μ当α=0.01时,,所以拒绝原假设,即当α=0.01时,现今每个家33.201.0=>u U 庭每天看电视的平均时间较10年前显著增大。
6.解:设211210::μμμμ>↔≤H H 233.250140165.278224823801121=+-=+-=n n S yx t T当α=0.05时,,拒绝,故在置信水平为95%时可以认为第一分)88(05.0t t >0H 店的营业额高于第二分店的营业额。
当α=0.01时,,接受,故在置信水平为99%时还没有充分的把)88(05.0t t <0H 握说明第一分店的营业额高于第二分店的营业额。
9.解:这是一个成对比较问题设且,0:0:10>↔≤d d H H μμ3486.0,375.0==d d s x ()83311.19t 0.05=402.310/3486.0375.0/*===dd dn S x t 当α=0.05时,,拒绝原假设,即显著性水平为5%时可以判断人的)9(05.0*t t >情感更显著地表现在左脸上。
非参数检验1.(P 168)解:设消费额与分店位置无关,:0H 消费额与分店位置有关:1H 根据题意可以计算理论频数得列联表如下:由于,而()()84146.3)1(,111,2,2205.0==--==χb a b a 接受,即有95%的把握说明消费额与分店位置无关。
0H 84146.3)1(07788.2)(205.022=<=-=∑χχEE O回归分析和相关分析(P136)1.解:图中数据如下:xy nx bnyx b y a S S b y x n y x y y x x S y n y y y S x n x x x S n y x y x y xiixxxyii i i i n i i xy i i n i i yy i i n i i xx i i i i i i0535.49491.243势势9491.243103270535.4103765,0535.41.4505.1824势5.182437653271011249401))((5.900237651011426525)(1)(1.45032710111143)(1)(10,1426525,11143,124940,3765,3271222212222122+==⨯-=-=-=====⨯⨯-=-=--==⨯-=-=-==⨯-=-=-=======∧∧∧∧∧===∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑直线回归方程为:(1)相关系数906375.05.90021.4505.1824 =⨯==yyxx xyS S S r (2)当广告费为30万元时,该周销售额的区间估计为:()()()()()()0817.400,0265.3311.4507.32301011306.21722.14300535.49491.243)(11)2(1722.148/81.1606210/7.32,81.16065.9002906375.011,306.22102202/0222/05.0=-++⨯⨯±⨯+=⎪⎪⎭⎫ ⎝⎛-++-±+∈==-===⨯-=-==-∧∧xx yy S x x n n st x b a y RSS s x S r RSS t α(3)当广告费为42万时周平均销售额的95%置信区间为:()()8607.431,5315.3961.4507.3242101306.21722.14420535.49491.243)(1)2(2202/0=-+⨯⨯±⨯+= ⎝⎛⎪⎪⎭⎫-+-±+∈+∧∧xx S x x n n st x b a bx a α时间序列(P219)解:题中数据可整理如下:(1)、因此有:ty nt b ny t b y a t t n y t ty n S Sb n t ty y t tt t tttytt835.0595.94势势势595.9414105835.0141412835.01102510151414121051078014)(14,1015,10780,1412,105222+==⨯-=-=-==-⨯⨯-⨯=--=======∧∧∧∧∧∑∑∑∑∑∑∑∑∑∑∑方程为:直线(2)、对于加法模型,有S=y-T ,根据实际数据和直线趋势方程,得下表:把同一季节的因子作一平均,得季度平均值,如下表所示:因5.310+(-6.025)+(-9.440)+10.392=0.237,故修正因子,每05925.04237.0==L 个季节因子减去L 得修正后季节因子为:5.251,-6.084,-9.499,10.333。
《管理统计学》习题及答案

《管理统计学》作业集习题集及答案第一章导论*1-1 对50名职工的工资收入情况进行调查,则总体单位是(单选)( 3 )(1)50名职工(2)50名职工的工资总额(3)每一名职工(4)每一名职工的工资*1-2 一个统计总体(单选)( 4 )(1)只能有一个标志(2)只能有一个指标(3)可以有多个标志(4)可以有多个指标*1-3 某班学生数学考试成绩分别为65分、71分、80分和87分,这四个数字是(单选)( 4 ) (1)指标(2)标志(3)变量(4)标志值第二章统计数据的调查与收集*2-1 非全面调查包括(多项选择题)(12 4 )(1)重点调查(2)抽样调查(3)快速普查(4)典型调查(5)统计年报*2-2 统计调查按搜集资料的方法不同,可以分为(多项选择题)( 12 3 ) (1)采访法(2)抽样调查法(3)直接观察法(4)典型调查法(5)报告法*2-3 某市进行工业企业生产设备状况普查,要求在7月1日至7月5日全部调查完毕。
则规定的这一时间是(单项选择题)(2)(1) 调查时间(2) 调查期限(3) 标准时间(4) 登记期限*2-4 某城市拟对占全市储蓄额五分之四的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是(单项选择题)(4)(1) 普查(2) 典型调查(3) 抽样调查(4) 重点调查*2-5 下列判断中,不正确的有(多项选择题)(23 4 )(1)重点调查是一种非全面调查,既可用于经常性调查,也可用于一次性调查;(2)抽样调查是非全面调查中最科学的方法,因此它适用于完成任何调查任务;(3)在非全面调查中,抽样调查最重要,重点调查次之,典型调查最不重要;(4)如果典型调查的目的是为了近似地估计总体的数值,则可以选择若干中等的典型单位进行调查;(5)普查是取得全面统计资料的主要调查方法。
*2-6 下列属于品质标志的是(单项选择题)( 2 )(1)工人年龄(2)工人性别(3)工人体重(4)工人工资*2-7 下列标志中,属于数量标志的有(多项选择题)(3)(1)性别(2)工种(3)工资(4)民族(5)年龄*2-8 下列指标中属于质量指标的有(多项选择题)(13 4 )(1)劳动生产率(2)废品量(3)单位产品成本(1)资金利润率(5)上缴税利额第三章统计数据的整理*3-1 区分下列几组基本概念:(1)频数和频率;答:A、频数:在一组依大小顺序排列的测量值中,当按一定的组距将其分组时出现在各组内的测量值的数目。
天津大学版管理统计学答案

天津⼤学版管理统计学答案管理统计学课后习题答案第⼀章题⽬1a调查规模为2500b定性c百分⽐d700题⽬2a定性b42.25%题⽬3a定量b定性c定性d定量题⽬4a定量b定量c定性d定量e定性题⽬5a40.00%b定性c略第⼆章题⽬1题⽬2ab33.00%c题⽬3abc上述数据显⽰了⼤多数⼈每周使⽤3-5.9⼩时计算机第三章题⽬1a平均数=38.75b Q1=29.5Q3=47.5题⽬2a国内平均数115.13中位数111.56国外平均数36.62083中位数36.695b国内全距86.24样本标准差26.81995变异系数0.232954国外全距42.96样本标准差11.398830.311266题⽬3题⽬4数据182168184190 a全距22b⽅差75.2c标准差8.671793355d变异系数0.04871794题⽬5标准差0.0126192〉0.005⽣产线要关闭题⽬6通话时间组中值频数组内和平⽅和4~7 5.5422184.968~119.5547.539.212~1513.5794.510.0816~1917.523554.0820~2321.5121.584.6424~2725.5125.5174.24合计20246547.2平均数12.3⽅差28.8标准差5.366563146第四章题⽬1a bc查表得78.12题⽬2a b c 题⽬3a 22.8b 7.757433711题⽬4a 200b 5c N(200,25)d中⼼极限定理题⽬5aN(250,50)b c 题⽬5a N(320,187.5)b 13.69306394c d第五章题⽬1=80S=10n=20总体⽅差未知,n=20<30,因此⽤t分布估计。
在90%置信度下,总体均值的置信区间为= 1.7291置信区间为[76.1336148683.86639]在95%置信度下,总体均值的置信区间为= 2.0933置信区间为[75.319238984.68076]题⽬2= 6.525S=0.5437443)20(t 05.0)19(t 025.0= 2.0933置信区间为[ 6.27048627 6.779514]题⽬3=22.4S=5n=61>30a= 1.96(正态分布表中查0.975所对应置信区间为[21.1452385823.65476]b=2置信区间为[21.119631223.68037]题⽬4=2000=0.05=an=61.4656取62bn=384.16取385cn=1536.64取1537题⽬5= 6.25=0.05=a n= 6.0025取7bn=150.0625取151题⽬6a=0.885714286b0.023569472c =1.645)60(t 025.0)19(t 025.0025.0µσα025.0µσα025.0µp =?05.0µ置信区间为[0.8659327650.905495807]题⽬7a 0.02=0.05n=2016.84取2017b =0.237977194c 单个总体⽐率的区间估计95%的置信区间为带⼊数据得[0.2193925270.256562]第六章题⽬1n=200S=1.5= 1.28:3:34.714045208> 1.28因此拒绝,收看电视的时间显著增加题⽬2a 拒绝规则为U<=b n=40S=1.2= 1.645:3:3-5.270462767<-1.645因此拒绝,减肥效果未达宣传值c p= 6.80401E-08近似为0题⽬3 n=45S=0.2:3=?αp01.0µ0H 1H >µ≤µ0H αµ-0H ≥µ<µ05.0µ0H 0H =µ≠µ:3==6.372793736> 1.28因此拒绝,该⼯序未达到标准题⽬4n=500S=0.2=-1.28:0.15:0.151.628183>因此接受,可实⾏新包装题⽬5an=30=2<24.24779435时拒绝原假设b=[ 3.417225575]=0.99968370.000316c =1H ≠µ01.0µ0H 0H 1H ≥p01.0µ-0H =0µσβΦ=ββ[0.678612788]=0.75130840.248692d=[-0.690693606]=0.24487910.755121题⽬6 n=30=0.8a 意味着冲⼊量未达标准但错认为达标从⽽b =得到〉[-5.383266[-1.463266Φ=ββΦ=β=0µσ2/αµΦΦ=β0.071697题⽬7=59令=<得到查表得= 1.285得到n=214.6225取215或由公式计算题⽬8=30385=0.02=0.11.285或由公式题⽬9=324=0.02=1-0.8==β=1µσ=-=-05.0µµα=βα=1µσβ=0µ=αµα=1µσβ=0µ=αµ=βµ2.0550.845或由公式75.69题⽬10设:看前、看后总体均值分别为因总体⽅差未知且是否相同未知,因此⾸先假设两总体⽅差是否相同::当显著性⽔平为0.1F= 1.484196880H 21µµ≥21,µµ=1S =2S 0H 1H 21σσ=21σσ≠⽅差分别为0.201739801n1=0.086756364n2=::当显著性⽔平为0.05时F= 5.407300359设湿路⼲路⽅差分别为32n1=16n2=a::当显著性⽔平为0.05时F=4〉F(29,29)=1.86b湿路不易刹车,应减速慢⾏题⽬13设两个⽣产部⽅差为 2.35.4:当显著性⽔平为0.1时21S ,S =1S =2S 0H 1H 21σσ=21σσ≠21S S >21S ,S =1S =2S 0H 1H 21σσ≤21σσ>2212S ,S =12S =22S 0H 1H 21σσ=21σσ≠F=0.425925926<所以拒绝原假设,认为两个⽣产部门产品有差异题⽬14国内航班⼀等舱⽐例pa1=0.045171国际航班⼀等舱⽐例pa2=0.079137⼀等舱总⽐例pa=0.055435H0:pa1=pa2 2.0674021拒绝H0,⼀等舱旅⾏⽐例与航班类型有关国内航班商务舱⽐例pb1=0.147975国际航班商务舱⽐例pb2=0.435252商务舱总⽐例pb=0.234783H0:pa1=pa29.4399796拒绝H0,商务舱旅⾏⽐例与航班类型有关国内航班经济舱⽐例pc1=0.806854国际航班经济舱⽐例pc2=0.485612经济舱总⽐例pc=0.709783025.02/µµα=025.02/µµα=025.02/µµα=H0:pc1=pc29.8583452拒绝H0,经济舱旅⾏⽐例与航班类型有关综上,机票类型与航班类型有关。
管理统计学课后习题

1、理解随机实验、样本空间和随机变量的基本概念。
随机实验:在同一条件下可无限次重复的实验,实验结果有多个且不确定,事前不知实验结果的实验。
样本空间:所有基本事件所组成的集合,称为样本空间或基本空间。
随机变量:随机变量是表征一个随机实验的实验结果的变量,其数值是由一次随机实验的结果所决定的,但实验之前是不确知的。
1、随机变量X有下面的概率分布。
X 1 2 3 4 5P(X) 0.5 0.2 0.1 0.1 0.1求X的均值和标准差。
均值:μ=Ε(X)=1*0.5+2*0.2+3*0.1+4*0.1+5*0.1=2.1标准差:σ=√ ̄Ε(X ²)-[Ε(X)] ²=√ ̄6.3-2.1*2.1=1.371.随机变量X的均值和方差定义。
均值:方差:2.两点分布(0-1)与二项分布的关系?两点分布是一种特殊的二项分布。
3.正态分布和标准正态分布的关系?区别:正态分布的平均数为μ,标准差为σ;不同的正态分布可能有不同的μ值和σ值,正态分布曲线形态因此不同。
标准正态分布平均数μ=0,标准差σ=1,μ和σ都是固定值;标准正态分布曲线形态固定。
联系:正态分布可以通过标准化处理,转化为标准正态分布。
具体方法是使用z=(X-μ)/σ将原始数据转化为标准分数。
1、数据测度分为几个类别?试举例说明。
①比率级数据:具有一定单位的实际测量值,可进行加减乘除以及延伸运算。
例如:公斤、千克、元、米、尺等。
②间距级数据:只能做加减运算,不能做乘除运算的数据。
数据中的0不是物理世界客观存在的,是人为设定的。
例如:要调查消费者对某一商品的满意度,我们可以人为把满意度设定为0~10,也可以设定为0~100,还可以设定为-5~+5,实际上他们是等效的。
③序次级数据:只能够比较大小,不能做加减运算,更不能做乘除运算的数据。
例如:可以用数字或者字母来表示不同的等级,编码的序值,可以代表受教育程度的高低。
可以对这些编码做不等式运算。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章
1.数据测度有几个类别?试举例说明
(1)最高测度级数据:刻度级数据,包括比率级数据(可进行加减乘除及其延伸运算),间距级数据(可进行加减运算)例子:温度,体温,时间
(2)中间级数据:序次级数据(只有大小之别,无法进行加减运算)例子:受教育程度,政治面貌
(3)最低级数据:名义级数据(仅仅是一种标志,用以区分变量的不同值,数据之间没有序次关系)例子:性别,爱好,习惯,品牌
2.分层抽样的作法和适用条件是什么?作法:按照总体中个体的某特征,把总体中的个体分为若干群(类);然后对各个群内的个体进行简单随机抽样。
适用条件:要求层之间的差异大于层内部的个体的差异
3.如何确定分层抽样各层的样本个数?
(1)等数分配法,即对每一类都分配同样的个体数
(2)等比分配法,即让每一类抽得的个体数与该类总体的个体数之比,都相同;
或者说,按照同一个比例,从各个类别中抽取样本。
(3)最优分配法(方差分配法),即从各类抽得的样本数与所要抽得的总样本数之比,等于该类的方差与各类方差之和之比。
4.整群抽样的作法和适用条件是什么?作法:将总体中的各个个体,按照某一标志量,分为若干群,然后以群为单位,对群进行简单随机抽样(然后对抽出来的群,进行普查)
适用条件:要求群体之间有相似的特征
5.单选问题的备选答案应当满足什么条件?
(1)备选答案应当是一个空间的完整划分
(2)备选答案不应当是两个空间(层面)的混淆
6.什么是获得数据的实验的外部因素?在实验设计中,应当如何处理外部因素?
对实验结果有影响的、而实验者又不感兴趣的因素。
这类因素,在实验设计中,都是要设法排除
7.什么是获得数据的实验的内部因素?在实验设计中,应当如何处理内部因素?
对实验结果有影响的、同时实验者又感兴趣的因素。
这类因素,在实验设计中,总让这类因素被控制的取不同的值
第三章
1.哪些测度等级的数据集合适合做频次与频率的饼图?所有
2.. 哪些测度等级的数据集合才能计算累积频率?顺序级以上(名义级不存在)3.除了表格法以外,还可以用__ 图来表示一个数据集合的累积频率分布状况条形图
4.直方图与条形图的区别是什么?(1)适用类型不同,直方图适用连续型变量,而且不重复数据个数比较多(2)直方图长条的宽为组距,而条形图无意义
(3)直方图适用于已分组数据
5•什么测度级别的数据集合,适合于中位数?样本容量为奇数时,顺序级以上样本容量为偶数时,刻度级
6.众数、中位数、样本均值,各反映了样本数据集合的什么特征?
众数是样本数据集合中数据出现次数最多的那个数,反映了样本频数曲线的最高点所处的水平位置;
中位数是数据从小到大排列中,居于正中间位置上的数,在样本数据中,中位数两侧数据个数一样多;
样本均值是所有样本数值的算术平均值,在样本均值两侧分别求样本数据之和时,这两个和是相同的,它是数据的绝对中心。
7.极值、四分点、百分位点、极差、四分位距、离差、离差平方和、方差,各反映了样本数据集合的什么特征?
8.箱形图给出了一个数据集合的哪几个量? 极值,四分点,中位数,四分位距,极差
第五章
若X1,X2,…Xn是正态总体N (卩,(T A2 )的一个随机样本,则
(1) 服从什么分布? ( 1) ~N (卩,——)
(2) ------ 服从什么分布? (2) ~N (0,1)
第六章
1.什么是“弃真”错误?什么是“存伪”错误?在假设检验中,通常把什么错误控制的比较小?
弃真:原假设是真的,可检验结果是拒绝原假设的,备择假设成立
存伪:原假设是错误的,但未拒绝原假设存伪
2.在判断是接受还是拒绝零假设Ho时,有两种方法:
(1)用的统计值的P值(即,统计值的显著性概率,或称为统计值的外侧概率),与显著性水平a比较
(2)用统计值9自身,与临界统计值B a或B a /2比较哪个更好一些?为什么?
(1)更好,
3.关于两个正态分布总体的参数检验的统计量问题:
(1)检验均值(卩仁卩2 ?未知其方差值,但知= ),用什么统计量(只需知道统计量的名称,及统计量的大致结构)
(2)检验均值(卩1=卩2 ?未知其方差值,但知),用什么统计量
(只需知道统计量的名称,及统计量的大致结构)
4.在SPSS中,两组独立样本与配对样本的数据存放方式有何不同?
独立样本t检验的待检验变量是放在一列里面然后有一列是分组变量
配对样本t检验是两列待检验变量是一一对应着的,没有分组变量
5.在用spss的独立样本T检验模块,作两均值是否相同的假设检验时,为什么一定要选择Levene检验?
第八章
1.方差分析是用来检验不同数据组的均值差异的,还是方差差异的?
均值
2.方差分析的基本思想和原理是什么?
基本思想通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
原理方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:
(1)实验条件,即不同的处理造成的差异,称为组间差异。
用变量在各组的均
值与总均值之偏差平方和的总和表示,记作SSb,组间自由度dfb。
(2)随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变
量在各组的均值与该组内变量值之偏差平方和的总和表示,记作SSw,组内自由度dfw。
第九章
相关系数的显著性检验的意义是什么?
第十章
回归方程原理?。