华中科技大学数理统计第二次作业

华中科技大学数理统计第二次作业
华中科技大学数理统计第二次作业

学院:机械工程学院 1、收集到26家保险公司人员构成的数据,现希望对目前保险公司从业人员受高等教育的程度和年轻化的程度进行推断,具体来说就是推断具有高等教育水平的员工平均比例是否低于80%,35岁以下的年轻人的平均比例是否为0.5。(数据见练习2数据.xls —练习2.1) 解:希望通过分析这26家保险公司人员构成的数据,研究目前保险公司从业人员受高等教育的程度和年轻化的程度。

(1)推断高等教育水平的员工平均比例是否低于80%

设原假设:保险公司具有高等教育水平的员工比例平均值不低于0.8,即H 0: μ=μ0≥0.8 备择假设:H 1:μ<0.8

n=26,属于小样本,由于σ2

未知,选用t 检验,检验统计量

T =

,取α=0.05

计算的x =0.729273 ,s 2=0.039274

(1)

t n ?≤--, 1.784t =

=-

查t 检验分布表知临界值t α(26-1)=-1.7081

显然,t=-1.784<-t α(25)=-1.7081,因此在α=0.05 的水平上拒绝原假设,选择备择假设 结论:保险公司具有高等教育水平的员工比例平均值低于0.8 (2)推断35 岁以下的年轻人的平均比例是否为0.5

设原假设:年轻人比例的平均值与0.5 无显著性差异,即H 0: μ=μ0=0.5 备择假设H 1:μ≠0.5.

n=26,属于小样本,由于σ2

未知,选用t 检验,检验统计量

T =

,取α=0.05

计算的x =0.713875 ,s 2=0.022705

/2(1)t n ?≥- , 7.097t =

=

查表知α=0.05 的双尾t 检验临界值t α/2(25)=2.0595。故超出[-2.0595,2.0595]的值均在拒 绝域内

由于t=7.097不在拒绝域[-2.0595,2.0595]范围内,因此在α=0.05 的水平上拒绝原假设,选择备择假设

结论:保险公司35 岁以下年轻人比例平均值不等于0.5

2、练习1中保险公司的类别分为:1. 全国性公司;2. 区域性公司;3. 外资和中外合资公司。试分析公司类别1与3的人员构成中,具有高等教育水平的员工比例的均值是否存在显著性的差异。(数据见练习2数据.xls —练习2.1)

解:设原假设H 0:μ1-μ2=0,即公司类别1 与3 具有高等教育水平的员工比例均值无显著

性差异

备择假设H 1:μ1-μ2≠0,α=0.05. 利用双尾t

检验,选择统计量为~(2)X Y

T t m n =

+-

由数据可得X =0.61203,Y =0.81067,S X 2

=0.068303,S Y 2

=0.014699

2212(1)(1)(81)*0.068303(161)*0.0146990.0317528162

W m s n s S m n -+--+-===+-+-

14.56X Y t =

==-

查表知t α/2(8+16-2)=2.074,所以接收域为[-2.074, 2.074]

由两个样本(1 类和3 类公司受高等教育人数比例)均值和标准差求得检验统计量t=-14.56 超出接收域,故拒绝原假设,接收备择假设。

结论:具有高等教育水平的员工比例的均值存在显著性的差异

3、欲研究不同收入群体对某种特定商品是否有相同的购买习惯,市场研究人员调查了4个不同收入组的消费者共527人,购买习惯分别为:经常购买,不购买,有时购买。要求:(1)提出假设;(2)计算x 2值;(3)以99%的显著性水平进行检验。(数据见练习2数据.xls —练习2.3)

解:(1)设原假设H 0:不同收入人群对该商品有相同购买习惯,即μ1=μ2=μ3=μ4 备择假设H 1:不同收入人群对该商品购买习惯不同,即μ1、μ2、μ3、μ4不全相等 (2)

根据公式算出对应的期望值f e ,结果如下表所示:

使用EXCLE 进行运算得x 2为17.55437331自由度为(4-1)*(3-1)=6 (3)自由度为=(R-1)(r-1)=(4-1)*(3-1)

=6

α=0.01 时,可以查表得:X2(0.01)(6)=16.8

拒绝域为;(16.8,+∞),由于X2>X2α,故拒绝原假设H0,即认为不同收入群体对某种特定商品,没有相同的购买习惯

结论:不同收入人群对该商品购买习惯不同

4、由我国某年沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据,采用各

种非参数检验方法进行检验,判断它们的分布是否存在显著性差异,并进行评价。(数据见练习2数据.xls—练习2.4)

解:(1)曼-惠特尼U 检验

设原假设H0:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样

数据的分布不存在显著性差异

备择假设H1:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样

数据的分布存在显著性差异

沿海样本数量m=12,非沿海样本数量n=18,故Wilcoxon W=W Y=180

U=W-0.5n(n+1)=9

大样本,Z=-4.19<-3,拒绝原假设,选择备择假设

结论:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据的分

布存在显著性差异。

(2)K-S检验

设原假设H0:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样

数据的分布不存在显著性差异

备择假设H1:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样

数据的分布存在显著性差异

将这两组样本混合并按升序排序,分别计算两组样本秩的累计频数和累计频率,计算累

计频率之差,得到秩的差值序列并得到D= 0.861

查表得p> 0.99 > (1-α) = 0.95

结论:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据的分

布存在显著性差异。

(3)游程检验

设原假设H0:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样

数据的分布不存在显著性差异

备择假设H1:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样

数据的分布存在显著性差异

由上表可知游程r = 6

μr= 2mnm+n = 14.4

σr2= 2mn(2mn?m?n)(m+n)2(m+n?1) = 6.654

Z = r-μrσr = -3.256

p = 0.00056 < α = 0.05,拒绝H0

结论:该年我国沿海和非沿海省市自治区的人均国内生产总值(GDP)的抽样数据的分

布存在显著性差异。

5、某企业在制定某商品的广告策略时,收集了该商品在不同地区采用不同广告形式促销后的销售额数据,希望对广告形式和地区是否对商品销售额产生影响进行分析,

a)以商品销售额为因变量,广告形式和地区为自变量,通过单因素方差分析方法分别

对广告形式、地区对销售额的影响进行分析;

b)试进一步分析,究竟哪种广告形式的作用较明显,哪种不明显,以及销售额和地区

之间的关系等。

c)试分析广告形式、地区以及两者的交互作用是否对商品销售额产生影响。

(数据见练习2数据.xls—练习2.5,其中广告形式为:1. 报纸;2. 广播;3. 宣传品;

4. 体验)

解:a)设4种不同的广告形式后的销售额均值分别为μ1、μ2、μ3、μ4,则原假设H0及备择假设H1分别为:

H0:4种不同的广告形式对销售额无显著性影响,即μ1=μ2=μ3=μ4。

H1:4种不同的广告形式对销售额有显著性影响,即μ1、μ2、μ3、μ4不全相等。

利用Excel数据分析中单因素方差分析可得,当α = 0.05时,F = 13.48311 >F0.95(3,140) = 2.669256,所以拒绝H0,即有证据表明4种不同的广告形式对销售额有显著性影响。

设18个地区的销售额均值为μi(i = 1, 2, 3,···18),则原假设H0及备择假设H1分别为:

H0:地区对销售额无显著性影响,即μ1=μ2=μ3=μ4=···=μ15=μ16=μ17=μ18。

H1:地区对销售额有显著性影响,即μ1、μ2、μ3、μ4···μ16、μ17、μ18不全相等。

利用Excel数据分析中单因素方差分析可得,当α = 0.05时,F = 4.062486> F0.95(17,126)

= 1.704427,所以拒绝H0,即有证据表明地区对销售额有显著性影响。

b)利用最小显著差异方法LSD进行分析,原假设H0及备择假设H1分别为:

H0:μi = μj(第i个总体的均值等于第j个总体的均值)

H1:μi≠μj(第i个总体的均值不等于第j个总体的均值)

=n1=n2=n3=n4=36,MSE=145.023,α = 0.05,

由公式LSD tα

得LSD = 5.61。

根据前面表中的计算结果x?1= 73.22,x?2= 70.89,x?3= 56.56,x?4= 66.61,计算统计检

验量。

| x?1- x?2| = 73.22 –70.89 = 2.33 < 5.61

所以广告形式1和广告形式2对销售额无显著性影响。

| x?1- x?3| = 73.22 –56.56 = 16.66 > 5.61

所以广告形式1和广告形式3对销售额有显著性影响。

| x?1- x?4| = 73.22 –66.61 = 6.61 > 5.61

所以广告形式1和广告形式4对销售额有显著性影响。

| x?2- x?3| = 70.89 –56.56= 14.33 > 5.61

所以广告形式2和广告形式3对销售额有显著性影响。

| x?2- x?4| = 70.89 –66.61 = 4.28 < 5.61

所以广告形式2和广告形式4对销售额无显著性影响。

| x?3- x?4| = 66.61 –56.56 = 10.05 >5.61

所以广告形式3和广告形式4对销售额有显著性影响。

广告形式与销售额的关系强度R2

= 0.224159

地区与销售额的关系强度R2= 0.354052

结论:广告形式和地区相比,广告形式与销售额的关系强度较低,地区与销售额的关系

强度较高。

c)对因素A提出的假设为

H0:4种不同的广告形式对销售额无显著性影响,即μ1=μ2=μ3=μ4。

H1:4种不同的广告形式对销售额有显著性影响,即μ1、μ2、μ3、μ4不全相等。

对因素B提出的假设为

H0:地区对销售额无显著性影响,即μ1=μ2=μ3=μ4=···=μ15=μ16=μ17=μ18。

H1:地区对销售额有显著性影响,即μ1、μ2、μ3、μ4···μ16、μ17、μ18不全相等。

对因素A×B提出的假设为

H0:地区和广告形式的交互作用对销售额无显著性影响

H1:地区和广告形式的交互作用对销售额有显著性影响

由EXCLE数据分析可知,广告形式及地区所对应的p均小于α= 0.05,所以拒绝H0,即广

告形式、地区对销售额有显著性影响;而广告形式与地区的交互作用所对应的p=0.296 > α= 0.05,所以不拒绝H0,即没有充足证据表明广告形式与地区的交互作用对销售额有显著性影响。

华科数据结构实验

数据结构课程设计哈夫曼编码和译码的实现

#include #include #include #include #define MAXNUM 100 /*哈夫曼结点的结构*/ typedef struct { char data; int weight; int parent; int lchild; int rchild; }HuffNode; /*哈夫曼编码存储结构*/ typedef struct { int cd[MAXNUM];//存放HUFFMAN编码的数组 int begin; }HuffCode; /*哈夫曼树的构造函数*/ int HuffmanCreate(HuffNode *ht) { int min1,min2,p1,p2,i,k,n; system("CLS"); printf("\t请输入要编码的数据的个数:"); scanf("%d",&n); if(n <= 1) do { printf("\n输入的数据元素个数太少!请重新输入!\n\n"); printf("\t请输入要编码的数据的个数:"); scanf("%d",&n); }while(n <= 1);

for(i = 1;i<=n;i++) { getchar(); system("CLS"); printf("\n\t\t====================================\n"); printf("\t\t\t第%d个元素的=>\n\t\t\t\t结点的值:",i); scanf("%c",&ht[i].data); printf("\t\t\t\t节点权重:"); scanf("%d",&ht[i].weight); printf("\n\t\t====================================\n"); } for(i = 1;i<= 2 * n - 1; i++) ht[i].parent = ht[i].lchild = ht[i].rchild = 0; for(i = n+1;i<= 2 * n - 1;i++)//产生新的Huffman节点 { min1 = min2 = 32767;//min1和min2开始赋最大值 p1=p2=1; for(k = 1;k<=i-1;k++)//在输入的节点中选取权值最小的值min1和min2 { if(ht[k].parent == 0) if(ht[k].weight < min1)//运用选择排序生成HUFFMAN树 { min2 = min1; p2 = p1; min1 = ht[k].weight; p1 = k; } else if(ht[k].weight < min2) { min2 =ht[k].weight; p2 = k; } } ht[p1].parent = i; ht[p2].parent = i; ht[i].weight = min1 + min2; ht[i].lchild = p1; ht[i].rchild = p2; } printf("\n\n\n\t\t\t提示:哈夫曼树构建成功!\n\n\n\n"); system("PAUSE"); return n; }

华中科技大学数理统计第二次作业

华中科技大学数理统计第二 次作业 -标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

学院:机械工程学院 1、收集到26家保险公司人员构成的数据,现希望对目前保险公司从业人员受高等教育的程度和年轻化的程度进行推断,具体来说就是推断具有高等教育水平的员工平均比例是否低于80%,35岁以下的年轻人的平均比例是否为0.5。(数据见 练习2数据.xls —练习2.1) 解:希望通过分析这26家保险公司人员构成的数据,研究目前保险公司从业人员受高等教育的程度和年轻化的程度。 (1)推断高等教育水平的员工平均比例是否低于80% 设原假设:保险公司具有高等教育水平的员工比例平均值不低于0.8,即H μ=μ≥0.8 备择假设:H :μ<0.8 n=26,属于小样本,由于σ2未知,选用t 检验,检验统计量 X T = ,取α=0.05 计算的x =0.729273 ,s 2=0.039274 (1) x t n ?≤-- , 1.784t ==- 查t 检验分布表知临界值t=-1.7081 显然,t=-1.784<- t =-1.7081,因此在α=0.05 的水平上拒绝原假设,选择备择假设 结论:保险公司具有高等教育水平的员工比例平均值低于0.8 (2)推断35 岁以下的年轻人的平均比例是否为0.5 设原假设:年轻人比例的平均值与0.5 无显著性差异,即H μ=μ=0.5 备择假设H : μ≠0.5. n=26,属于小样本,由于σ2未知,选用t 检验,检验统计量 X T = ,取α=0.05 计算的x =0.713875 ,s 2=0.022705 拒绝域: /2(1)t n ?≥- , 7.097t == 查表知α=0.05 的双尾t 检验临界值t (25)=2.0595。故超出[-2.0595,2.0595]的值均在拒 绝域内 由于t=7.097不在拒绝域[-2.0595,2.0595]范围内,因此在α=0.05 的水平上拒绝原假设,选择备择假设

数理统计课后答案.doc

数理统计 一、填空题 1、设n X X X ,,21为母体X 的一个子样,如果),,(21n X X X g , 则称),,(21n X X X g 为统计量。不含任何未知参数 2、设母体 ),,(~2 N X 已知,则在求均值 的区间估计时,使用的随机变量为 n X 3、设母体X 服从修正方差为1的正态分布,根据来自母体的容量为100的子样,测得子样均值为5,则X 的数学期望的置信水平为95%的置信区间为 。 025.010 1 5u 4、假设检验的统计思想是 。 小概率事件在一次试验中不会发生 5、某产品以往废品率不高于5%,今抽取一个子样检验这批产品废品率是否高于5%, 此问题的原假设为 。 0H :05.0 p 6、某地区的年降雨量),(~2 N X ,现对其年降雨量连续进行5次观察,得数据为: (单位:mm) 587 672 701 640 650 ,则2 的矩估计值为 。 1430.8 7、设两个相互独立的子样2121,,,X X X 与51,,Y Y 分别取自正态母体)2,1(2 N 与 )1,2(N , 2 *2 2*1,S S 分别是两个子样的方差,令2*2222*121)(,S b a aS ,已知)4(~),20(~22 2221 ,则__________, b a 。 用 )1(~)1(22 2 * n S n ,1,5 b a 8、假设随机变量)(~n t X ,则 2 1 X 服从分布 。)1,(n F 9、假设随机变量),10(~t X 已知05.0)(2 X P ,则____ 。 用),1(~2 n F X 得),1(95.0n F

华中科技大学887+数据结构与算法分析考研大纲

华中科技大学硕士研究生入学考试《数据结构与算法分析》考试大纲 科目代码(887) 第一部分考试说明 一、考试性质 《数据结构与算法分析》是报考我校软件学院硕士生选考的专业基础课之一。考试对象为报考我校硕士研究生入学考试的准考考生。 二、考试形式与试卷结构 (一)答卷方式:闭卷,笔试 (二)答题时间:180分钟 (三)考试题型及比例: 术语解释15% 选择、填空 30% 论述、简答30% 设计及应用 25% 第二部分考查要点 (一)基本概念和术语 1.数据结构的概念 2.抽象数据结构类型的表示与实现 3.算法,算法设计的要求,算法效率的度量,存储空间要求。 (二)线形表 1.线形表的类型定义 2.线形表的顺序表示和实现 3.线形表的链式表示和实现

(三)栈和队列 1.栈的定义,表示和实现 2.栈的应用:数制转换,括号匹配,行编辑,迷宫求解,表达式求值 3.栈与递归实现 4.队列。 (四)串 1.串的定义,表示和实现 2.串的模式匹配算法 (五)树和二叉树 1.树的定义和基本术语 2.二叉树,遍历二叉树和线索二叉树 3.树和森林:存储结构,与二叉树的转换,遍历 4.霍夫曼树和霍夫曼编码 5.回溯法与树的遍历 (六)查找 1.静态查找表 2.动态查找表 3.哈希表 (七)图

1.图的定义和术语 2.图的存储结构 3.图的遍历 4.图的连通性问题 5.拓扑排序与关键路径 6.最短路径 (八)内部排序 1.排序的概念 2.插入排序 3.快速排序 4.选择排序:简单选择,树形选择,堆排序 5.归并排序 6.基数排序 7.各种排序方法的比较 第三部分考试样题(略)

数理统计作业三

第一部分统计基础与概率计算(共10题,10分/题) 1.某人在每天上班途中要经过3个设有红绿灯的十字路口。设每个路口遇到红 灯的事件就是相互独立的,且红灯持续24秒而绿灯持续36秒。试求她途中遇到红灯的次数的概率分布及其期望值与方差、标准差。 解:读题可知每个路口遇到红灯的概率就是P=24/(24+36)=0、4 假设遇到红灯的次数为X,则,X~B(3,0、4),概率分布如下 0次遇到红灯的概率P0=(1-0、4)3=0、216 1次遇到红灯的概念P1=(1-0、4)2*0、4=0、432 2次遇到红灯的概念P2=(1-0、4)*0、42=0、288 3次遇到红灯的概念P3=0、43=0、064 期望:E(x)=nP=0、4*3=1、2 方差:D(X)=δ2=nPq=0、4*3*(1-0、4)=0、72 标准差: 2、一家人寿保险公司某险种的投保人数有20000人,据测算被保险人一年中的死亡率为万分之5。保险费每人50元。若一年中死亡,则保险公司赔付保险金额50000元。试求未来一年该保险公司将在该项保险中(这里不考虑保险公司的其它费用): (1)至少获利50万元的概率; (2)亏本的概率; (3)支付保险金额的均值与标准差。 解:设被保险人死亡数为X,X~B(20000,0、0005) 2.总收入为2万×50=100万,要获利至少50万,则赔付的保险金额应该不超过50万,也就就 是被保险的人当中死亡人数不能超过10人,精确点就就是用二项分布来做,但就是由于20000这个数比较大,就可以用正态近似来做,就就是认为死亡人数服从与原二项分布的均值方差相同的正态分布,结用正态函数表示。概率为P(X≤10)=0、58304

数理统计学作业

数理统计学作业 专业:飞行器设计 姓名:刘炜华 学号: 20130302002 2013年9月

1.数据的采集及说明 1.1数据的搜集方法及说明 当复合材料结构开始大量应用之后,在实际使用中可以积累大量的故障统计数据,航空公司在对故障数据进行收集和统计之后,可以对故障数据作故障率直方图和故障频率分布图来进行故障频率信息的统计和分析。 表 1是一架飞机在某段时间内故障间隔飞行小时,下面以该数据集为基础简单估计该架飞机在该时间段内的故障率曲线分布。 表1某飞机一段时间内故障间隔飞行小时 1.2.数据整理 1.表中共有 100 个维修数据,找出其中的最大值为max 652L =小时,最小值为 min 1L =小时; 2.计算组数: 根据经验公式:1 3.32lg k n =+, 计算得1 3.32lg 1 3.32lg1008k n =+=+≈, 所以将数据分为8组; 3.计算组距: max min 6521 828 L L t k --?= =≈; 4.根据公式计算并将所得的结果列成表2: 频率:/j j W f n =

表2故障频率分析过程计算结果 5.计算得:202.98X =,167.0697S =; 根据公式3 1 13 () 1.1035(1)n i i X X V n S =-= =-∑ 6.计算峰度: 根据公式4 1 24 () 3.4853(1)n i i X X V n S =-= =-∑ 1.3.直方图与折线图 图1-1故障频数直方图

图1-2故障频率折线图 图1-3故障频率直方图 图1-4累计频率折线图

从频率直方图即图3中可以看出,靠近左侧的数据出现较多。通过比较频率曲线和指数分布曲线可以看出,该图显示故障呈现典型的指数分布,所以说明趋势方程是指数函数。趋势线方程代表故障频数随时间的发展趋势,据此可以预测未来某一时间段内的故障数,来实现故障相关维修成本的估算。 1.4.经验分布函数 根据定义得出,总体X 的经验分布函数为: 0,1 (),1652,1,2,...,991001,652 n x k F x x k x

华科数理统计作业答案

● 1.某百货公司连续40天的商品销售额如下(单位:万元): 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35 根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。(数据见练 解:打开Excel 练习1数据.xls ,再查如函数栏输入=MAX(A2:A41),=MIN(A2:A41)得数据的最大值为49,最小值为25。 数据全为49-25=24,为便于计算和分析,将数据分为5组,各组组距为5。 用Excel 统计各组内数据的个数,点击“插入函数”,选择FREQUENCY ,确定FREQUENCY 函数的两个参数的值,其中:?Data-array :原始数据或其所在单元格区域(A2:A41)?Bins-array :分组各组的上限值或其所在单元格区域(C6:C9)?。 将各组天数除以总天数40,得到各组频率。作出如下频数分布表: 2.为了确定灯泡 的使用寿命(小时),在一批灯泡中随 机抽取100只进行测试,所得结果如 下: 700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688 (1)利用计算机对上面的数据进行排序; (2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图; (3)绘制茎叶图,并与直方图作比较. (数据见练习1数据.xls-练习1.2) 解:(1) 频数分布表 销售收入(万元) 频数 频率% 25-30 6 0.15 30-35 6 0.15 53-40 14 0.35 40-45 10 0.25 45-50 4 0.1

2018年华中科技大学834计算机专业基础综合(数据结构、计算机网络)考研真题(回忆版)

2018年华中科技大学834计算机专业基础综合(数据结构、计算机网络)考研真题(回 忆版) 数据结构部分 一、选择题(共10道,一个2分,共20分) 1.数据结构的逻辑结构分类是哪两种? 2.给定一颗完全二叉树的结点数,求其中的叶节点个数 3.一个有n个结点的图构成一个邻接矩阵几乘几的矩阵 4~10暂缺 二、简答题(共5道题,前四个15分,最后一个10分,今年没有编程题,也就是都是算法和推演,不用写代码,都是根据要求写结果和原理) 1.给了8个左右的数字的一个集合,比如{75,63,43…},要求一次读取一个,输出成一个二叉排序树,写出结果,并且求等概率情况下的平均查找长度。 2.给了一个包含有ABCDEFGH这几个点的二叉树的先序和中序排列,要求画出原二叉树。

3.一个指令集合{I1,I2,I3…},对应给出了每个指令对应的发生概率大小{0.03,0.03,0.15,0.15,0.3,0.4}(这个数字印象比较深基本差不多),让求出用此集合构成的哈夫曼树。求出他们的一个组织,并且求出每个指令的哈夫曼编码。 4.给出了一个由ABCDEFGHLM点组成的的无向带权图,让求出最小生成树(这里题干没有写用哪种算法)。 5.给定了一个树,转化成对应的二叉树,大概有8个点左右。 计算机网络部分 一、选择题(共10道,一个1分,共10分) 1.IPV4和IPV6的特征对比,选出一个错误的 2.TCP拥塞控制中慢开始算法的特征,选出一个错误的 3~10暂缺 二、填空题(共10道,一个1分,共10分) 1.IEEE802.11用的协议是_____

2.CDMA2000采用的编码方式是_____ 3.移动IP的基本工作过程(给了其中3个步骤,填另一个) 4.信道划分的三种方式(给了其中2个,填另一个) 5~10暂缺 三、简答题(共7道,共40分) 1.主机A向主机B先后发两个报文,给出了每个报文的字节数,然后分别问了第一个先到的情况下和第二个报文先到的情况下各自的确认号,源,目的。 2.题目给了两个通信设备之间的RTT,L是要发送的信息的长度,S和R分别代表(忘了。),也是两问,分别求在4L/R<S/R<2L/R(第一个条件这里有个两个不等号隔开的三个地方有个地方是+RTT的,记不清给到哪里了)和S/R>4L/R两种情况下一端从开始发送信息开始到完全接收到并收到确认所用的总时间 3.左边给出一个路由表,有A到G总共7个表项,右边给出了6个IP地址,根据路由表求每个地址对应的下一跳 4.求一个带权图的从A到各个点的最短路径,画出来是一个表格(可以参考严蔚敏《数据结构》第七章图的应用举的例子,形式基本没区别)

北航数理统计第二次大作业-数据分析模板

数理统计第二次大作业材料行业股票的聚类分析与判别分析 2015年12月26日

材料行业股票的聚类分析与判别分析摘要

1 引言 2 数据采集及标准化处理 2.1 数据采集 本文选取的数据来自大智慧软件的股票基本资料分析数据,从材料行业的股票中选取了30支股票2015年1月至9月的7项财务指标作为分类的自变量,分别是每股收益(单位:元)、净资产收益率(单位:%)、每股经营现金流(单位:元)、主营业务收入同比增长率(单位:%)、净利润同比增长率(单位:%)、流通股本(单位:万股)、每股净资产(单位:元)。各变量的符号说明见表2.1,整理后的数据如表2.2。 表2.1 各变量的符号说明 自变量符号 每股收益(单位:元)X1 净资产收益率(单位:%)X2 每股经营现金流(单位:元)X3 主营业务收入同比增长率(单位:%)X4 净利润同比增长率(单位:%)X5 流通股本(单位:万股)X6 每股净资产(单位:元)X7 表2.2 30支股票的财务指标 股票代码X1 X2 X3 X4 X5 X6 X7 武钢股份600005-0.0990-2.81-0.0237-35.21-200.231009377.98 3.4444宝钢股份6000190.1400 1.980.9351-14.90-55.011642427.88 6.9197山东钢铁600022-0.11650.060.0938-20.5421.76643629.58 1.8734北方稀土6001110.0830 3.640.652218.33-24.02221920.48 2.2856

杭钢股份600126-0.4900-13.190.4184-36.59-8191.0283893.88 3.4497抚顺特钢6003990.219310.080.1703-14.26714.18112962.28 1.4667盛和资源6003920.0247 1.84-0.2141-5.96-19.3739150.00 1.2796宁夏建材6004490.04000.510.3795-22.15-92.3447818.108.7321宝钛股份600456-0.2090-2.53-0.3313-14.81-6070.2043026.578.1497山东药玻6005290.4404 5.26 1.2013 6.5016.7825738.018.5230国睿科技6005620.410011.53-0.2949 3.3018.9416817.86 3.6765海螺水泥600585 1.15169.05 1.1960-13.06-25.33399970.2612.9100华建集团6006290.224012.75-0.57877.90-6.4034799.98 1.8421福耀玻璃6006600.790014.250.9015 3.6017.27200298.63 6.2419宁波富邦600768-0.2200-35.02-0.5129 3.1217.8813374.720.5188马钢股份600808-0.3344-11.710.3939-21.85-689.22596775.12 2.6854亚泰集团6008810.02000.600.1400-23.63-68.16189473.21 4.5127博闻科技6008830.503516.71-0.1010-10.992612.8023608.80 3.0126新疆众和6008880.0523 1.04-0.910662.64162.0464122.59 5.0385西部黄金6010690.0969 3.940.115115.5125.5712600.00 2.4965中国铝业601600-0.0700-2.920.2066-9.0882.79958052.19 2.3811明泰铝业6016770.2688 4.66-1.09040.8227.8640770.247.4850金隅股份6019920.1989 3.390.3310-10.05-39.01311140.26 6.7772松发股份6032680.35007.00-0.3195-4.43-9.622200.00 6.0244方大集团0000550.0950 5.66-0.480939.2920.6742017.94 1.6961铜陵有色0006300.0200 1.220.6132 3.23-30.74956045.21 1.5443鞍钢股份000898-0.1230-1.870.7067-27.32-196.21614893.17 6.4932中钢国际0009280.572714.45-0.4048-14.33410.2441286.57 4.2449中材科技0020800.684610.27 1.219547.69282.1740000.00 6.8936中南重工0024450.1100 4.300.340518.8445.0950155.00 2.7030 2.2 数据的标准化处理 由于不同的变量之间存在着较大的数量级的差别,因此要对数据变量进行标准化处理。本文采用Z得分值法标准化的方法进行标准化,用x的值减去x的均值再除以样本的方差。也就是把个案转换为样本均值为0、标准差为1的样本。如果不同变量的变量值数值相差太大,会导致计算个案间距离时,由于绝对值较小的数值权数较小,个案距离的大小几乎由大数值决定,标准化过程可以解决此类问题,使不同变量的数值具有同等的重要性。经Z标准化输出结果见表 2.2。 表2.2 经Z标准化后的数据 ZX1ZX2ZX3ZX4ZX5ZX6ZX7

数理统计第二次作业

数理统计第二次作业 ? 1. 某百货公司连续40 天的商品销售额如下(单位:万元): 41 46 35 42 25 36 28 36 29 45 46 37 47 37 34 37 38 37 30 49 34 36 37 39 30 45 44 42 38 43 26 32 43 33 38 36 40 44 44 35 根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。(数据见练 习1 数据.xls —练习 1.1 )解:频数分布表及直方图如下:由直方图可以看出,该百货公司连续 40 天的销售额近似服从单峰对称的正态分布。 2. 为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100 只进行测试,所 得结果如下: 700 706 716 715 728 712 719 722 685 691 709 708 691 690 684 692

705 707 718 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688 (1) 利用计算机对上面的数据进行排序; (2) 以组距为10 进行等距分组,整理成频数分布表,并绘制直方图;(3) 绘制茎叶图,并与直方图作比较. 解( 1)排序如下 (2)频数分布表及频数分布直方图如下:从直方图可以看出,灯泡的使用寿命近似服从单 峰对称的正态分布。 (3)茎叶图如下 与频数分布表比较可知:当频数分布表频数分布间隔为10,且从整10 开始,则茎叶 图各茎所含叶片数与对应频数区间所含项数相等。 3. 某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产 5 件产品全部达到优质。问该企业决策者会倾向于如何决策? 解:设A =优质率达95%, C =优质率为80%, B =试验所生产的5件全部优质。 P(A) = 0.4 , P(A ) = 0.6 , P(B|A)=0.955 , P(B|A )=0.85 ,所求概率为:P (A I B ) P(A) ?P(B I A) P(A) ?P(B II A)+P(A ) ?P(B I A ) 0.50612 0.30951 0.6115 决策者会倾向于采用新的生产管理流程。

西南大学数理统计作业答案

由累积资料知道甲、乙两煤矿的含灰率分别服从。现从两矿各抽n个试件,分析其含灰率为 问甲、乙两矿所采煤的含灰率的数学期望有无显著差异(显著水平α=0.05)? 答:1分别以甲乙两矿所采煤的含灰率作为总体和总体,问题归结为根据所给的样本观 察值对方差已知的两个正态总体检验,可采用U-检验法。 原假设,由所给样本观察值算得,于是 对于α=0.10,查标准正态分布表得,因为,所以拒绝, 即可以认为有显著差异。 2某种羊毛在处理前后,各抽取样本测得含脂率如下(%): 羊毛含脂率按正态分布,问处理后含脂率有无显著差异(α=0.05)? 答:2已知n=10,m=8,α=0.05,假设,自由度为n+m-2=16,查表 选取统计量

因为 ,所以否定 ,即可以认为处理后含脂率有显著变化。 3 使用A 与B 两种方法来研究冰的潜热,样本都是 的冰。下列数据是每克冰从 变为 的水的过程中的热量变化(Cal/g ): 假定用每种方法测得的数据都具有正态分布,并且它们的方差相等,试在α=0.05下可否认为两种方法测得的结果一致? 答:3两个总体,且 ,用t 检验法: 检验假设 计算统计量的值 α=0.05,自由度为n+m-2=19,方差未知,查表得 ,因 ,故否定 ,即在检验水平α=0.05下可以认为两种方法测得值(均值) 不等。

1为了检验某药物是否会改变人的血压,挑选10名试验者,测量他们服药前后的血压,如下表所列: 假设服药前后血压差值服从正态分布,取检验水平为0.05,从这些资料中是否能得出该药物会改变血压的结论? 答:1以记服药前后血压的差值,则服从,其中均未知,这些资 料中可以得出的一个样本观察值:6 8 3 -4 6 -2 6 -1 7 2 待检验的假设为 这是一个方差未知时,对正态总体的均值作检验的问题,因此用t检验法当 时,接受原假设,反之,拒绝原假设。依次计算有 由于T的观察值的绝对值。所以拒绝原假设,即认为服药前后人的血压有显著变化。 2某厂用自动包装机装箱,在正常情况下,每箱重量服从正态分布,某日开工后,随机抽查10箱,重量如下(单位:斤):99.3,98.9,100.5,100.1,99.9,99.7,100.0,100.2,99.5,100.9,问包装机工作是否正常,即该日每箱重量的数学期望与100有 显著差异(给定水平α=0.05,并认为该日的仍为1.15)? 答:2以该日每箱重量作为总体,它服从,问题就归结为根据所给的样本 观察值对方差已知的正态总体检验,可采用U-检验法。 原假设,由所给样本观察值算得,于是

概率论与数理统计作业及解答

概率论与数理统计作业及解答 第一次作业 ★1. 甲? 乙? 丙三门炮各向同一目标发射一枚炮弹? 设事件A ? B ? C 分别表示甲? 乙? 丙击中目标? 则三门炮最多有一门炮击中目标如何表示. 事件E ?{事件,,A B C 最多有一个发生},则E 的表示为 ;E ABC ABC ABC ABC =+++或;AB AC BC =U U 或;AB AC BC =U U 或;AB ACBC =或().ABC ABC ABC ABC =-++ (和A B +即并A B U ,当,A B 互斥即AB φ=时?A B U 常记为A B +?) 2. 设M 件产品中含m 件次品? 计算从中任取两件至少有一件次品的概率. 221M m M C C --或1122(21)(1)m M m m M C C C m M m M M C -+--=- ★3. 从8双不同尺码鞋子中随机取6只? 计算以下事件的概率. A ?{8只鞋子均不成双}, B ?{恰有2只鞋子成双}, C ?{恰有4只鞋子成双}. ★4. 设某批产品共50件? 其中有5件次品? 现从中任取3件? 求? (1)其中无次品的概率? (2)其中恰有一件次品的概率? (1)34535014190.724.1960C C == (2)21455350990.2526.392 C C C == 5. 从1~9九个数字中? 任取3个排成一个三位数? 求? (1)所得三位数为偶数的概率? (2)所得三位数为奇数的概率? (1){P 三位数为偶数}{P =尾数为偶数4},9 =

(2){ P三位数为奇数}{ P =尾数为奇数 5 }, 9 = 或{ P三位数为奇数}1{ P =-三位数为偶数 45 }1. 99 =-= 6.某办公室10名员工编号从1到10?任选3人记录其号码?求?(1)最小号码为5的概率?(2)最大号码为5的概率? 记事件A?{最小号码为5}, B?{最大号码为5}. (1) 2 5 3 10 1 (); 12 C P A C ==(2) 2 4 3 10 1 (). 20 C P B C == 7.袋中有红、黄、白色球各一个?每次从袋中任取一球?记下颜色后放回?共取球三次? 求下列事件的概率:A={全红}?B={颜色全同}?C={颜色全不同}?D={颜色不全同}?E={无黄色球}?F={无红色且无黄色球}?G={全红或全黄}. ☆.某班n个男生m个女生(m?n?1)随机排成一列? 计算任意两女生均不相邻的概率. ☆.在[0? 1]线段上任取两点将线段截成三段? 计算三段可组成三角形的概率. 第二次作业 1. 设A? B为随机事件? P(A)?? P(B)?? (|)0.85 P B A=? 求?(1)(|) P A B? (2)() P A B ∪? (1) ()() 0.85(|),()0.850.080.068, ()10.92 P AB P AB P B A P AB P A ====?= - (2)()()()() P A B P A P B P AB =+- U0.920.930.8620.988. =+-= 2. 投两颗骰子?已知两颗骰子点数之和为7?求其中有一颗为1点的概率. 记事件A?{(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)}, B?{(1,6),(6,1)}.

西安交大数理统计作业(完整版)

第一章 1.1 X~N(μ,2 σ) 则X~N(μ, 2 n σ ),所以X-μ~N(0, 2 n σ ) P{X-μ <1}= P{ = 0.95 N(0,1),而(0.975) 1.96 Φ= 所以n最小要取[2 1.96x2σ]+1 1.2 (1)至800小时,没有一个元件失效 这个事件等价于P{ 123456 X X X X X X>800}的概率 由已知X服从指数分布,可求得P{ 123456 X X X X X X>800}=7.2 e-(2)至3000小时,所有六个元件都失效的概率 等价与P{ 123456 X X X X X X<3000}的概率 可求得P{ 123456 X X X X X X<3000}= 4.56 (1) e- - 1.5 2 1 () n i i X a = - ∑=2 1 [()()] n i i X X X a = -+- ∑ =22 111 ()2()()() n n n i i i i i X X X a X X X a === -+--+- ∑∑∑ 因为 1 () n i i X X = - ∑=0 所以2 1 () n i i X a = - ∑=22 11 ()() n n i i i X X X a == -+- ∑∑ =22 1 () n i nS X a = +- ∑ 所以当a=X时,2 1 () n i i X a = - ∑有最小值且等于2nS 1.6 (1)由 1 1n i i X X n= =∑

有等式的左边= 221 12n n i i i i X X n μμ==-+∑∑ 等式的右边= 22221122n n i i i i X X X nX nX nX n μμ==-++-+∑∑ = 22 2 2 211 22n n i i i i X nX nX nX X n μμ==-++-+∑∑ = 221 1 2n n i i i i X X n μμ==-+∑∑ 左边等于右边,结论得证。 (2) 等式的左边= 22 11 2n n i i i i X X X nX ==-+∑∑=221 n i i X nX =-∑ 等式的右边= 221 n i i X nX =-∑ 左边等于右边,结论得证。 1.7 (1)由11n n i i X X n ==∑ 及 22 1 1()n n i n i S X X n ==-∑ 有左边=1111111111()1111 n n n n n i i n i i i i X X X X X X n n n n ++++=====+=+++++∑∑∑ 111 ()111 n n n n n nX X X X X n n n ++= +=+-+++=右边 左边等于右边,结论得证。 (2)由 左边=12 21 11 1()1n n i n i S X X n +++==-+∑ 121111[()]11 n i n n n i X X X X n n ++==---++∑ 121111[()()]11 n i n n n i X X X X n n ++==---++∑ 12 2112 1121[()()()()]11(1) n i n i n n n n n i X X X X X X X X n n n +++==----+-+++∑

2018年数理统计大作业题目和答案--0348

2018年数理统计大作业题目和答案--0348

1、设总体X 服从正态分布),(2 σμN ,其中μ已知,2 σ 未知,n X X X ,,,2 1 为其样本,2≥n ,则下列说法中正 确的是( )。 (A )∑=-n i i X n 1 2 2 ) (μσ是统计量 (B )∑=n i i X n 1 22 σ是统计量 (C )∑=--n i i X n 1 2 2 ) (1μσ是统计量 (D )∑=n i i X n 1 2μ 是统计量 2、设两独立随机变量)1,0(~N X ,) 9(~2 χY ,则Y X 3服从 ( )。 )(A ) 1,0(N )(B ) 3(t )(C ) 9(t )(D ) 9,1(F 3、设两独立随机变量)1,0(~N X ,2 ~(16) Y χ,则Y 服 从( )。 )(A )1,0(N )(B (4) t )(C (16) t )(D (1,4) F 4、设n X X ,,1 是来自总体X 的样本,且μ=EX ,则下 列是μ的无偏估计的是( ). ) (A ∑-=-1 1 1 1 n i i X n )(B ∑=-n i i X n 1 11 )(C ∑=n i i X n 2 1 )(D ∑-=1 1 1n i i X n 5、设4 3 2 1 ,,,X X X X 是总体2 (0,)N σ的样本,2 σ未知,则下列随机变量是统计量的是( ).

() (1) D t n- 10、设 1,, n X X ???为来自正态总体2 (,) Nμσ的一个样本,μ,2σ未知。则2σ的置信度为1α-的区间估计的枢轴量为()。 (A) ()2 1 2 n i i Xμ σ = - ∑ (B) ()2 1 2 n i i Xμ σ = - ∑ (C) () ∑ = - n i i X X 1 2 2 1 σ (D) ()2 1 2 n i i X X σ = -∑ 11、在假设检验中,下列说法正确的是()。 (A) 如果原假设是正确的,但作出的决策是接受备择假设,则犯了第一类错误; (B) 如果备择假设是正确的,但作出的决策是拒绝备择假设,则犯了第一类错误; (C) 第一类错误和第二类错误同时都要犯; (D) 如果原假设是错误的,但作出的决策是接受备择假设,则犯了第二类错误。 12、对总体2 ~(,) X Nμσ的均值μ和作区间估计,得到置信度为95%的置信区 间,意义是指这个区间()。 (A)平均含总体95%的值(B)平 均含样本95%的值

华科数据结构实验报告

课程实验报告课程名称:数据结构 专业班级:计算机科学与技术13xx班 学号: 姓名: 指导教师: 报告日期:2015

计算机科学与技术学院

目录 1 课程实验概述 (1) 2 实验一基于顺序结构的线性表实现 2.1 问题描述 (2) 2.2 系统设计 (2) 2.3 系统实现 (3) 2.4 效率分析 (12) 3 实验二基于链式结构的线性表实现 3.1 问题描述 (14) 3.2 系统设计 (14) 3.3 系统实现 (15) 3.4 效率分析 (25) 4 实验总结与评价 (27)

1 课程实验概述 1.1 加深对数据结构和算法的理解,进一步提高编程能力; 1.2 培养和提高学生分析问题与解决问题的综合能力; 1.3 整理资料,撰写规范的实验报告。

2 实验一基于顺序结构的线性表实现 2.1 问题描述 基于顺序存储结构,实现线性表的基本的常见的运算。 2.2 系统设计 2.2.1系统包括15个功能,分别为: 1.Creatlist 2.DestroyList 3.ClearList 4.ListEmpty 5.ListLength 6.GetElem 7.LocatElem 8.PriorElem 9.NextElem 10.ListInsert 11.ListDelete 12.ListTrabverse 13.Save the List 14.Load the List 15.Add elem to List 2.2.2系统数据物理结构类型为顺序结构,存储的数据类型为结构体: typedef struct { int num; }ElemType;//定义数据类型 2.2.3顺序表应声明一个头结点: typedef struct { ElemType *elem ; //存储顺序表开始的头指针 int listsize; //存储当前顺序表总长度 int length; //存储当前元素的总个数,且当length为-1值时,表示还未被初

华中科技大学数理统计第二次作业

学院:机械工程学院 1、收集到26家保险公司人员构成的数据,现希望对目前保险公司从业人员受高等教育的程度和年轻化的程度进行推断,具体来说就是推断具有高等教育水平的员工平均比例是否低于80%,35岁以下的年轻人的平均比例是否为0.5。(数据见练习2数据.xls —练习2.1) 解:希望通过分析这26家保险公司人员构成的数据,研究目前保险公司从业人员受高等教育的程度和年轻化的程度。 (1)推断高等教育水平的员工平均比例是否低于80% 设原假设:保险公司具有高等教育水平的员工比例平均值不低于0.8,即H 0: μ=μ0≥0.8 备择假设:H 1:μ<0.8 n=26,属于小样本,由于σ2 未知,选用t 检验,检验统计量 T = ,取α=0.05 计算的x =0.729273 ,s 2=0.039274 (1) t n ?≤--, 1.784t = =- 查t 检验分布表知临界值t α(26-1)=-1.7081 显然,t=-1.784<-t α(25)=-1.7081,因此在α=0.05 的水平上拒绝原假设,选择备择假设 结论:保险公司具有高等教育水平的员工比例平均值低于0.8 (2)推断35 岁以下的年轻人的平均比例是否为0.5 设原假设:年轻人比例的平均值与0.5 无显著性差异,即H 0: μ=μ0=0.5 备择假设H 1:μ≠0.5. n=26,属于小样本,由于σ2 未知,选用t 检验,检验统计量 T = ,取α=0.05 计算的x =0.713875 ,s 2=0.022705 /2(1)t n ?≥- , 7.097t = = 查表知α=0.05 的双尾t 检验临界值t α/2(25)=2.0595。故超出[-2.0595,2.0595]的值均在拒 绝域内 由于t=7.097不在拒绝域[-2.0595,2.0595]范围内,因此在α=0.05 的水平上拒绝原假设,选择备择假设 结论:保险公司35 岁以下年轻人比例平均值不等于0.5 2、练习1中保险公司的类别分为:1. 全国性公司;2. 区域性公司;3. 外资和中外合资公司。试分析公司类别1与3的人员构成中,具有高等教育水平的员工比例的均值是否存在显著性的差异。(数据见练习2数据.xls —练习2.1) 解:设原假设H 0:μ1-μ2=0,即公司类别1 与3 具有高等教育水平的员工比例均值无显著

相关文档
最新文档