数据分析测试题

2017-2018学年度莘县翰林学校

数学试卷

满分120分;考试时间:100分钟

一、单选题36分

1.某体校要从四名射击选手中选拔一名参加省体育运动会,选拔赛中每名选手连续射靶10次,他们各自的平均成绩x及其方差S2如下表所示:

如果要选出一名成绩高且发挥稳定的选手参赛,则应选择的选手是()

A. 甲

B. 乙

C. 丙

D. 丁

2.某单位若干名职工参加普法知识竞赛,将成绩制成如图所示的扇形统计图和条形统计图,根据图中提供的信息,这些职工成绩的中位数和众数分别是()

A. 94分,96分

B. 96分,96分

C. 96分,98分

D. 96分,94分3.某校有25名同学参加某比赛,预赛成绩各不相同,取前13名参加决赛,其中一名同学已经知道自己的成绩,能否进入决赛,只需要再知道这25名同学成绩的( )

A. 最高分

B. 平均数

C. 中位数

D. 方差

4.下列说法正确的是( )

A. 中位数就是一组数据中最中间的一个数

B. 8,9,9,10,10,11这组数据的众数是10

C. 如果x1,x2,x3的方差是1,那么2x1,2x2,2x3的方差是4

D. 为了了解生产的一批节能灯的使用寿命,应选择全面调查

5.已知一组数据a,b,c的平均数为5,方差为4,那么数据a﹣2,b﹣2,c﹣2的平均数和方差分别是()

A. 3,2

B. 3,4

C. 5,2

D. 5,4

6.为了帮助本市一名患“白血病”的高中生,某班15名同学积极捐款,他们捐款数额如下表:

关于这15名同学所捐款的数额,下列说法正确的是()

A. 众数是100

B. 平均数是30

C. 极差是20

D. 中位数是20

7.九(2)班体育委员用划记法统计本班40名同学投掷实心球的成绩,结果如图所示:则这40名同学投掷实心球的成绩的众数和中位数分别是()

A. 8,8

B. 8,8.5

C. 9,8

D. 9,8.5

8.李老师为了了解学生暑期在家的阅读情况,随机调查了20名学生某一天的阅读小时数,具体情况统计如下:

阅读时间(小时) 2 2.5 3 3.5 4

学生人数(名) 1 2 8 6 3

则关于这20名学生阅读小时数的说法正确的是()

A. 众数是8

B. 中位数是3

C. 平均数是3

D. 方差是0.34

9.某区新教师招聘中,七位评委独立给出分数,得到一列数.若去掉一个最高分和一个最低分,得到一列新数,那么这两列数的相关统计量中,一定相等的是()A. 中位数 B. 众数 C. 方差 D. 平均数

10.下列说法正确的是()

A. 某种彩票的中奖机会是1%,则买100张这种彩票一定会中奖.

B. 为了解全国中学生的睡眠情况,应该采用普查的方式.

C. 若甲数据的方差s 甲 2 =0.05,乙数据的方差s 乙2 =0.1,则乙数据比甲数据稳定.

D. 一组数据3,5,4,5,5,6,10的众数和中位数都是5.

11.一组数据:a-1,a,a, a+1,若添加一个数据a,下列说法错误的是( ) A. 平均数不变 B. 中位数不变 C. 众数不变 D. 方差不变

12.若一组数据2,3,4,5,x的方差与另一组数据25,26,27,28,29的方差相等,则x的值为()

A. 1

B. 6

C. 1或6

D. 5或6

二、填空题40分

13.甲乙两种水稻试验品中连续5年的平均单位面积产量如下(单位:吨/公顷)

经计算,x

甲=10,x

=10,试根据这组数据估计_____中水稻品种的产量比较稳定.

14.某校六个绿化小组一天植树的棵树如下:10,11,12,13,8,x.若这组数据的平均数是11,则这组数据的众数是_____.

15.一组数据的方差为S2,将该数据每一个数据,都乘以4,所得到的一组新数据的方差是_________。

16.已知一组数据:17,18,20,17,x,18中唯一的众数是18,则这组数据的平均数为_________.

17.小明有五位好友,他们的年龄(单位:岁)分别是15,15,16,17,17,其方差是0.8,则三年后这五位好友年龄的方差是

________.

18.已知一组数据1,2,3,4,5,x x x x x 的平均数是2,方差是

1

3

,那么另一组数据312345X 2,3X 2,3X 2,3X 2,3X 2-----的平均数和方差分别是________________ 19.第24届冬季奥林匹克运动会,将于2022年2月在北京市和张家口市联合举行.某校寒假期间组织部分滑雪爱好者参加冬令营集训.训练期间,冬令营的同学们都参加了“单板滑雪”这个项目40次的训练测试,每次测试成绩分别为5分,4分,3分,2分,1分五档. 甲乙两位同学在这个项目的测试成绩统计结果如图所示.

根据上图判断,甲同学测试成绩的众数是___;乙同学测试成绩的中位数是___;甲乙两位同学中单板滑雪成绩更稳定的是___.

20.甲、乙两人在相同情况下各射靶10次,环数的方差分别是2

S

甲=1.4,

2S 乙=1.2,

则射击稳定性高的是______.

班级 平均分 众数 方差 甲 101 90 2.65 乙

102

87

2.38

你认为哪一个班的成绩更好一些?并说明理由. 答:_____班(填“甲”或“乙”),理由是_______________________________. 22.小明用S 2

=

110

[(x 1﹣3)2+(x 2﹣3)2+…+(x 10﹣3)2

]计算一组数据的方差,那么x 1+x 2+x 3+…+x 10=_____. 三、解答题44分

23.某公司共25名员工,下表是他们月收入的资料. 月收入/元 45000 18000 10000 5500 4800 3400 3000 2200 人数

1

1

1

3

6

1

11

1

(1)该公司员工月收入的中位数是 元,众数是 元.

(2)根据上表,可以算得该公司员工月收入的平均数为6276元.你认为用平均数、中位数和众数中的哪一个反映该公司全体员工月收入水平较为合适?说明理由. 24.某市举行一次少年滑冰比赛,各年龄组的参赛人数如下表所示: 年龄组

13岁

14岁

15岁

16岁

参赛人数5191214

(1)求全体参赛选手年龄的众数、中位数;

(2)小明说,他所在年龄组的参赛人数占全体参赛人数的28%.你认为小明是哪个年龄组的选手?请说明理由.

25.我市某中学为了深入学习社会主义核心价值观,特对本校部分学生(随机抽样)进行了一次相关知识的测试(成绩分为A、B、C、D、E五个组,x表示测试成绩),通过对测试成绩的分析,得到如图所示的两幅不完整的统计图,请你根据图中提供的信息解答以下问题.

A组:90≤x≤100 B组:80≤x<90 C组:70≤x<80 D组:60≤x<70 E 组:x<60

(1)参加调查测试的学生共有人;请将两幅统计图补充完整.

(2)本次调查测试成绩的中位数落在组内.

(3)本次调查测试成绩在80分以上(含80分)为优秀,该中学共有3000人,请估计全校测试成绩为优秀的学生有多少人?

26.为了让同学们了解自己的体育水平,初二1班的体育康老师对全班45名学生进行了一次体育模拟测试(得分均为整数)成绩满分为10分,成绩达到9分以上(包含9分)为优秀,成绩达到6分以上(包含6分)为合格,1班的体育委员根据这次测试成绩,制作了统计图和分析表如下:

平均分方差中位数众数合格率优秀率

男生 2 8 7 95% 40%

女生 7.92 1.99 8 96% 36%

根据以上信息,解答下列问题:

(1)在这次测试中,该班女生得10分的人数为4人,则这个班共有女生______人;(2)补全初二1班男生体育模拟测试成绩统计图,并把相应的数据标注在统计图上;(3)补全初二1班体育模拟测试成绩分析表;

(4)你认为在这次体育测试中,1班的男生队、女生队哪个表现更突出一些?并写出一条支持你的看法的理由;

(5)体育康老师说,从整体看,1班的体育成绩在合格率方面基本达标,但在优秀率方面还不够理想,因此他希望全班同学继续加强体育锻炼,争取在期末考试中,全班的优秀率达到60%,若男生优秀人数再增加6人,则女生优秀人数再增加多少人才能完成康老师提出的目标?

参考答案

1.B

【解析】试题分析:根据平均成绩越好,成绩越好,可知乙、丙的平均成绩高;根据方差越小,成绩越稳定,可知乙的成绩最稳定,由此可知应选择选手B.

故选:B.

2.C

【解析】试题解析:总人数为6÷10%=60(人),

则94分的有60×20%=12(人),

98分的有60-6-12-15-9=18(人),

第30与31个数据都是96分,这些职工成绩的中位数是(96+96)÷2=96;

98分出现次数最多,故众数是98分.

故选C.

【点评】本题考查了统计图及中位数的定义:将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果这组数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.解题的关键是从统计图中获取正确的信息并求出各个小组的人数.

3.C

【解析】根据中位数的意义可知,该生能否进入决赛,只需要再知道这25名同学成绩的中位数即可.

【点睛】解决这类题的关键是能够正确理解平均数、中位数、方差的意义.

4.C

【解析】中位数是一组数据从大到小或从小到大排列,最中间的数据或最中间的两个数据的平均值是中位数,故A错误;8,9,9,10,10,11这组数据的9和10出现的次数最多,众数是9和10,故B错误;在一组数据中,如果每一个数据都扩大为原来的两倍,那么平方后将扩大为原来的4倍,所以方差是原来的4倍,故C正确;为了了解生产的一批节能灯的使用寿命,应选择抽样调查,故D错误.

故选C.

5.B

【解析】试题分析:平均数为(a?2 + b?2 + c?2 )=(3×5-6)=3;原来的方差:

;新的方差:

,故选B.

考点:平均数;方差.

6.D

【解析】A、众数是20,故本选项错误;

B、平均数为26.67,故本选项错误;

C、极差是95,故本选项错误;

D、中位数是20,故本选项正确;

故选D.

7.C

.

【解析】试题解析:投掷实心球的成绩最多的是9,共有14人,

所以,众数是9,

这40名同学投掷实心球的成绩从小到大排列,第20,21人的成绩是8,

所以中位数是8.

故选C.

【点睛】本题考查了中位数与众数,确定中位数的时候一定要先排好顺序,然后再根据奇数和偶数个来确定中位数,如果数据有奇数个,则正中间的数字即为所求,如果是偶数个则找中间两位数的平均数,中位数有时不一定是这组数据的数;众数是出现次数最多的数据,众数有时不止一个.

8.B

【解析】试题分析:A、根据众数的定义找出出现次数最多的数;B、根据中位数的定义将这组数据从小到大重新排列,求出最中间的2个数的平均数,即可得出中位数;C、根据加权平均数公式代入计算可得;D、根据方差公式计算即可.

A、由统计表得:众数为3,不是8,所以此选项不正确;

B、随机调查了20名学生,所以中位数是第10个和第11个学生的阅读小时数,都是3,故中位数是3,所以此选项正确;

C、平均数=,所以此选项不正确;

D、S2=×[(2﹣3.35)2+2(2.5﹣3.35)2+8(3﹣3.35)2+6(3.5﹣3.35)2+3(4﹣3.35)

2]==0.2825,所以此选项不正确;

故选B.

考点:方差;加权平均数;中位数;众数.

9.A

【解析】试题解析:去掉一个最高分和一个最低分一定会影响到平均数、极差,可能会影响到众数,一定不会影响到中位数,

故选A.

10.D

【解析】A选项:某种彩票的中奖机会是1%,则买100张这种彩票中奖的可能性很大,但不是一定中奖,故本选项错误;

B选项:为了解全国中学生的睡眠情况,应该采用抽样调查的方式,故本选项错误;

C选项:方差反映了一组数据的波动情况,方差越小数据越稳定,故本选项错误;

D选项:一组数据3,5,4,5,5,6,10的众数和中位数都是5,故本选项正确;

故选D.

11.D

【解析】一组数据:a?1,a,a,a+1,平均数为a,中位数为a,众数为a,

若添加一个数据a后,平均数为a,中位数为a,众数为a,但方差改变,

故选D

12.C

【解析】根据数据x1,x2,…x n与数据x1+a,x2+a,…x n+a的方差相同这个结论即可解决问题.

解:∵一组数据2,2,4,5,x的方差与另一组数据5,6,7,8,9的方差相等,

∴这组数据可能是2,3,4,5,6或1,2,3,4,5,

∴x=1或6,

故选C.

“点睛”本题考查方差、平均数等知识,解题的关键领域结论:数据x 1,x 2,…x n 与数据x 1+a ,x 2+a ,…x n +a 的方差相同解决问题,属于中考常考题型.

13.甲

【解析】根据极差的意义,易得甲品种的极差为10.29.80.4-= ;乙品种的极差为10.89.4 1.4-= .故得甲中水稻品种的产量比较稳定.

14.12 【解析】试题解析:由题意可得101112138116x +++++= ,解得12x = ,所以这组数据为

10,11,12,13,8,12,显然众数为12.

点睛:众数是一组数据中出现次数最多的数值.

15.16s 2

【解析】设原数据组中的数据为: 12n x x x 、、、,其平均数为x ,

则S 2=()()()222121n x x x x x x n ??-+-+-??

. 那么新数据组为12444n x x x 、

、、,新数据组的平均数为4x , ∴新数据组的方差为:

()()()22212144444n x x x x x x n ??-+-+-?

? =()()()222121161616n x x x x x x n ??-+-+-?

? =()()()22212116n x x x x x x n ???-+-+-?

? =16S 2.

点睛:当一组数据中每个数据都扩大为原来的n 倍后,所得新数据组的方差扩大为原数据组

方差的2n 倍. 16.18

【解析】∵17,18,20,17,x ,18中唯一的众数是18,

∴x=18,

∴则这组数据的平均数为(17+18+20+17+18+18)÷6=18;

故答案为:18.

17.0.8

【解析】三年后这五名队员的年龄分别为20,18,19,18,20,

平均年龄为(20+18+19+18+20) ÷5=19,

方差为:

∴三年后这五名队员年龄的方差为0.8.

18.4,3

【解析】试题解析:∵据x 1,x 2,x 3,x 4,x 5的平均数是2, ∴12345++++=25x x x x x , ∵数据x 1,x 2,x 3,x 4,x 5的平均数是2,方差是13, ∴15 [(x 1-2)2+(x 2-2)2+[(x 3-2)2+(x 4

-2)2+(x 5-2)2

]= 13①; ∴3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2,的平均数是

=()()()()()

123453-23-23-23-23-25

x x x x x ++++ , =3×12345++++5

x x x x x -2=4. ∴15

[(3x 1-2-4)2+(3x 2-2-4)2+(3x 3-2-4)2+(3x 4-2-4)2+(3x 5-2-4)2] =15

[9(x 1-2)2+9(x 2-2)2+9(x 3-2)2+9(x 4-2)2+9(x 5-2)2] =15

×9[(x 1-2)2+(x 2-2)2+[(x 3-2)2+(x 4-2)2+(x 5

-2)2]② 把①代入②得,方差是: 13×9=3. 19. 乙同学

【解析】 ∵甲同学3分出现的次数最多,∴甲同学测试成绩的众数是3;∵乙同学第20和21次的成绩都是3,∴乙同学测试成绩的中位数是3;

.

.∴乙同学稳定.

20.乙

【解析】因为2S 甲=1.4>2

S 乙=1.2,方差小的为乙,

所以成绩比较稳定的是乙.

21. 乙 乙班的平均成绩较高,方差较小,成绩相对稳定(理由包含表格所给信息,且支

撑结论)

.

【解析】乙班成绩好,因为乙班的平均成绩较高,方差较小,成绩相对稳定. 22.30

【解析】试题解析:∵S2=

1

10

[(x1-3)2+(x2-3)2+…+(x10-3)3],

∴平均数为3,共10个数据,

∴x1+x2+x3+…+x10=10×3=30.

23.(1)3400;3000;(2)用中位数或众数来描述更为恰当.理由见解析.

【解析】试题分析:(1)根据大小排列确定中间一个或两个的平均数,得到中位数,然后找到出现最多的为众数;

(2)根据表格信息,结合中位数、平均数、众数说明即可.

试题解析:(1)3400,3000.

(2)本题答案不惟一,下列解法供参考,例如,

用中位数反映该公司全体员工月收入水平较为合适,在这组数据中有差异较大的数据,这会导致平均数较大.该公司员工月收入的中位数是3400元,这说明除去收入为3400元的员工,一半员工收入高于3400元,另一半员工收入低于3400元.因此,利用中位数可以更好地反映这组数据的集中趋势.

考点:1、中位数,2、众数

24.(1)众数是:14岁;中位数是:15岁.(2)小明是16岁年龄组的选手.

【解析】(1)众数是:14岁;中位数是:15岁.

(2)解法一:∵全体参赛选手的人数为:5+19+12+14 =50名

又∵50×28%=14(名)

∴小明是16岁年龄组的选手.

解法二:∵全体参赛选手的人数为:5+19+12+14=50名

又∵16岁年龄组的选手有14名,

而14÷50=28%

∴小明是16岁年龄组的选手.

25.(1)400(2)B(3)1650

【解析】试题分析:(1)根据D类人数是60,所占的百分比是15%,据此即可求得总人数;(2)利用中位数的定义,就是大小处于中间位置的数即可作判断.

(3)利用总人数乘以对应的百分比即可求解.

试题解析:(1)设参加调查测试的学生共有x人.

由题意=15%,

∴x=400.

统计图补充如下,

.

(2)∵A组有100人,B组有120人,C组有80人,D组有60人,E组有40人,

∴400的最中间的在B组,

∴中位数在B组.

(3)全校测试成绩为优秀的学生有3000×(25%+30%)=1650人.

【点睛】本题考查的是条形统计图和扇形统计图的综合运用,读懂统计图,从不同的统计图中得到必要的信息是解决问题的关键.条形统计图能清楚地表示出每个项目的数据;扇形统计图直接反映部分占总体的百分比大小.

26.(1)25;(2)6,补图见解析;(3) 7.9,8;(4) 女生队表现更突出一些,理由见解析;(5)4.【解析】试题分析:(1)根据扇形统计图知,女生得10分的有4人,占总人数的16%,则可求得该班女生人数;(2)求出男生得7分的人数即可齐全统计图;(3)根据扇形统计图,条形统计图得到男生的平均分,女生的众数;(4)可以从不同的角度来看,本题以平均数或者众数为标准比较合适;(5)利用等式全班优秀人数-男生优秀人数=女生优秀人数求解。试题解析:(1)∵在这次测试中,该班女生得10分的人数为4人,

∴这个班共有女生:4÷16%=25(人),

(2)男生得7分的人数为:45﹣25﹣1﹣2﹣3﹣5﹣3=6,补全的统计图略

(3)男生得平均分是: =7.9(分),女生的众数是:8,故答案为:7.9,8;

(4)女生队表现更突出一些,理由:从众数看,女生好于男生;

(5)由题意可得,女生需增加的人数为:45×60%﹣(20×40%+6)﹣(25×36%)=4(人),即女生优秀人数再增加4人才能完成康老师提出的目标.

如有侵权请联系告知删除,感谢你们的配合!

精品

【分析】数据的分析单元测试题含答案供参考

【关键字】分析 第二十章《数据的分析》单元测试题 一、选择题) 1.为了了解参加某运动会的200名运动员的年龄情况,从中抽查了20名运动员的年龄,就这个问题来说,下面说法正确的是() A.200名运动员是总体B.每个运动员是总体 C.20名运动员是所抽取的一个样本D.样本容量是20 2.一城市准备选购一千株高度大约为的某种风景树来进行街道绿化,?有四个苗圃生产基地投标(单株树的价格都一样).?采购小组从四个苗圃中都任意抽查了20株树苗的高度,得到的数据如下: A.甲苗圃的树苗B.乙苗圃的树苗; C.丙苗圃的树苗D.丁苗圃的树苗3.将一组数据中的每一个数减去50后,所得新的一组数据的平均数是2,?则原来那组数据的平均数是() A.50 B..48 D.2 4.一个射手连续射靶22次,其中3次射中10环,7次射中9环,9次射中8环,3次射中7环.则射中环数的中位数和众数分别为() A.8,9 B.8,.8.5,8 D.8.5,9 5.为鼓励市民珍惜每一滴水,某居委会表扬了100个节约用水模范户,8月份节约用水的情况如下表: 那么,8月份这100() A.1.5t B.1.20t C.1.05t D.1t 6.已知一组数据-2,-2,3,-2,-x,-1的平均数是-0.5,?那么这组数据的众数与中位数分别是() A.-2和3 B.-2和.-2和-1 D.-2和-1.5 7.方差为2的是() A.1,2,3,4,5 B.0,1,2,3,5 C.2,2,2,2,2 D.2,2,2,3,3 8.甲、乙两班举行电脑汉字输入速度比赛,?参赛学生每分钟输入汉字的个数经统计计算后结果如下表: (1)甲、乙两班学生成绩的平均水平相同; (2)乙班优秀的人数多于甲班优秀的人数;(每分钟输入汉字≥150个为优秀) (3)甲班成绩的波动情况比乙班成绩的波动小

《数据分析》练习题

《数据分析》练习题 1.一个地区某月前两周从星期一到星期五各天的最低气温依次是(单位:℃):x 1, x 2, x 3, x 4, x 5和x 1+1, x 2+2, x 3+3, x 4+4, x 5+5,若第一周这五天的平均最低气温为7℃,则第二周这五天的平均最低气温为 。 2.有10个数据的平均数为12,另有20个数据的平均数为15,那么所有这30个数据的平均数是( ) A .12 B. 15 C. 1 3.5 D. 14 3.一组数据8,8,x ,6的众数与平均数相同,那么这组数据的中位数是 ( ) A. 6 B. 8 C.7 D. 10 4.某校在一次考试中,甲乙两班学生的数学成绩统计如下: 请根据表格提供的信息回答下列问题: (1)甲班众数为 分,乙班众数为 分,从众数看成绩较好的是 班; (2)甲班的中位数是 分,乙班的中位数是 分; (3)若成绩在80分以上为优秀,则成绩较好的是 班;、 (4)甲班的平均成绩是 分,乙班的平均成绩是 分,从平均分看成绩较好的是 班. 5.在方差的计算公式 ()()()222 21210120202010 s x x x ??= -+-+???+-??中, 数字10和20分别表示的意义可以是( ) A .数据的个数和方差 B .平均数和数据的个数 C .数据的个数和平均数 D .数据组的方差和平均数 6..如果将所给定的数据组中的每个数都减去一个非零常数,那么该数组的 ( ) A.平均数改变,方差不变 B.平均数改变,方差改变 C.平均输不变,方差改变 D.平均数不变,方差不变 7..已知7,4,3,,321x x x 的平均数是6,则_____________321=++x x x . 8..已知一组数据-3,-2,1,3,6,x 的中位数为1,则其方差为 . 9..已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是2,方差是 3 1 ,那么另一组数据3x 1-2,3x 2-2,3x 3-2, 3x 4-2,3x 5-2的平均数是和方差分别是 . 10..关于一组数据的平均数、中位数、众数,下列说法中正确的是( ) A.平均数一定是这组数中的某个数 B. 中位数一定是这组数中的某个数 C.众数一定是这组数中的某个数 D.以上说法都不对 分数 50 60 70 80 90 100 人数 甲 1 6 12 11 15 5 乙 3 5 15 3 13 11

数据分析基础测试题含答案

数据分析基础测试题含答案 一、选择题 1.已知一组数据a,b,c的平均数为5,方差为4,那么数据a﹣2,b﹣2,c﹣2的平均数和方差分别是.() A.3,2 B.3,4 C.5,2 D.5,4 【答案】B 【解析】 试题分析:平均数为(a?2 + b?2 + c?2 )=(3×5-6)=3;原来的方差: ;新的方差: ,故选 B. 考点:平均数;方差. 2.甲、乙、丙三个不同品种的苹果树在同一地区进行对比试验,从每个品种的苹果树中随机各抽取10棵,对它们的产量进行统计,绘制统计表如下: 品种甲乙丙 平均产量/(千克/棵)9090 方差10.224.88.5 若从这三个品种中选择一个在该地区推广,则应选择的品种是() A.甲B.乙C.丙D.甲、乙中任选一个【答案】A 【解析】 【分析】 根据平均数、方差等数据的进行判断即可. 【详解】 根据平均数、方差等数据的比较可以得出甲品种更适在该地区推广. 故选:A 【点睛】 本题考查了平均数、方差,掌握平均数、方差的定义是解题的关键. 3.某射击俱乐部将11名成员在某次射击训练中取得的成绩制成如图所示的条形统计图,由图可知,11名成员射击成绩的众数和中位数分别是()

A.8,9 B.8,8 C.8,10 D.9,8 【答案】B 【解析】 分析:中位数,因图中是按从小到大的顺序排列的,所以只要找出最中间的一个数(或最中间的两个数)即可,本题是最中间的那个数;对于众数可由条形统计图中出现频数最大或条形最高的数据写出. 详解:由条形统计图知8环的人数最多, 所以众数为8环, 由于共有11个数据, 所以中位数为第6个数据,即中位数为8环, 故选B. 点睛:本题主要考查了确定一组数据的中位数和众数的能力.注意找中位数的时候一定要先排好顺序,然后再根据奇数和偶数个来确定中位数,如果数据有奇数个,则正中间的数字即为所求.如果是偶数个,则找中间两个数的平均数. 4.已知一组数据a、b、c的平均数为5,方差为4,那么数据a+2、b+2、c+2的平均数和方差分别为() A.7,6 B.7,4 C.5,4 D.以上都不对 【答案】B 【解析】 【分析】 根据数据a,b,c的平均数为5可知a+b+c=5×3,据此可得出1 3 (-2+b-2+c-2)的值;再由 方差为4可得出数据a-2,b-2,c-2的方差. 【详解】 解:∵数据a,b,c的平均数为5,∴a+b+c=5×3=15, ∴1 3 (a-2+b-2+c-2)=3, ∴数据a-2,b-2,c-2的平均数是3;∵数据a,b,c的方差为4, ∴1 3 [(a-5)2+(b-5)2+(c-5)2]=4,

数据分析期末试题及答案

数据分析期末试题及答案 一、人口现状.sav数据中是1992年亚洲各国家和地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)的数据,试用多元回归分析的方法分析各国家和地区平均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的关系。(25分) 解: 1.通过分别绘制地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间散点图初步分析他们之间的关系 上图是以人均GDP(x1)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系。尝试多种模型后采用曲线估计,得出 表示地区平均寿命(y)与人均GDP(x1)的对数有线性关系

上图是以成人识字率(x2)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间基本呈正线性关系。 上图是以疫苗接种率(x3)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系 。 x)为横轴,地区平均寿命(y)为纵轴的散点图,上图是以疫苗接种率(x3)的三次方(3 3 由图可知,他们之间呈正线性关系 所以可以采用如下的线性回归方法分析。

2.线性回归 先用强行进入的方式建立如下线性方程 设Y=β0+β1*(Xi1)+β2*Xi2+β3* X+εi i=1.2 (24) 3i 其中εi(i=1.2……22)相互独立,都服从正态分布N(0,σ^2)且假设其等于方差 R值为0.952,大于0.8,表示两变量间有较强的线性关系。且表示平均寿命(y)的95.2%的信息能由人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)一起表示出来。 建立总体性的假设检验 提出假设检验H0:β1=β2=β3=0,H1,:其中至少有一个非零 得如下方差分析表 上表是方差分析SAS输出结果。由表知,采用的是F分布,F=58.190,对应的检验概率P值是0.000.,小于显著性水平0.05,拒绝原假设,表示总体性假设检验通过了,平均寿命(y)与人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间有高度显著的的线性回归关系。

深圳市高级中学二年级数学下册第一单元《数据收集整理》单元测试题(含答案解析)

深圳市高级中学二年级数学下册第一单元《数据收集整理》单元测试题(含答 案解析) 一、选择题 1.李兵和王芳做“石头、剪刀、布”的游戏。下面是李兵画“正”字记录的自己游戏的结果。那么王芳赢了()次。 A. 14 B. 6 C. 8 2.下面是三(1)班男生1分钟跳绳测试的成绩统计图。男生达标成绩是110个,达标的人数是()人。 A. 25 B. 20 C. 18 3.选一选 种类连环画故事书科技书其他 人数(人)181284 A.连环画 B.故事书 C.科技书 D.其他 (2)喜欢()的人数最少。 A.连环画 B.故事书 C.科技书 D.其他 (3)喜欢故事书的比喜欢连环画的少()人。 A.10 B.6 C.4 D.8 (4)喜欢连环画的和喜欢科技书的一共()人。 A.30 B.20

C.26 D.12 4.心心幼儿园新进了一批玩具。 玩具 个数(个)812610 心心幼儿园新进的玩具一共有()个。 A. 20 B. 36 C. 18 D. 26 5.某班24名男生参加50米跑测试成绩如下图: 从上图中可以看出,得()的人最多。 A. 优秀 B. 良好 C. 合格 D. 不合格6.学校有8个班参加了回收废报纸活动。第一天回收废报纸43千克;第二天回收废报纸38千克;第三天回收废报纸39千克。平均每天回收废报纸()千克。 A. 39 B. 40 C. 41 D. 42 7.要反映长沙市一周内每天的最高气温的数据情况,宜采用()。 A. 条形统计图 B. 扇形统计图 C. 统计表 D. 频数分布直方图 8.下图中三角形有几个?() A. 5个 B. 3个 C. 4个 9.2012年伦敦奥运会金牌情况统计表。 国家中国英国美国巴西 数量(块)38294612 A. 中国 B. 英国 C. 美国 D. 巴西10.喜欢( )小组的人数最少。

最新初中数学数据分析经典测试题附答案

最新初中数学数据分析经典测试题附答案 一、选择题 1.已知一组数据a,b,c的平均数为5,方差为4,那么数据a﹣2,b﹣2,c﹣2的平均数和方差分别是.() A.3,2 B.3,4 C.5,2 D.5,4 【答案】B 【解析】 试题分析:平均数为(a?2 + b?2 + c?2 )=(3×5-6)=3;原来的方差: ;新的方差: ,故选 B. 考点:平均数;方差. 2.已知一组数据a、b、c的平均数为5,方差为4,那么数据a+2、b+2、c+2的平均数和方差分别为() A.7,6 B.7,4 C.5,4 D.以上都不对 【答案】B 【解析】 【分析】 根据数据a,b,c的平均数为5可知a+b+c=5×3,据此可得出1 3 (-2+b-2+c-2)的值;再由 方差为4可得出数据a-2,b-2,c-2的方差. 【详解】 解:∵数据a,b,c的平均数为5,∴a+b+c=5×3=15, ∴1 3 (a-2+b-2+c-2)=3, ∴数据a-2,b-2,c-2的平均数是3;∵数据a,b,c的方差为4, ∴1 3 [(a-5)2+(b-5)2+(c-5)2]=4, ∴a-2,b-2,c-2的方差=1 3 [(a-2-3)2+(b-2-3)2+(c--2-3)2] = 1 3 [(a-5)2+(b-5)2+(c-5)2]=4, 故选B.【点睛】

本题考查了平均数、方差,熟练掌握平均数以及方差的计算公式是解题的关键. 3.对于一组统计数据:1,1,4,1,3,下列说法中错误的是() A.中位数是1 B.众数是1 C.平均数是1.5 D.方差是1.6 【答案】C 【解析】 【分析】 将数据从小到大排列,再根据中位数、众数、平均数及方差的定义依次计算可得答案.【详解】 解:将数据重新排列为:1、1、1、3、4, 则这组数据的中位数1,A选项正确; 众数是1,B选项正确; 平均数为11134 5 ++++ =2,C选项错误; 方差为1 5 ×[(1﹣2)2×3+(3﹣2)2+(4﹣2)2]=1.6,D选项正确; 故选:C. 【点睛】 本题主要考查中位数、众数、平均数及方差,解题的关键是掌握中位数、众数、平均数及方差的定义与计算公式. 4.2022年将在北京﹣﹣张家口举办冬季奥运会,很多学校为此开设了相关的课程,下表记录了某校4名同学短道速滑成绩的平均数x和方差S2,根据表中数据,要选一名成绩好又发挥稳定的运动员参加比赛,应选择() A.队员1 B.队员2 C.队员3 D.队员4 【答案】B 【解析】 【分析】 根据方差的意义先比较出4名同学短道速滑成绩的稳定性,再根据平均数的意义即可求出答案.

2020-2021八年级数学数据的分析单元测试题

一、选择题(每小题4分,共36分) 1、为了解我校八年级800名学生期中数学考试情况,从中抽取了200名学生的数学成绩进行统计.下列判断:①这种调查方式是抽样调查;②800名学生是总体;③每名学生的期中考试数学成绩是个体;④200名学生是总体的一个样本;⑤200名学生是样本容量.其中正确的判断有 ( ) A.1个 B.2个 C.3个 D.4个 2、人数相同的八年级甲、乙两班学生在同一次数学单元测试,班级平均分和方差如下:80==乙甲x x ,2402=甲 s ,1802=乙s ,则成绩较为稳定的班级是( ) A.甲班 B.乙班 C.两班成绩一样稳定 D.无法确定 3 这组数据的中位数和众数别是( ) A.24,25 B.24.5,25 C.25,24 D.23.5,24 4、在学校对学生进行的晨检体温测量中,学生甲连续10天的体温与36℃的上下波动数据为0.2,0.3,0.1,0.1,0,0.2,0.1,0.1,0, 0.1,则在这10天中该学生的体温波动数据中不正确的是( )

A.平均数为0.12 B.众数为0.1 C.中位数为 0.1 D. 方差为0.02 5、甲、乙、丙、丁四人的数学测验成绩分别为90分、90 分、x分、80分,若这组数据的众数与平均数恰好相等,则这组数据的中位数是() A.100分 B.95分 C.90分 D.85分 6、已知三年四班全班35人身高的算术平均数与中位数都是 150厘米,但后来发现其中有一位同学的身高登记错误,误将160厘米写成166厘米,正确的平均数为a厘米,中位数为b厘米关于平均数a的叙述,下列何者正确() A.大于158 B.小于158 C.等于158 D.无法确定 7、在上题中关于中位数b的叙述。下列何者正确() A.大于158 B.小于158 C.等于158 D.无法确定 8、已知一组数据1、2、y的平均数为4,那么() A.y=7 B.y=8 C.y=9 D.y=10 9、若一组数据a1,a2,…,a n的方差是5,则一组新数据2a1,2a2,…,2a n的方差是() A.5 B.10 C.20 D.50 二、填空题(每空3分,共45分) 10、数学期末总评成绩由作业分数,课堂参与分数,期考 分数三部分组成,并按3:3:4的比例确定。已知小明的期考80分,作业90分,课堂参与85分,则他的总评成绩为________

数据分析笔试题

数据分析笔试题 一、编程题(每小题20分)(四道题任意选择其中三道) 有一个计费表表名jifei 字段如下:phone(8位的电话号码),month(月份),expenses (月消费,费用为0表明该月没有产生费用) 下面是该表的一条记录:64262631,201011,30.6 这条记录的含义就是64262631的号码在2010年11月份产生了30.6元的话费。 按照要求写出满足下列条件的sql语句: 1、查找2010年6、7、8月有话费产生但9、10月没有使用并(6、7、8月话费均在51-100 元之间的用户。 2、查找2010年以来(截止到10月31日)所有后四位尾数符合AABB或者ABAB或者AAAA 的电话号码。(A、B 分别代表1—9中任意的一个数字) 3、删除jifei表中所有10月份出现的两条相同记录中的其中一条记录。

4、查询所有9月份、10月份月均使用金额在30元以上的用户号码(结果不能出现重复) 二、逻辑思维题(每小题10分)须写出简要计算过程和结果。 1、某人卖掉了两张面值为60元的电话卡,均是60元的价格成交的。其中一张赚了20%, 另一张赔了20%,问他总体是盈利还是亏损,盈/亏多少? 2、有个农场主雇了两个小工为他种小麦,其中A是一个耕地能手,但不擅长播种;而B 耕地很不熟练,但却是播种的能手。农场主决定种10亩地的小麦,让他俩各包一半,于是A从东头开始耕地,B从西头开始耕。A耕地一亩用20分钟,B却用40分钟,可是B播种的速度却比A快3倍。耕播结束后,庄园主根据他们的工作量给了他俩600元工钱。他俩怎样分才合理呢? 3、1 11 21 1211 111221 下一行是什么? 4、烧一根不均匀的绳,从头烧到尾总共需要1个小时。现在有若干条材质相同的绳子,问如何用烧绳的方法来计时一个小时十五分钟呢?(绳子分别为A 、B、C、D、E、F 。。。。。来代替)

数据分析专项训练及解析答案

数据分析专项训练及解析答案 一、选择题 1.分析题中数据,将15名运动员的成绩按从小到大的顺序依次排列,处在中间位置的一个数即为运动员跳高成绩的中位数; 2.对于一组统计数据:1,1,4,1,3,下列说法中错误的是() A.中位数是1 B.众数是1 C.平均数是1.5 D.方差是1.6 【答案】C 【解析】 【分析】 将数据从小到大排列,再根据中位数、众数、平均数及方差的定义依次计算可得答案.【详解】 解:将数据重新排列为:1、1、1、3、4, 则这组数据的中位数1,A选项正确; 众数是1,B选项正确; 平均数为11134 5 ++++ =2,C选项错误; 方差为1 5 ×[(1﹣2)2×3+(3﹣2)2+(4﹣2)2]=1.6,D选项正确; 故选:C. 【点睛】 本题主要考查中位数、众数、平均数及方差,解题的关键是掌握中位数、众数、平均数及方差的定义与计算公式. 3.有甲、乙两种糖果,原价分别为每千克a元和b元.根据调查,将两种糖果按甲种糖果x千克与乙种糖果y千克的比例混合,取得了较好的销售效果.现在糖果价格有了调整:甲种糖果单价下降15%,乙种糖果单价上涨20%,但按原比例混合的糖果单价恰好不 变,则x y 等于() A.3 4 a b B. 4 3 a b C. 3 4 b a D. 4 3 b a 【答案】D 【解析】 【分析】 根据已知条件表示出价格变化前后两种糖果的平均价格,进而得出等式求出即可.【详解】 解:∵甲、乙两种糖果,原价分别为每千克a元和b元, 两种糖果按甲种糖果x千克与乙种糖果y千克的比例混合,

∴两种糖果的平均价格为:ax by x y + + , ∵甲种糖果单价下降15%,乙种糖果单价上涨20%, ∴两种糖果的平均价格为: 1520 (1)(1) 100100 a x b y x y -?++ + , ∵按原比例混合的糖果单价恰好不变, ∴ax by x y + + = 1520 (1)(1) 100100 a x b y x y -?++ + , 整理,得15ax=20by ∴ 4 3 x b y a =, 故选:D. 【点睛】 本题考查了加权平均数,解决本题的关键是表示出价格变化前后两种糖果的平均价格.4.某青年排球队12名队员的年龄情况如下: 则12名队员的年龄() A.众数是20岁,中位数是19岁B.众数是19岁,中位数是19岁 C.众数是19岁,中位数是20.5岁D.众数是19岁,中位数是20岁 【答案】D 【解析】 【分析】 中位数是指将统计总体当中的各个变量值按大小顺序排列起来,形成一个数列,处于变量数列中间位置的变量值就称为中位数;众数是指在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个). 【详解】 解:在这一组数据中19岁是出现次数最多的,故众数是19岁;将这组数据从小到大的顺序排列后,处于中间位置的数是20岁,那么由中位数的定义可知,这组数据中的中位数是20岁.故选:D. 【点睛】 理解中位数和众数的定义是解题的关键.

数据分析经典测试题含答案解析

数据分析经典测试题含答案解析 一、选择题 1.某校九年级数学模拟测试中,六名学生的数学成绩如下表所示,下列关于这组数据描述正确的是() A.众数是110 B.方差是16 C.平均数是109.5 D.中位数是109 【答案】A 【解析】 【分析】 根据众数、中位数的概念求出众数和中位数,根据平均数和方差的计算公式求出平均数和方差. 【详解】 解:这组数据的众数是110,A正确; 1 6 x=×(110+106+109+111+108+110)=109,C错误; 21 S 6 = [(110﹣109)2+(106﹣109)2+(109﹣109)2+(111﹣109)2+(108﹣109)2+ (110﹣109)2]=8 3 ,B错误; 中位数是109.5,D错误; 故选A. 【点睛】 本题考查的是众数、平均数、方差、中位数,掌握它们的概念和计算公式是解题的关键. 2.一组数据2,x,6,3,3,5的众数是3和5,则这组数据的中位数是() A.3 B.4 C.5 D.6 【答案】B 【解析】 【分析】 由众数的定义求出x=5,再根据中位数的定义即可解答. 【详解】 解:∵数据2,x,3,3,5的众数是3和5, ∴x=5,

则数据为2、3、3、5、5、6,这组数据为35 2 =4. 故答案为B. 【点睛】 本题主要考查众数和中位数,根据题意确定x的值以及求中位数的方法是解答本题的关键. 3.如图,是根据九年级某班50名同学一周的锻炼情况绘制的条形统计图,下面关于该班50名同学一周锻炼时间的说法错误的是() A.平均数是6 B.中位数是6.5 C.众数是7 D.平均每周锻炼超过6小时的人数占该班人数的一半 【答案】A 【解析】 【分析】 根据中位数、众数和平均数的概念分别求得这组数据的中位数、众数和平均数,由图可知锻炼时间超过6小时的有20+5=25人.即可判断四个选项的正确与否. 【详解】 A、平均数为1 50 ×(5×7+18×6+20×7+5×8)=6.46,故本选项错误,符合题意; B、∵一共有50个数据, ∴按从小到大排列,第25,26个数据的平均值是中位数, ∴中位数是6.5,故此选项正确,不合题意; C、因为7出现了20次,出现的次数最多,所以众数为:7,故此选项正确,不合题意; D、由图可知锻炼时间超过6小时的有20+5=25人,故平均每周锻炼超过6小时的人占总数的一半,故此选项正确,不合题意; 故选A. 【点睛】 此题考查了中位数、众数和平均数的概念等知识,中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数,如果中位数的概念掌握得不好,不把数据按要求重新排列,就会错误地将这组数据最中间的那个数当作中位数.

20、第二十章《数据的分析》单元测试题(含答案)-

第二十章《数据的分析》单元测试题 一、选择题) 1.为了了解参加某运动会的200名运动员的年龄情况,从中抽查了20名运动员的年龄,就这个问题来说,下面说法正确的是() A.200名运动员是总体B.每个运动员是总体 C.20名运动员是所抽取的一个样本D.样本容量是20 2.一城市准备选购一千株高度大约为2m的某种风景树来进行街道绿化,?有四个苗圃生产基地投标(单株树的价格都一样).?采购小组从四个苗圃中都任意抽查了20株树苗的高度,得到的数据如下: 请你帮采购小组出谋划策,应选购() A.甲苗圃的树苗B.乙苗圃的树苗; C.丙苗圃的树苗D.丁苗圃的树苗 3.将一组数据中的每一个数减去50后,所得新的一组数据的平均数是2,?则原来那组数据的平均数是()A.50 B.52 C.48 D.2 4.一个射手连续射靶22次,其中3次射中10环,7次射中9环,9次射中8环,3次射中7环.则射中环数的中位数和众数分别为() A.8,9 B.8,8 C.8.5,8 D.8.5,9 5 那么,8月份这100 A.1.5t B.1.20t C.1.05t D.1t 6.已知一组数据-2,-2,3,-2,-x,-1的平均数是-0.5,?那么这组数据的众数与中位数分别是() A.-2和3 B.-2和0.5 C.-2和-1 D.-2和-1.5 7.方差为2的是() A.1,2,3,4,5 B.0,1,2,3,5 C.2,2,2,2,2 D.2,2,2,3,3 8 某同学根据上表分析得出如下结论: (1)甲、乙两班学生成绩的平均水平相同; (2)乙班优秀的人数多于甲班优秀的人数;(每分钟输入汉字≥150个为优秀) (3)甲班成绩的波动情况比乙班成绩的波动小 上述结论中正确的是() A.(1)(2)(3)B.(1)(2)C.(1)(3)D.(2)(3) 9.某校把学生的纸笔测试、实践能力、成长纪录三项成绩分别按50%、20%?、?30%的比例计入学期总评成绩,90分以上为优秀.甲、乙、?丙三人的各项成绩如下表(单位:分),学期总评成绩优秀的是()

2016年数据分析面试常见问题

1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率最大的几个)及相应的频率。然后再在这1000个最大的IP中,找出那个频率最大的IP,即为所求。 或者如下阐述: 算法思想:分而治之+Hash 1.IP地址最多有2^32=4G种取值情况,所以不能完全加载到内存中处理; 2.可以考虑采用“分而治之”的思想,按照IP地址的Hash(IP)24值,把海量IP日志分别存储到1024个小文件中。这样,每个小文件最多包含4MB个IP地址; 3.对于每一个小文件,可以构建一个IP为key,出现次数为value的Hash map,同时记录当前出现次数最多的那个IP地址; 4.可以得到1024个小文件中的出现次数最多的IP,再依据常规的排序算法得到总体上出现次数最多的IP; 2、搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。 假设目前有一千万个记录(这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门。),请你统计最热门的10个查询串,要求使用的内存不能超过1G。 典型的Top K算法,还是在这篇文章里头有所阐述, 文中,给出的最终算法是:

第一步、先对这批海量数据预处理,在O(N)的时间内用Hash表完成统计(之前写成了排序,特此订正。July、2011.04.27); 第二步、借助堆这个数据结构,找出Top K,时间复杂度为N‘logK。 即,借助堆结构,我们可以在log量级的时间内查找和调整/移动。因此,维护一个K(该题目中是10)大小的小根堆,然后遍历300万的Query,分别和根元素进行对比所以,我们最终的时间复杂度是:O(N)+ N’*O(logK),(N为1000万,N’为300万)。ok,更多,详情,请参考原文。 或者:采用trie树,关键字域存该查询串出现的次数,没有出现为0。最后用10个元素的最小推来对出现频率进行排序。 3、有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小是1M。返回频数最高的100个词。 方案:顺序读文件中,对于每个词x,取hash(x)P00,然后按照该值存到5000个小文件(记为x0,x1,…x4999)中。这样每个文件大概是200k左右。 如果其中的有的文件超过了1M大小,还可以按照类似的方法继续往下分,直到分解得到的小文件的大小都不超过1M。 对每个小文件,统计每个文件中出现的词以及相应的频率(可以采用trie树/hash_map 等),并取出出现频率最大的100个词(可以用含100个结点的最小堆),并把100个词及相应的频率存入文件,这样又得到了5000个文件。下一步就是把这5000个文件进行归并(类似与归并排序)的过程了。 4、有10个文件,每个文件1G,每个文件的每一行存放的都是用户的query,每个

(专题精选)初中数学数据分析真题汇编及答案

(专题精选)初中数学数据分析真题汇编及答案 一、选择题 1.校团委组织开展“医助武汉捐款”活动,小慧所在的九年级(1)班共40名同学进行了捐款,已知该班同学捐款的平均金额为10元,二小慧捐款11元,下列说法错误的是( ) A.10元是该班同学捐款金额的平均水平B.班上比小慧捐款金额多的人数可能超过20人 C.班上捐款金额的中位数一定是10元D.班上捐款金额数据的众数不一定是10元【答案】C 【解析】 【分析】 根据平均数,中位数及众数的定义依次判断. 【详解】 ∵该班同学捐款的平均金额为10元, ∴10元是该班同学捐款金额的平均水平,故A正确; ∵九年级(1)班共40名同学进行了捐款,捐款的平均金额为10元, ∴班上比小慧捐款金额多的人数可能超过20人,故B正确; 班上捐款金额的中位数不一定是10元,故C错误; 班上捐款金额数据的众数不一定是10元,故D正确, 故选:C. 【点睛】 此题考查数据统计中的平均数,中位数及众数的定义,正确理解定义是解题的关键. 2.已知一组数据a、b、c的平均数为5,方差为4,那么数据a+2、b+2、c+2的平均数和方差分别为() A.7,6 B.7,4 C.5,4 D.以上都不对 【答案】B 【解析】 【分析】 根据数据a,b,c的平均数为5可知a+b+c=5×3,据此可得出1 3 (-2+b-2+c-2)的值;再由 方差为4可得出数据a-2,b-2,c-2的方差. 【详解】 解:∵数据a,b,c的平均数为5,∴a+b+c=5×3=15, ∴1 3 (a-2+b-2+c-2)=3, ∴数据a-2,b-2,c-2的平均数是3;∵数据a,b,c的方差为4, ∴1 3 [(a-5)2+(b-5)2+(c-5)2]=4,

电子商务数据分析试卷及答案3

《电子商务数据分析》试卷 班级: _______________ 姓名:_______________________ 一、填空题(共10 题,每题 1 分。) 1.单击生意参谋上方导航栏中的“ __________ ”超链接可进入实时直播版块,此功能会将店铺的实时数据、来源、榜单、访客等数据进行汇总显示。 2.要选定相邻的多张工作表,先单击所需的第一张工作表的标签,并按住____________ 键不放,然后单击要选定的最后一张工作表的标签即可。 3.选择单元格区域,录入相应的数据后,按_____________________ 键可将选择的每个单元格中录入相同数据。 4.进入生意参谋后,单击顶部导航栏中的“ ___________ ”版块即可配置竞争对手,并对竞店、竞品和竞争品牌进行分析。 5 .提高转化率是提高销售额最有效的途径,计算公式为: 6.外链出现的方式有直接链接和__________ 两种。 7.若要输入分数,则应在前面加上_____________________ 。 8.筛选是一种用于查找符合条件的数据的快速方法,Excel中有 ________ 和___________ 两种方法。 9. _____________ 是指利用各种电商平台和工具对数据的分析功能,直接观察出数据的发 展趋势,找出异常数据,对消费者进行分群等。 10.行业稳定性涉及 ________ 和极差两个指标。 二、单项选择题(共10 题,每题 1 分。) 1.用于收集市场信息并进行整理与分析,提出可行的市场推广方案,再跟据收集到的信息进行市场推广活动的效果评估,做好市场推广预算,控制活动成本,完善市场推广方案的数据分析岗位是()。 A.推广类岗位 B.客服类岗位 C.采编类岗位 D.美工类岗位 2.在Excel 中,已知某单元格的格式为000.00,值为23.785,则显示的内容为()。A.23.78 B.23.79 C.23.785 D.023.79 3.采用()定价策略可能会带来价格竞争。 A.基于成本的定价

最新数据分析师常见的7道笔试题目及答案

数据分析师常见的7道笔试题目及答案 导读:探索性数据分析侧重于在数据之中发现新的特征,而验证性数据分析则侧重于已有假设的证实或证伪。以下是由小编J.L为您整理推荐的实用的应聘笔试题目和经验,欢迎参考阅读。 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用 hash_map进行频率统计,然后再找出频率最大的几个)及相应的频率。然后再在这1000 个最大的IP中,找出那个频率最大的IP,即为所求。 或者如下阐述: 算法思想:分而治之+Hash 1.IP地址最多有2^32=4G种取值情况,所以不能完全加载到内存中处理; 2.可以考虑采用“分而治之”的思想,按照IP地址的Hash(IP)24值,把海量IP日志分别存储到1024个小文件中。这样,每个小文件最多包含4MB个IP地址; 3.对于每一个小文件,可以构建一个IP为key,出现次数为value的Hash map,同时记录当前出现次数最多的那个IP地址; 4.可以得到1024个小文件中的出现次数最多的IP,再依据常规的排序算法得到总体上出现次数最多的IP; 2、搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。 假设目前有一千万个记录(这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门。),请你统计最热门的10个查询串,要求使用的内存不能超过1G。 典型的Top K算法,还是在这篇文章里头有所阐述, 文中,给出的最终算法是: 第一步、先对这批海量数据预处理,在O(N)的时间内用Hash表完成统计(之前写成了排序,特此订正。July、2011.04.27); 第二步、借助堆这个数据结构,找出Top K,时间复杂度为N‘logK。 即,借助堆结构,我们可以在log量级的时间内查找和调整/移动。因此,维护一个K(该题目中是10)大小的小根堆,然后遍历300万的Query,分别和根元素进行对比所以,我们最终的时间复杂度是:O(N) + N’*O(logK),(N为1000万,N’为300万)。ok,更多,详情,请参考原文。 或者:采用trie树,关键字域存该查询串出现的次数,没有出现为0。最后用10个元素的最小推来对出现频率进行排序。 3、有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16字节,内存限制大小是1M。返回频数最高的100个词。 方案:顺序读文件中,对于每个词x,取hash(x)P00,然后按照该值存到5000 个小文件(记为x0,x1,…x4999)中。这样每个文件大概是200k左右。 如果其中的有的文件超过了1M大小,还可以按照类似的方法继续往下分,直到分解得到的小文件的大小都不超过1M。 对每个小文件,统计每个文件中出现的词以及相应的频率(可以采用trie树 /hash_map等),并取出出现频率最大的100个词(可以用含100 个结点的最小堆),并把

数据分析试题

一、数据库知识 单项选择题 1. 数据库系统的核心是(B) A、数据模型 B、数据库管理系统 C、软件工具 D、数据库 2. 下列叙述中正确的是(C)。 A、数据库是一个独立的系统,不需要操作系统的支持 B、数据库设计是指设计数据库管理系统 C、数据库技术的根本目标是要解决数据共享的问题 D、数据库系统中,数据的物理结构必须与逻辑结构一致 3. 下列模式中,能够给出数据库物理存储结构与物理存取方法的是( A )。 A、内模式 B、外模式 C、概念模式 D、逻辑模式 4. SQL语句中修改表结构的命令是(C )。 A、MODIFY TABLE B、MODIFY STRUCTURE C、ALTER TABLE D、ALTER STRUCTURE 5. SELECT-SQL语句是(B ) 。 A、选择工作区语句 B、数据查询语句 C、选择标准语句 D、数据修改语句 6. SQL语言是( C )语言。 A、层次数据库 B、网络数据库 C、关系数据库 D、非数据库 7. 如果要创建一个数据组分组报表,第一个分组表达式是"部门",第二个分组表达式是"性别",第三个分组表达式是"基本工资

",当前索引的索引表达式应当是( B )。 A、部门+性别+基本工资 B、部门+性别+STR(基本工资) C、STR(基本工资)+性别+部门 D、性别+部门+STR(基本工资) 8. 数据库DB、数据库系统DBS、数据库管理系统DBMS三者之间的关系是( A )。 A、DBS包括DB和BMS B、DBMS包括DB和DBS C、DB包括DBS和DBMS D、DBS就是DB,也就是DBMS 9. 下列有关数据库的描述,正确的是( C )。 A、数据库是一个DBF文件 B、数据库是一个关系 C、数据库是一个结构化的数据集合 D、数据库是一组文件 10. 下列说法中,不属于数据模型所描述的内容的是( C )。 A、数据结构 B、数据操作 C、数据查询 D、数据约束 11. 数据库管理系统能实现对数据库中数据的查询、插入、修改和删除等操作,这种功能称为( C ) 。 A.数据定义功能 B.数据管理功能 C.数据操纵功能 D.数据控制功能 12. 数据库管理系统是( B ) 。 A.操作系统的一部分 B.在操作系统支持下的系统软件 C.一种编译程序

数据分析岗面试题

数据分析岗面试题-标准化文件发布号:(9556-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

数据分析岗面试题 1、表:table1(Id,class,score),用最高效最简单的SQL列出各班成绩最高的列 表,显示班级,成绩两个字段。 2、有一个表table1有两个字段FID,Fno,字都非空,写一个SQL语句列出 Fno的纪录。 3、有员工表empinfo 4、( 5、Fempno varchar2(10) not null pk, 6、Fempname varchar2(20) not null, 7、Fage number not null, 8、Fsalary number not null 9、); 10、假如数据量很大约1000万条;写一个你认为最高效的SQL,用一个SQL 计算以下四种人: 11、fsalary>9999 and fage > 35 12、fsalary>9999 and fage < 35 13、fsalary <9999 and fage > 35 14、fsalary <9999 and fage < 35 15、每种员工的数量; 4、

Sheet1: sheet2: Sheet1、sheet2是Excel中两个表,sheet2中 记录了各产品类别下面对应的产品编码,现 要在sheet1 C列中对应A列产品编码所对应 的产品类别,请写出公式。 5、某商品零售公司有100万客户资料数据(客户数据信息包括客户姓名、电话、地址、购买次数、购买时间、购买金额、购买产品种类等等),现要从中抽取10万客户,对这些客户发送目录手册,为了能使这批手册产生的利润最大,从已有的客户数据信息,我们应该如何挑选这10万个客户?

数据分析经典测试题含解析

数据分析经典测试题含解析 一、选择题 1.某校男子足球队的年龄分布如图所示,则根据图中信息可知这些队员年龄的平均数,中位数分别是( ) A .15.5,15.5 B .15.5,15 C .15,15.5 D .15,15 【答案】D 【解析】 【分析】 【详解】 根据图中信息可知这些队员年龄的平均数为: 132146158163172181 268321 ?+?+?+?+?+?+++++=15岁, 该足球队共有队员2+6+8+3+2+1=22人, 则第11名和第12名的平均年龄即为年龄的中位数,即中位数为15岁, 故选D . 2.某实验学校女子排球队12名队员的年龄分布如图所示,则这12名队员的年龄的众数、平均数分别是( ) A .15岁,14岁 B .15岁,15岁 C .15岁,156 岁 D .14岁,15岁 【答案】A 【解析】 【分析】 根据众数、平均数的定义进行计算即即可. 【详解】

观察图表可知:人数最多的是5人,年龄是15岁,故众数是15. 这12名队员的年龄的平均数是:123131142155161 1412 ?+?+?+?+?= 故选:A 【点睛】 本题主要考查众数、平均数,熟练掌握众数、平均数的定义是解题的关键. 3.某学校组织学生进行社会主义核心价值观的知识竞赛,进入决赛的共有20名学生,他们的决赛成绩如下表所示: 决赛成绩/分 95 90 85 80 人数 4 6 8 2 那么20名学生决赛成绩的众数和中位数分别是( ) A .85,90 B .85,87.5 C .90,85 D .95,90 【答案】B 【解析】 试题解析:85分的有8人,人数最多,故众数为85分; 处于中间位置的数为第10、11两个数, 为85分,90分,中位数为87.5分. 故选B . 考点:1.众数;2.中位数 4.在某次训练中,甲、乙两名射击运动员各射击10发子弹的成绩统计图如图所示,对于 本次训练,有如下结论:①22 s s >甲乙;②22 s s <甲乙;③甲的射击成绩比乙稳定;④乙的射 击成绩比甲稳定.由统计图可知正确的结论是( ) A .①③ B .①④ C .②③ D .②④ 【答案】C 【解析】 【分析】 从折线图中得出甲乙的射击成绩,再利用方差的公式计算,即可得出答案.

相关文档
最新文档