《探索性数据分析》测验试卷参考答案
![《探索性数据分析》测验试卷参考答案](https://img.360docs.net/img82/1f8tbzb56i75axcz65orhbtnuhohda5c-21.webp)
![《探索性数据分析》测验试卷参考答案](https://img.360docs.net/img82/1f8tbzb56i75axcz65orhbtnuhohda5c-82.webp)
《探索性数据分析》测验试卷
班级:姓名:学号:
1.(15分)你所知道的数据类型有哪些?请至少举出四种,并说明这些数据类型的特点。
2.(共15分)(1). 请叙述矩估计和极大似然估计的定义。
(2). 设总体X~)
,
(2
σ
μ
N,n X
X???,
1
为来总体的样本,求使05
.0
)
(=
>t
X
P的点t的极大似然估计。
解:假设)(?
Φ为标准正态分布的分布函数,则,
)
(
1
)
(
1
)
(
σ
μ
-
Φ
-
=
≤
-
=
>
t
t
X
P
t
X
P
由已知可得,95
.0
)
(=
-
Φ
σ
μ
t. 令
05
.0
t为标准正态分布的上侧0.05分位
数,则
05
.0
t
t
=
-
σ
μ. 于是,由极大似然估计的不变性可知,
t的极大似
然估计为,
n
S
t
X
t?
?
05
.0
+
=,其中∑
=
=
n
i
i
X
n
X
1
1, ∑
=
-
=
n
i
i
n
X
X
n
S
1
2
)
(
1
?.
(3). 矩估计唯一吗?是,请证明;否,请举反例。
答:矩估计不唯一,例如泊松分布均值的估计。具体的说,假设总体X服从参数为λ的泊松(Poisson)分布,由于λ
=
=)
(
)
(X
Var
X
E,故由
矩估计法知: X =1?λ,∑=-=n i i X X n 1
22)(1?λ都可作为参数λ的矩估计量, 然而样本均值是总体均值的无偏估计,且比样本二阶中心矩的阶数低,故优先选取样本均值作为参数的矩估计.
3. (10分)设X 和Y的方差都存在,证明 2|cov(,)|()()X Y Var X Var Y ≤?. 解:(该题是证明相关系数介于-1,1之间的理论依据,所以其实严格来讲由相关系数的取值范围来推得这个命题的做法是错误的)。令X EX μ=,Y EY μ=,t 为任一实数,则0)]()[(2≥-+-Y X Y t X μμ,由积分
的性质可知
0)]()[(2≥-+-Y X Y t X E μμ,另一方面, VarY
t Y X tCov VarX Y E t Y X tE X E Y t X E Y Y X X Y X 22222),(2)()])([(2)()]()[(++=-+--+-=-+-μμμμμμ 上式为t 的二次函数,故
0)()(4)],([42≤-Y Var X Var Y X Cov ,得证.
4. (20分)已知T与C独立,且,X T C =∧()I T C δ=≤,设T 与C 的分布函数分别为F 和G ,已知{(,)}0E m T θ=,其中m(.)为已知函数,假设观察样本为11,,,,n n X X δδ???,???,试证明:
(1){(,)}01()E m T G T δ
θ=-
(2)请用观察样本给出θ的一个合适估计。
(1)证明: 利用条件期望的性质可得:
0)],([]|[)(1),(]|),()(1[)},()(1{==?
?????-=??????-=-θδθθδθδT m E T E T G T m E T T m T G E E T m T G E (2)解: 由(1)可知