第11章 非参数回归(非参数统计,西南财大)范文
非参数统计分析方法总结

非参数统计分析方法一单样本问题1,二项式检验:检验样本参数是否与整体参数有什么关系。
样本量为n,给定一个实数M0(代表题目给出的分位点数),和分位点∏(0.25,0.5,0.75)。
用S-记做样本中比M0小的数的个数,S+记做样本中比M0大的数的个数。
如果原假设H0成立那么S-与n的比之应为∏。
H0:M=M0H1:M≠MO或者M>M0或者M<M0.Spss步骤:分析—非参数检验—二项式检验。
可以得出统计量为K=min(S-,S+)和统计量Z和p值当p值小于0.05时拒绝原假设,没有充足理由证明M=M0.,2,Wilcoxon符号秩序检验Wilcoxon检验的目的和二项式检验是一样的,Spss步骤:分析—非参数检验—两个相关样本得出统计量Z和p值当p值小于0.05时拒绝原假设,没有充足理由证明M=M03,随机性游程检验给出一组数据看次数据出现的情况是不是随机的。
列如:00011011110001110100001110H0:是随机的H1:不是随机的(混合倾向,游程多,长度短)(成群倾向,游程少,长度长)Spss步骤:分析—非参数检验—游程得出统计量R和p值当p值小于0.05时拒绝原假设,没有充足理由证明该数据出现是随机的二,两个样本位置问题1,Brown—Mood中位数检验给出两个样本比较两个样本的中位数或者四分位数等是否相等或者有一定关系,设一个中值为M1,一个为M2H0:M1=M2.H1:M1≠M2或者M1>M2或者M1<M2Spss步骤:分析—非参数检验—k个独立样本得出统计量Z和p值当p值小于0.05时拒绝原假设,没有充足理由证明M1=M2.2,Wilcoxon(Mann—Whitniey)秩和检验该检验和Brown—Mood检验的原理是一样的,但是该检验利用了更多的样本信息,从而比Brown—Mood检验更有说服力。
Spss步骤:分析—非参数检验—2个独立样本得到Z统计量和p值,当p值小于0.05时拒绝原假设,没有充足理由证明M1=M2.3,成对样本Wilcoxon秩和检验用M1代表开始时的数据某一特征值,用M2代表结束后的数据某一特征值,比较前后关系。
stata 非参数回归

stata 非参数回归【原创版】目录1.介绍 Stata 软件2.非参数回归的概念和应用场景3.Stata 中进行非参数回归的方法和步骤4.实例演示如何使用 Stata 进行非参数回归5.总结非参数回归在 Stata 中的应用优势正文一、介绍 Stata 软件Stata 是一款广泛应用于统计分析、数据管理、绘图等领域的软件,尤其擅长于处理面板数据和复杂数据结构。
Stata 提供了丰富的统计方法和模型,为研究者提供了强大的数据分析工具。
二、非参数回归的概念和应用场景非参数回归是一种不依赖于特定概率分布的回归方法,它不要求对数据的分布形式作出任何假设。
非参数回归适用于数据分布形式未知或偏态分布的情况,以及样本量较小的情况。
非参数回归主要有局部加权回归(Lasso)、岭回归(Ridge)和 Enetrode 回归等方法。
三、Stata 中进行非参数回归的方法和步骤在 Stata 中,可以使用`regress`命令进行非参数回归。
以下是进行非参数回归的基本步骤:1.导入数据:使用`use`、`import`或`insheet`命令将数据文件导入Stata。
2.进行非参数回归:在 Stata 命令行中输入`regress`,后面跟上因变量和自变量,例如:`regress dep_var ind_var1 ind_var2...`。
3.添加非参数回归选项:在`regress`命令后可以添加各种非参数回归选项,如`lasso`、`ridge`、`enetrode`等。
例如:`regress dep_var ind_var1 ind_var2 lasso`。
4.查看回归结果:Stata 会输出回归结果,包括系数估计、标准误差、z 统计量、p 值等。
四、实例演示如何使用 Stata 进行非参数回归假设我们有一个数据集,包含一个因变量(销售额)和多个自变量(广告费用、地区、季节等),我们想要研究这些自变量对销售额的影响。
stata 非参数回归

stata 非参数回归摘要:一、引言1.了解非参数回归的意义和应用场景2.介绍Stata在非参数回归分析中的作用二、Stata非参数回归方法1.非参数回归的基本概念2.非参数回归的优点3.Stata中常用的非参数回归命令三、Stata非参数回归实例分析1.数据准备2.命令操作步骤3.结果分析与解释四、注意事项与技巧1.非参数回归适用条件2.参数回归与非参数回归的选择3.Stata操作中的注意事项五、总结与展望1.非参数回归在实际应用中的价值2.Stata在非参数回归分析中的优势3.未来发展趋势和展望正文:一、引言随着社会科学研究的不断发展,对数据进行分析的方法也日益丰富。
其中,非参数回归作为一种重要的数据分析手段,在许多领域都得到了广泛应用。
Stata作为一款功能强大的统计分析软件,自然也少不了对非参数回归的支持。
本文将为大家介绍Stata在非参数回归分析中的应用,以期帮助大家更好地利用这一工具进行数据处理。
二、Stata非参数回归方法1.非参数回归的基本概念非参数回归,顾名思义,是一种不依赖于参数的回归方法。
它不需要假设数据满足特定的分布,也不需要确定回归系数的具体形式。
非参数回归的主要目标是估计一个非参数的回归函数,用以描述自变量与因变量之间的关系。
2.非参数回归的优点非参数回归的优点主要体现在以下几个方面:(1)适应性较强,不受数据分布的限制,适用于各种类型的数据;(2)可以同时处理多于两个自变量的情况;(3)能够处理非线性关系;(4)具有一定的稳健性,对异常值不敏感。
3.Stata中常用的非参数回归命令在Stata中,进行非参数回归分析的常用命令有:(1)`nonparametric`:用于非参数回归;(2)`kruskal`:用于Kruskal-Wallis测试,检验多个样本的分布是否有显著差异;(3)`friedman`:用于Friedman等级和符号测试,检验多个分组间的平均值差异;(4)`signtest`:用于符号测试,检验两组数据的平均值差异。
非参数统计小论文(范本模板)

常用非参数统计方法上饶师范学院[摘要]本文就非参数统计分析其适用情形与优缺点,并详细介绍几种非参数统计的方法并有案例分析。
[关键词]两样本比较多样本比较秩和检验在统计学中,最基本的概念是总体、样本、随机变量、分布、估计和假设检验等,其中很大一部分食与正态理论相关的.在我们已经学过的知识里,总体的分布形式往往是给定的或已经假定了的,我们只需要在总体分布已知的基础上对参数进行估值或者进行检验。
但是实际上,对总体的分布的假定并不是能随便做出的,数据可能并不是来自假定的总体分布,或者根本不是来自同一个总体。
在这种假定下进行推断就可能产生错误的结论。
于是,人们希望能在不假定总体分布的情况下,尽量从数据本身来获得所需的信息,这就是非参数统计的宗旨.在统计学的方法中,非参数方法只是在具体情况下更适用、更准确完整表示数据的信息。
接下来,我将就非参数统计分析其适用情形与优缺点,并详细介绍几种非参数统计的方法并有案例分析。
非参数统计(nonparametric statistics)不依赖总体分布类型,不对参数进行估计或检验,通过样本观察值推断总体分布位置是否相同非参数检验又称任意分布检验(distribution—free test)优点:资料分布特征要求较低,适用范围广,收集资料方便;对不满足参数方法的资料,效率高。
缺点:宜用参数方法的资料,若用非参数法处理,没有充分利用资料提供的信息,导致检验效能下降。
秩和检验(rank sum test)1.秩(rank):观察值从小到大排序,该序号在统计学上称为秩/秩次;2.秩和:秩次求和得到;3.秩和检验:用秩和进行假设检验的方法。
适宜作非参数检验的资料1.计量资料,总体偏离正态性或总体分布未知2.等级资料:痊愈、显效、有效、无效;-、±、+、++、+++; 心功能分级;烧伤程度…3.边界不确定的资料:如出现>50mg或0。
5mg以下两样本比较秩和检验例测得铅作业与非铅作业工人的血铅值(μmol/L),问两组工人的血铅值有无差别?铅作业组(1)秩次(2)非铅作业组(3)秩次(4)0。
非参数统计(non-parametricstatistics)又称任意分布检验(

例11.6(P195)。
(一)建立检验假设
H0:某中药治疗四种病型 的疗效总体分布相同 H1:四个总体的分布不同 或不全同
0.05
(二)计算统计量H值 (1)编秩:a、计算各等级的合计人数 b、确定秩次范围 c、计算平均秩次 (2)求各组秩和
R1 65(139.5) 18(304.0) 30(397.5) 13(504.5)
血浆总皮质醇含量有差别(不同或不全同)。
若还希望分析具体哪些组之间有差别,需进一步两两组 间比较。方法见《卫生统计学》第五版P196,《医学统计学》 第二版P183等。
当相同秩次较多(超过25%)时,需进行如下校正。
例11.4(P193),见表11-4。
(一)建立检验假设
H0:接种三种不同菌型伤 寒杆菌存活日数总体分 布相同 H1:三个总体的位置不同 或不全同
适用于完全随机设计分组的多个样本比较(即不满足参
数统计条件的),目的在于判断多个总体分布是否相同。
例11.3(P192),见表11-3。
(一)建立检验假设
H
:血浆总皮质醇含量的
0
三个总体分布相同
H1:血浆总皮质醇含量的 三个总体分布不同或不 全同
0.05
(二)计算统计量H值
1、编秩
先将各组数据分别由小到大排列,统一编秩,不同组的
注意:等级资料对程度的比较不应选检验。
例11.5(P194)。
(一)建立检验假设
H
:吸烟工人和不吸烟工
0
人的HbCO%含量总体分布位置相
同
H1:吸烟工人的HbCO%含量高于不吸烟工人 的HbCO%含量
0.0(5 单侧)
(二)计算统计量u值
(1)编秩:a、计算各等级的合计人数
stata 非参数回归

stata 非参数回归摘要:1.介绍非参数回归2.阐述stata 在非参数回归中的应用3.说明stata 非参数回归的优点4.举例说明如何使用stata 进行非参数回归正文:一、介绍非参数回归非参数回归是一种不依赖于特定概率分布的回归方法,与参数回归不同,非参数回归不需要对数据分布进行假设。
非参数回归的目的是估计自变量与因变量之间的关系,而不是对关系进行特定的概率分布假设。
二、阐述stata 在非参数回归中的应用stata 作为一款广泛应用于社会科学、经济学、生物统计学等领域的数据分析软件,提供了丰富的非参数回归方法,如局部加权回归(Lowess)、Bootstrap 回归、广义加权回归(GWR)等。
三、说明stata 非参数回归的优点1.不受数据分布限制:非参数回归不需要对数据分布进行假设,因此适用于各种分布形态的数据。
2.较强的稳健性:非参数回归方法对于异常值和不规则分布的数据具有较强的稳健性。
3.易于操作:stata 提供了简洁的命令和语法,使得非参数回归操作起来非常方便。
四、举例说明如何使用stata 进行非参数回归假设我们要研究一个地区房价与房屋面积、地段等因素之间的关系,可以使用stata 的局部加权回归(Lowess)方法进行非参数回归。
具体操作如下:1.输入数据:在stata 中输入数据,以地区、房价、房屋面积、地段等变量为例。
2.进行非参数回归:输入命令"lowess",之后输入需要进行回归分析的变量,如"price area location"。
3.查看结果:stata 会输出回归结果,包括系数估计、标准误差、z 统计量等。
非参数统计结课总结

非参数统计结课论文姓名:姚文锋班级:2011157学号:201115726专业:统计学非参数统计检验方法的总结引言:非参数统计作为数理统计学的分支,是解决很多不知道数据分布的问题的主要方法,通过运用非参数方法可以对事物起建立统计模型和数学描述。
摘要:本文主论述了非参数估计的符号检验、秩检验和ridit检验法等多种检验方法。
关键字:符号检验、秩检验、ridit检验1、非参数估计的理解对计量资料进行统计分析,常对计量资料进行统计分析,常用用方法有两类——参数统计和非参数统计。
t检验、方差分析和直线相关回归分析都属于参数统计方法。
参数统计方法要求的前提条件是,资料应服从或近似服从正态分布,t检验、方差分析还要求方差具有齐性。
当前提条件不满足时,就不应选用参数统计方法。
符号检验、秩和检验属于非参数统计方法。
非参数统计方法对资料不要求必须是正态分布,也不要求方差必须具有齐性。
当对资料的分布情况及方差情况不清楚或没把握,或者经过检验不满足正态分布或方差齐性的要求时,就应当选用非参数统计方法对资料进行统计分析。
2非参数检验的方法非参数检验不仅对资料分布没有特殊要求,除了用连续数量表示的的资料外,它还可以对样本数据的符号、等级程度、大小顺序等进行比较,加上方法简便,易于掌握,不要求复杂的计算工具,还可查表判断,能处理一些参数法处理不了的问题,因而应用更广泛,值得学习和推广。
常用的非参数统计方法有:符号检验、秩和检验、秩检验、等级相关检验以及Ridit分析等。
符号检验是指通过符号“ +”和“-”的个数来进行统计推断的,它所关心的信息只与两类观测值有关。
Wilcox on 符号秩检验、wile on-mann-whit ney 秩和检验、spearma n 秩相关检验、方差检验。
秩检验统计量定义:设样本X1, X2, X3,…,Xn是取自总体X的简单随机样本,该组数据中不超过Xi的数据个数Ri,称Ri为Xi的秩,Xi是第Ri个顺序统计量,R是由样本产生的统计量,称为秩统计量。
非参数统计讲义(西南财大谢小燕))--SPSS和DSAS非参数

非参数统计分析方法的SAS 编程实现SAS/NPAR1WAY 过程(单因子非参数过程)SAS 中对于非参数分析方法功能的实现主要由npar1way 过程来完成,从过程名字就可以看出,在此过程的处理进程中,只能一次指定一个因素进行分析。
下面我们先来了解一下npar1way 过程的语句格式以及各语句和选项的基本功能。
NPARlWAY 过程是一个单因子的非参数方差分析过程。
该过程分析变量的秩,并计算几个基于经验分布函数(EDF)和通过一个单因子分类的响应变量确定的积得分的统计量,NPARlWAY 过程是一个非参数过程,它检验一个变量的分布在不同组中具有相同的位置参数或者在EDF 检验下,检验这个分布在不同组中它们的分布相同。
NPAR1WAY 过程处理独立组,不处理成对数据。
关于成对数据的情形,请看《SAS 系统〃Base SAS 软件使用手册》中有关UNI- VARIATE 过程的讨论。
UNIVARIATE 过程进行符号检验和Wilcoxon 符号秩检验。
函数的统计量。
它们是Kolmogorov —smirmov 统计量、Cramer —Von Meses 统计量、如果分类变量只有两个水平的话还有Kuiper 统计量。
这些统计量用来检验在不同的组中一个变量的分布是否是相同的,所有NPARlWAY 执行的检验都是渐近的且不适用于小样本惰形。
四种简单的线性秩统计量1) Wilcoxon 得分 在Wilcoxon 得分中,∑==n j j j R a C S 1)(,且j j R R a =)(2) Median 得分(中位数得分)当观测值的秩大于中位数的秩序时,中位数得分为1,否则为0,即21,1)(+>=n R R a j j 当 21,0)(+≤=n R R a j j 当3) Van der waerden 得分Van der waerden 得分是对正态分布的次序统计量的期望值的近似,即))1/(()(1+=-n R R a j j Φ其中Φ是标准正态分布的分布函数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十二章 非参数回归及其相关问题第一节 参数回归问题的回顾在线性回归模型中,我们总是假定总体回归函数是线性的,即 多元线性回归模型一般形式为:i Ki K i i i X X X Y μββββ+++++= 33221总体回归函数(PRF )Ki K i i ki i i i X X X X X X Y E X m ββββ++++== 3322132),,,()(但是,经验和理论都证明,当)(X m 不是线性函数时,基于最小二乘的回归效果不好,非参数回归就是在对)(X m 的形式不作任何假定的前提下研究估计)(X μ。
例 设二维随机变量,其密度函数为⎩⎨⎧≤≤≤≤+=其它10,10),(y x yx y x f ,求)/(x X Y E =.解:1021),()(1≤≤+==⎰x x dy y x f x f x⎰==1)(),()/(dy x f y x f yx X Y E x ⎰++=1021dy x y x y ⎰++=1)(211dy y x y x )()321(122x m x x =++= 从例可知,)/(x X Y E =仅与x 有关,条件期望)/()(x X Y E x m y ===表明Y 与X 在条件期望的意义下相关。
由样本均值估计总体均值的思想出发,假设样本),(11Y X ,),(22Y X ,…,),(n n Y X 中有相当i X 恰好等于x ,()(/)m x E Y x =,不妨记为1i X ,2i X ,…,k i X ,自然可取相应的Y 的样本1i Y ,2i Y ,…,k i Y ,用他们的平均数∑=kj i j Y k 11去估计)/()(X Y E X m =。
可是2在实际问题中,一般不会有很多i X 的值恰好等于x 。
这个估计式,仿佛是一个加权平均数,对于所有的i X ,如果等于x ,则赋予k1的权,如果不等于x ,则赋予零权。
由此可启发我们在思路上产生了一个飞跃。
即对于任一个x ,用n Y Y Y ,,,21 的加权和去估计()m x ,即∑==ni i i n Y W x m1)(ˆ,其中n i W i ,,2,10 =≥,,1=∑i W 估计)/()(X Y E X =μ。
问题是如何赋权,一种合乎逻辑的方法是,等于x 或靠x 非常近的那些i X ,相应的权大一些,反之小权或零权。
两种模式:设(,)k Y R R ∈⨯x 上的随机变量,(,)(1,2,,)i i Y i n =x 为的n 次观测值。
实际应用中 ,{}ni i x 为非随机的,n Y Y Y ,,,21 依条件独立,在理论上非参数回归中{}ni i x 既可以是非随机的,也可以是随机的。
而参数回归分析中,我们总是假定{}ni i x 为非随机的。
根据{}ni i x 的不同非参数回归有两种模式。
1、{}n i i x 为随机时的非参数回归模型设(,)kY R R ∈⨯x ,+∞<||Y E ,(,)(1,2,,)i i Y i n =z 为(,)Y x 的随机样本。
存在没个未知的实值函数(.)g ,使得(/()i E Y g =i x =x x ) n i ,,2,1 =一般记为(/Y E Y =X =x )(/(/)E Y yf y dy =⎰X =x x )(,)()f y ydy f =⎰x x (,)()()(,)x yf y dy r f f y dy ==⎰⎰x x x x这里,0f ≠x (x),如果0f =x (x),则((/)0m E Y ===x)X x 2、{}ni i x 为非随机时的非参数回归模型由于在实际中,研究者或试验者一般可以控制X 或预先指定X ,这时X 可能不再是随机变量,例如年龄与收入之间的关系中年龄为固定时,收入的分布是已知的,不存在X 为非参数回归3随机变量时,估计)(x f x 的问题。
设(,)k Y R R ∈⨯x ,+∞<||Y E ,(,)(1,2,,)i i Y i n =x 为(,)Y x 的随机样本设的随机变量,(,)(1,2,,)i i Y i n -x 为()Y x,的n 次独立观测值,则 ()i i Y g e =+i x ),,2,1(n i =iid e e e n ,,,21 ,0)(=i e E ,+∞<=2)(σi e Var 。
第二节 一元非参数回归核估计方法一、核估计(一) Nadaraya-Watson 估计核权函数是最重要的一种权函数。
为了说明核函数估计,我们回忆二维密度估计dy x f y x f dy x y yf x X Y E x m x ⎰⎰====)(),()/(/()() (1) 而),(1),(12ni ni n i nh yY h x X K nh y x f --=∑= )(1)(11),(1ni n i n n i n h y Y K h h x X K h n y x f --=∑= (2)在这个密度函数估计中,核函数必须相等,光滑参数n h 可以不等,光滑参数不等时,有)(1)(11),(1yi n i y x i x h y Y K h h x X K h n y x f --=∑=将(2)代入(1)的分子,得dy h y Y K h y h x X K h n dy y x f y yi n i y x i x )()(11),(1--=∑⎰⎰= 令i y Y y s h -+=,则1yds dy h =111(,)()()()n i y i i x xX x y f x y dy K sh Y K s ds n h h =-=+∑⎰⎰4又由)(s k 有对称性,则⎰≡0)(ds s sK ,⎰≡1)(ds s K ,得1式的分子为分子=i x i ni x Y h xX K nh )(11-∑= 分母=)(11xi ni xh xX K nh -∑= 111111()()()11()()n n i i i i i i x x x xn nni i i i x x x xX x X x K Y K Y nh h h h m x X x X x K K nh h h h ====--==--∑∑∑∑ 可以看出对)x X Y E x m ==/()(的 估计,是密度函数估计的一种自然推广,一般也称为权函数估计∑==ni i nin Y x Wx m 1)()(其中11()()1()i x xni ni i x xX x K h h W x X x K h h =-=-∑ 可以看出权函数完全由)(x W ni 确定,其取值与X 的分布有关,称为N-W 估计。
可以推得:∑∑==-=-ni n i ni n i i ni x mY x W Y x W 1212))(ˆ)(())((min θ 0))((12=-∂∂∑=ni i niY x Wθθ0))((12=-∂∂∑=ni ini Y x Wθθ0))((21=--∑=ni i ni Y x W θ∑==ni i ni n Y x W x m1)()(ˆ 所以,核估计等价于局部加权最小二乘法。
非参数回归 5二、窗宽的选择 令1()()i h i x xX x K K X x h h -=- 根据非参数估计11ˆ()()/()nnn hii h i i i mx K Xx Y K x X ===--∑∑当0→h ,11ˆ()()/()nnn hii h i i i mx K Xx Y K x X ===--∑∑的分子和分母中除了当i x X =的项不为零,其它均为零,故i i i n Y K Y K X m=→)0(/)0()(ˆ 这说明当窗宽趋于0时,i x X =点的估计值趋于该点的观测值。
当∞→h ,11ˆ()()/()nnn hii h i i i mx K Xx Y K x X ===--∑∑的分子和分母中每一项()(0)h i K x X K -→,则∑∑∑===--=→ni i n i ni i n Y n K n Y K n x m111111)0(/)0()(ˆ。
说明当窗宽趋于无穷时,则每一点的估计值均为Y 的观测值的平均值。
可见窗宽n h 的控制是核估计精度的重要参数。
太小估计线欠平滑,太大过于平滑。
1、 理论窗宽的最佳选择记22()()K u K u du μ=⎰,⎰=du u K K R 2)()( 当解释变量为随机的情形时,i i i u X m Y +=)(),,2,1(n i =的渐近偏差和渐近方差为: 估计方法 渐近偏差渐近方差N-W 方法)())()()(2)((222k x f x f x m x m h n μ''+'')()()(2K R x f nh x n σ 其中)(x f 为解释变量的密度函数,)/()(22i i i x X u E x ==σ。
估计的均方误差62))()(ˆ(x m x mE n - [][]{}2)()(ˆ)(ˆ)(ˆx m x m E x m E x mE n n n -+-= []{}[]{}22)()(ˆ)(ˆ)(ˆx m x m E x m E x mE n n n -+-= 回归函数m(x)估计的渐近方差随着窗宽见效而增大,渐近偏差随着减小而减小。
所以非参数估计就是在估计的盘查和方差中寻求平衡,使均方误差达到最小。
理论的最佳窗宽5/1-=cn h n 。
2、 样本窗宽的交错鉴定哪一个窗宽是比较恰当的,必须通过样本的资料考察,但是我们的样本仅仅有一个。
在某个局部观测点i X x =,首先,在样本中剔除该观测值点),(i i Y X ,用剩余的n-1个点在i X x =处进行核估计:∑≠-=nij j i nj i n Y X W x m)()(ˆ, 最后比较平方拟合误差12,1ˆ()(())()nn in ii i i CV h nY mX w X --==-∑,使)(n h CV 最小的窗宽,则是最佳的。
3、 窗宽的经验选择方法当K(.)为【-1,1】上对称、单峰的概率密度时,∑≠=nj j i njn Y X Wx m1)()(ˆ是集中在x 附近的加权平均,由于x 为对称的,以n h 为宽度,当n h 太大时,参加的平均点多,会提高精度,但可能偏差会增大。
反之n h 小则相反。
所以应该根据散点图来选择窗宽。
三、核函数的选择 因为 估计方法渐近偏差渐近方差非参数回归7N-W 方法)())()()(2)((222k x f x f x m x m h n μ''+'')()()(2K R x f nh x n σ 所以渐近均方误差为:422211)()(h K C h n K R C MSE B v μ+=--其中v C 和2B C 是与核函数无关的量,对MSE 求h 的导数,则最佳的窗宽为:5/151225120)()(4-⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛=n K K R C C h B v μ 将5/151225120)()(4-⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛=n K K R C C h B vμ代入MSE ,得 )()()44()()(5/225/45/45/15/25/45/4K K R C C h MSE B v μ---+=最优的核函数是使()⎰⎰=du u K u duu KK K R )()()()(22222μ达到最小的核函数+-=)1(75.0)(2u u K 。