用身高和体重数据进行性别分类的实验报告教材

用身高和体重数据进行性别分类的实验报告教材
用身高和体重数据进行性别分类的实验报告教材

用身高和体重数据进行性别分类的实验报告

一:基本要求

1、利用K-L 变换进行特征提取。

2、在正态分布假设下估计概率密度,建立最小错误率Bayes 分类器。

3、试验直接设计线性分类器的方法,与基于概率密度估计的贝叶斯分类器进行比较。

二、实验数据

训练样本:FAMALE.TXT (50个女同学的身高与体重数据) MALE.TXT (50个男同学的身高与体重数据)

测试样本:Text1.TXT (35个同学的身高与体重数据,其中20个男同学,15个女同学) Text2.TXT (300个同学的身高与体重数据,其中250个男同学,50个女同学)

三、具体做法

1、不考虑类别信息对整个样本集进行K-L 变换(即PCA ),并将计算出的新特征方向表示在二维平面上,考察投影到特征值最大的方向后男女样本的分布情况并用该主成分进行分类。

2、利用类平均向量提取判别信息,选取最好的投影方向,考察投影后样本的分布情况并用该投影方向进行分类。

3、采用身高和体重数据作为特征,在正态分布假设下估计概率密度,建立最小错误率Bayes 分类器,写出得到的决策规则,将该分类器应用到训练/测试样本,考察训练/测试错误情况。在分类器设计时可以考察采用不同先验概率(如0.5 vs. 0.5, 0.75 vs. 0.25, 0.9 vs. 0.1等)进行实验,考察对决策和错误率的影响。

4、用Fisher 线性判别方法求分类器,将该分类器应用到训练和测试样本,考察训练和测试错误情况。将训练样本和求得的决策边界画到图上,同时把以往用Bayes 方法求得的分类器也画到图上,比较结果的异同。

四、原理简述及程序框图

1.不考虑类别信息对整个样本集进行K-L 变换

(1)读入female.txt 和male.txt 两组数据,组成一个样本集。计算样本均值向量u E x ????

=和协方差()()T

x u x u c E ??--??

= (2)计算协方差阵特征值和特征向量 (3)选取特征值最大的特征向量作为投影方向 (4)选取阈值进行判断

计算样本均值向量和协方差

协方差阵特征值和特征向量

选取特征值最大的特征向量作为投影方向

选取阈值进行判断

2.利用类平均向量提取判别信息来进行K-L 变换

(1)读入female.txt 和male.txt 两组数据,组成一个样本集。分别计算样本均值向量i u E x ????= 和协方差()()T i x u x u c E ??--??

= ,及总均值向量 ()

122u u u +=

(2)计算类间离散度矩阵Sb ( ()()()2

1

T

b i

i

i i S p u

u u u ω==

--∑)与类内离散度矩阵Sw

( 2

1

w i i

i S P ==

∑∑

(3)用 ()

T j b j

j j

u S u J X λ=

比较分类性能,选取最佳投影方向

(4)选取阈值进行判断

分别计算样本均值向量和协方差,以及总

的均值

协计算类内离散度与类间离散度矩阵

选取最佳投影方向

选取阈值进行判断

3.正态分布的监督参数估计:

对于多元正态分布,其最大似然估计的结果为:

1

1?N

K K X n μ

==∑ ()()11???N

T

K K K X X N

μ

μ=∑

=--∑

最小错误率Bayes 分类器

判别函数为()0T T i i i i g x x W x w x w =++

其中 11

2i i W -=-∑,1i i w μ-=∑

()1

01122i T i i

i i w u u In InP ω-=-∑-∑+ 具体算法步骤如下:

第一步将训练样本集数据转为矩阵FA ,MA 。

第二步分别对FA ,MA 求取协方差12,∑∑,平均值12,μμ并输入先验概率

()()12,P P ωω

第三步将第二步所得数值代入判别函数表达式得()()12,g x g x 。 第四步将待测样本集数据转为矩阵T ,将T 中数值依次代()()

12g x g x -

,若

()()120

g x g x ->,则判断其为第一类,反之,第二类。

流程图如下:

4.Fisher 线性判别方法求分类器 首先求各类样本均值向量,及2,1,1

==∑∈

i x N m i

x i

i ω

,然后求各个样本的类内离散度矩阵,及()()2,1,=--=

∑∈i m x m x s T

i

w x i i i

,再求出样本的总类内离散度,及()()2211s p s p s ωωω+=,根据公式()211

m m s -=-*ω

ω求出把二维X 空

间投影到一维Y 空间的最好的投影方向。再求出一维Y 空间中各类样本均值

2,1,1

'==

∑∈i y N m i

y i

i ω,其中

x y **

=ω,本次实验的分界阈值我们用如下方法得到:2

122110'

'N N m N m N y ++=

,最后,将测试样本中的值代入,求出y ,并将其

与y0来进行比较来分类。

流程图如下:

五、实验结果及分析总结

1.不考虑类别信息对整个样本集进行K-L变换

实验中不考虑类别信息,用FAMALE.TXT和MALE.TXT的数据作为本次实验使用的样本集,建立基于K-L变换的分类器,记录错误率。

特征向量为(0.6269,0.7719)

男判为女:10 错误率10%

女判为男:4 错误率4%

2.利用类均值向量的特征提取实验结果

实验中考虑类别信息,用FAMALE.TXT和MALE.TXT的数据作为本次实验使用的样本集,设定男女先验概率分别为0.75和0.25,建立基于K-L变换的分类器,记录分类错误率。

特征向量为(0.6153,0.7883)

男判为女:10 错误率10%

女判为男:3 错误率3%

分析:不考虑类别信息的基于K-L 变换的特征提取再分类与Fisher 分类器效果

差不多(Fisher 线性判别方法 男判为女8个 女判为男4个),不过在本次实验中,Fisher 判别更胜一筹。考虑类别信息时,分类效果会受到先验概率的影响。

3.最小错误率贝叶斯决策

根据最大似然估计出的男生身高体重均值为173.9200 65.5020

协方差矩阵为∑∧

??????8982.590582.230582.237536.20

女生身高体重均值为 162.8400 52.5960

协方差矩阵为 ∑∧

??

????1288.315254.155254.159344.43

由表可知:

对于测试样本,当男女先验概率为0.5vs0.5时,测试样本1判别错误率最小; 对于测试样本,当男女先验概率为为0.25vs0.75时,测试样本2判别错误率最小;

模式识别——用身高和或体重数据进行性别分类

用身高和/或体重数据进行性别分类 1、【实验目的】 (1)掌握最小错误率Bayes 分类器的决策规则 (2)掌握Parzen 窗法 (3)掌握Fisher 线性判别方法 (4)熟练运用matlab 的相关知识。 2、【实验原理】 (1)、最小错误率Bayes 分类器的决策规则 如果在特征空间中观察到某一个(随机)向量x = ( x 1 , x 2 ,…, x d )T ,已知类别状态的先验概率为:()i P w 和类别的条件概率密度为(|)1,2,3...i P x w i c =,根据Bayes 公式得到状态的后验概率 有:1 (|)() (|)(|)() i i i c j j j p P P p P ωωωωω== ∑x x x 基本决策规则:如果1,...,(|)max (|)i j j c P P ωω==x x ,则i ω∈x ,将 x 归属后验概率最大的类 别 。 (2)、掌握Parzen 窗法 对于被估计点X : 其估计概率密度的基本公式(x)N k N N N p V =,设区域 R N 是以 h N 为棱长的 d 维超立方体, 则立方体的体积为d N N V h =; 选择一个窗函数(u)?,落入该立方体的样本数为x x 1 ( )i N N N h i k ?-== ∑,点 x 的概率密度: x x 11 1(x)( )N i N N k N N N V h i N p V N ?-== =∑ 其中核函数:x x 1 i K(x,x )( )i N N V h ?-=,满足的条件:i (1) K(x,x )0≥;i (2) K(x,x )dx 1=?。 (3)、Fisher 线性判别方法 Fisher 线性判别分析的基本思想:通过寻找一个投影方向(线性变换,线性组合),将

身高体重分析

经济运行模拟:身高体重分析 姓名:王萌萌 学号:20094120216 指导老师:乔雅君 院系:经济学院

身高体重分析 王萌萌 (河南财经政法大学经济学院郑州 450000) 一、实验目的 为了研究河南财经政法大学09级经济学院同学身高体重的关系,同时考虑性别因素对体重的影响。建立身高体重模型,首先对经济二班同学的身高体重回归分析。为了进一步说明身高对于体重的影响,同时对经济学院四个班同学的身高体重进行回归分析。 二、数据说明 表 1:09级经济学院四个班学生身高体重数据

以上数据由09级经济学院学生登记提供 三、实证分析 (一)09级经济二班同学的身高体重简单回归分析 1.建立模型 为了分析09级经济二班身高体重的关系。估计模型如下: u H W +?+?=10 其中W 代表体重(kg ),H 代表身高(cm),10??、代表回归系数,u 代表随机误差项。 2.估计结果 通过运行Eviews5.0估计结果如下: 表二:二班同学身高h (cm )体重w (kg )估计结果 Dependent Variable: W Method: Least Squares Date: 05/11/12 Time: 08:41 Sample: 1 43 Included observations: 43

Variable Coefficient Std. Error t-Statistic Prob. H 1.238985 0.152011 8.150606 0.0000 C -150.4884 25.78017 -5.837373 0.0000 R-squared 0.618365 Mean dependent var 59.41860 Adjusted R-squared 0.609056 S.D. dependent var 12.28284 S.E. of regression 7.679906 Akaike info criterion 6.960487 Sum squared resid 2418.219 Schwarz criterion 7.042403 Log likelihood -147.6505 F-statistic 66.43238 Durbin-Watson stat 1.950340 Prob(F-statistic) 0.000000 估计方程为: H W 238985.14884.150?+-= 25.78017 0.152011 t 值 -5.837373 8.150606 P 值 0.0000 0.0000 2R =0.618365,2R =0.609056,F=66.43238(P=0.0000) 3.模型检验 P 检验:由表一可知,p 值(0.0000),在0.05的显著水平下,p 值小于0.05,拒绝原假设。说明二班同学身高对体重的影响是显著的。 (二)二班数据加虚拟变量回归(加法模型) 1.建立模型 为了研究二班同学身高体重关系,并考虑性别因素建立模型如下 加法模型u S H W +?+?+?=210其中W 代表体重(kg ),H 代表身高(cm ),S 代表性别, ?? ?=女 男10S 为虚拟变量,10??、是回归系数,u 是随机误差项。 表三:二班同学身高体重模型考虑性别因素估计结果(加法模型) Dependent Variable: W Method: Least Squares Date: 05/11/12 Time: 09:12 Sample: 1 43 Included observations: 43 Variable Coefficient Std. Error t-Statistic Prob. S -7.591082 4.365116 -1.739033 0.0897 H 0.820754 0.282592 2.904375 0.0060 C -75.57212 49.89161 -1.514726 0.1377

用身高和体重数据进行性别分类的实验报告

用身高和体重数据进行性别分类的实验报告(二) 一、 基本要求 1、试验非参数估计,体会与参数估计在适用情况、估计结果方面的异同。 2、试验直接设计线性分类器的方法,与基于概率密度估计的贝叶斯分类器进行比较。 3、体会留一法估计错误率的方法和结果。 二、具体做法 1、在第一次实验中,挑选一次用身高作为特征,并且先验概率分别为男生0.5,女生0.5的情况。改用Parzen 窗法或者k n 近邻法估计概率密度函数,得出贝叶斯分类器,对测试样本进行测试,比较与参数估计基础上得到的分类器和分类性能的差别。 2、同时采用身高和体重数据作为特征,用Fisher 线性判别方法求分类器,将该分类器应用到训练和测试样本,考察训练和测试错误情况。将训练样本和求得的决策边界画到图上,同时把以往用Bayes 方法求得的分类器也画到图上,比较结果的异同。 3、选择上述或以前实验的任意一种方法,用留一法在训练集上估计错误率,与在测试集上得到的错误率进行比较。 三、原理简述及程序框图 1、挑选身高(身高与体重)为特征,选择先验概率为男生0.5女生0.5的一组用Parzen 窗法来求概率密度函数,再用贝叶斯分类器进行分类。 以身高为例 本次实验我们组选用的是正态函数窗,即21()2u u φ?? = -???? ,窗宽为N h h =h 是调节的参量,N 是样本个数) d N N V h =,(d 表示维度)。因为区域是一维的,所以体积为N n V h =。Parzen 公式为()?N P x =111N i i N N x x N V h φ=??- ???∑。 故女生的条件概率密度为11111111N i i n x x p N VN h φ=??-= ??? ∑

实验报告

实验三人体身体素质的测定 [实验目的] 掌握测定身体素质的测试方法 [实验对象] 学生xxx [器材] 握力计、背力计、纵跳仪、闭眼单脚站立仪、身高体重仪 [步骤] 1 握力 将握柄调至受试者2—5指的第二关节至大拇指虎口的距离→一手握住握力计,双臂下垂,全力握握力计→读数最大时即为握力值(连测3次,每次中间间隔30S,取最大值)。 2 背力 站于背力计踏板指定位置→上体前倾30度→手心向里紧握把柄,双腿伸直,用最大力量拉背力计(连测3次,每次中间间隔30S,取最大值)。 3纵跳 测试时,受试者站在纵跳仪踏板上,尽力垂直向上跳起。测试两次取最大值记录以厘米为单位,保留小数点后一位。 4、闭眼单脚站立仪 自动测试人闭眼单足站立的时间,反映人体的平衡能力。能准确判断测试者站立脚移动和抬起脚下落的动作。 5、身高体重仪 立正姿势站在测试仪的底板上,上肢自然下垂,脚跟并拢,足尖分开约成60度角。躯干自然挺直,头部正直,两眼平视;赤足。电子进行测试;同时测试出人体体重;并进行BMI的分析。 结果与分析 身高: cm 体重: kg BMI: 为正常还是 握力: kg 背力: kg 纵跳: cm 闭眼单脚站立: s

四、人体ABO血型试验 一、实验目的:掌握测定人体血型的方法 二、原理:血型是红细胞上特异抗原的类型。在 ABO血型系统,根据红细胞上是否含有A、B抗原而分为A、B、AB、O血型。血型鉴定是将受试者的红细胞加入标准A型血清(含足量的抗B抗体)与标准B型血清(含足量的抗A抗体)中,观察有无凝集现象,从而测知受试者红细胞上有无A抗原或B抗原。 三、实验用设备:采血针、玻片、滴管、牙签、标准A、B型血清、酒精棉球、消毒棉签。 四、实验对象:体育学院*班学生 XXX 五、实验内容与方法: 1、酒精棉球消毒左手无名指端,用消毒采血针刺破皮肤。将血液挤压滴在滴在玻片的两侧。 2、将标准 A型与B型血清各一滴,滴在玻片的两侧,分别标用A与B。 3、用两支牙签分别混匀(注意严防两种血清接触)。 4、15min后用肉眼观察有无凝集现象。 六、结果与分析 经检验,本人的血型为

R语言实验报告—回归分析在女性身高与体重的应用

R语言实验报告 回归分析中 身高预测体重的模型 学院: 班级: 学号: 姓名: 导师: 成绩:

目录 一、实验背景 (1) 二、实验目的 (1) 三、实验环境 (1) 四、实验内容 (1) 1.给出实验女性的身高体重信息; (2) 2.运用简单线性回归分析; (2) 3.运用多项式回归分析 (2) 五、实验过程 (2) (一)简单线性回归 (2) 1.展示拟合模型的详细结果 (2) 2.女性体重的数据 (2) 3.列出拟合模型的预测值 (3) 4.列出拟合模型的残差值 (3) 5.得出身高预测体重的散点图以及回归线 (3) (二)多项式回归 (5) 1.展示拟合模型的详细结果 (5) 2.身高预测体重的二次回归图 (5) 六、实验分析 (7) 七、总结 (7)

一、实验背景 从许多方面来看,回归分析都是统计学的核心。她其实是一个广义的概念,通指那些用一个或多变量(也称自变量或解释变量)来预测响应变量(也称因变量、效标变量或结果变量)的方法。通常,回归分析可以用来挑选与响应变量相关的解释变量,可以描述两者的关系,也可以生成一个等式,通过解释变量来预测响应变量。 二、实验目的 R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具; 本次试验要求掌握了解R语言的各项功能和函数,能够通过完成试验内容对R语言有一定的了解,会运用软件对数据进行分析; 通过本实验加深对课本知识的理解以及熟练地运用R语言软件来解决一些复杂的问题。 三、实验环境 Windows系统,R或者R Studio 四、实验内容 本实验提供了15个年龄在30—39岁间的女性的身高和体重信息,运用回归分析的方法通过身高来预测体重,获得一个等式可以帮助我们分辨哪些过重或过轻的个体。

人体实验报告

人体实验报告 篇一:人体尺寸实验报告 实验报告 一、实验目的 通过课桌椅设计,切实感受和认识人的因素在产品设计中的重要性,初步领会在产品设计中正确处理人的因素的方法。 同时了解座椅与人体骨骼结构、血液循环、体压、肌肉、神经等生理解剖因素的关系,以及怎么样才能设计符合人体生理解剖要求的课桌椅。 二、实验要求 通过对人体测量部分知识的复习,并对如何进行正确的人体测量,以及各种测量工具使用的介绍,要求学生全面掌握人体测量的正确方法并熟练运用到设计中。利用已掌握的正确人体测量方法,运用相应的测量工具,3-5人一组,完成个人数据的测量,并对如何进行课桌椅的设计展开初步的方案思考。 三、实验步骤: 1、认识测量工具 测量中所需仪器:人体侧高仪、人体测量用直角规、人体测量用弯角规、软卷尺 A、人体侧高仪 技术标准:国标GB5704.1-85

适用范围:适用于读数为1mm,测量范围为0-1996mm人体高度尺寸的测量 B、人体测量用直脚规技术标准:国标GB5704.2-85 适用范围:适用于读数为1mm和0.1mm,测量范围为0-200mm和0-250mm人体尺寸的测量 C、人体测量用弯脚规技术标准:国标GB5704.3-85 适用范围:适用于读数为1mm,测量范围为0-300mm的人体尺寸的测量 2、介绍人体测量方法 1)测量条件 本标准所规定的测量方法,只有在被测者姿势、测量基准面和其他测量条件符合下列要求的前提下始有效。 1.1 基本姿势 1.1.1 直立姿势(简称:立姿)被测者挺胸直立,头部以眼耳平面定位,眼睛平视前方,肩部放松,上肢自然下垂,手伸直,手掌朝向体侧,手指轻贴大腿侧面,膝部自然伸直,左、右足后跟并拢,前端分开,使两足大致呈45°夹角,体重均匀分布于两足。为确保直立姿势正确,被测者应使足后跟、臀部和后背部与同一铅垂面相接触。(内容可略) 1.1.2 坐姿被测者挺胸坐在被调节到腓骨头高度的平面上,头部以眼耳平面定位,眼睛平视前方,左、右大腿大致平行,膝大致弯屈成直角,足平放在地面上,手轻放在大腿上。为确保坐姿正确,被测者的臀部、后背部应同时靠在

人体尺寸测量实验报告

人体尺寸测量实验报告 篇一:人体尺寸实验报告 实验报告 一、实验目的 通过课桌椅设计,切实感受和认识人的因素在产品设计中的重要性,初步领会在产品设计中正确处理人的因素的方法。 同时了解座椅与人体骨骼结构、血液循环、体压、肌肉、神经等生理解剖因素的关系,以及怎么样才能设计符合人体生理解剖要求的课桌椅。 二、实验要求 通过对人体测量部分知识的复习,并对如何进行正确的人体测量,以及各种测量工具使用的介绍,要求学生全面掌握人体测量的正确方法并熟练运用到设计中。利用已掌握的正确人体测量方法,运用相应的测量工具,3-5人一组,完成个人数据的测量,并对如何进行课桌椅的设计展开初步的方案思考。 三、实验步骤: 1、认识测量工具 测量中所需仪器:人体侧高仪、人体测量用直角规、人

体测量用弯角规、软卷尺 A、人体侧高仪 技术标准:国标GB5704.1-85 适用范围:适用于读数为1mm,测量范围为0-1996mm人体高度尺寸的测量 B、人体测量用直脚规技术标准:国标GB5704.2-85 适用范围:适用于读数为1mm和0.1mm,测量范围为0-200mm和0-250mm人体尺寸的测量 C、人体测量用弯脚规技术标准:国标GB5704.3-85 适用范围:适用于读数为1mm,测量范围为0-300mm的人体尺寸的测量 2、介绍人体测量方法 1)测量条件 本标准所规定的测量方法,只有在被测者姿势、测量基准面和其他测量条件符合下列要求的前提下始有效。 1.1 基本姿势 1.1.1 直立姿势(简称:立姿)被测者挺胸直立,头部以眼耳平面定位,眼睛平视前方,肩部放松,上肢自然下垂,手伸直,手掌朝向体侧,手指轻贴大腿侧面,膝部自然伸直,左、右足后跟并拢,前端分开,使两足大致呈45°夹角,体

身高体重实验报告

身 高 体 重 关 系 实 验 报 告 姓名:李智辉 班级:经济二班 学号:20094120213

实验报告:身高体重模型 李智辉 (河南财经政法大学经济2班河南郑州) 一、实验目的 首先以09级经济二班的身高体重数据得出身高与体重的关系是不显著的,这是因为数据偏少造成的。于是,扩大数据容量,以经济学院09级四个班的身高体重数据进行模型估计,得出身高与体重的关系是显著的。然后引入了性别虚拟变量,分别对男、女的身高体重的关系进行了估计,最后得出了“无论男女,身高与体重的关系都是显著的”的结论。 最终的实验目的是通过对身高体重模型的估计,得出身高与体重的关系是显著的。 二、数据说明 通过对河南财经政法大学经济学院四个班的学生进行实际调查统计,我们得到四个班同学的身高(cm)、体重(kg)、数据,如下列表: 表1:经济二班的数据 身高H体重W性别S身高H体重W性别S 18080男16147女 17259男16051女 17066男16045女 16952女16052女 16452女16054女 17055男16046女 16050女16257女 17254女17671男 16247女18770男 18290男18770男 16453女17256男 17055男17875男 17680男17560男 17668男16342女 16854女17861男 16757女17560男 16553女17575男 16350女17964男 16251女17695男 16046女16255女 16752女17575男 16550女

表2:经济学院四个班身高体重数据 经济一班经济二班经济三班经济四班 身高体 重 性 别 身 高 体 重 性 别 身 高体重 性 别 身 高体重 性 别 165 58 女180 80 男165 70 男160 46 女170 60 男172 59 男160 63 女165 55 女176 56 男170 66 男171 62 女165 50 女168 58 女169 52 女174 62 男161 53 女164 50 女164 52 女158 46 女168 58 女173 75 男170 55 男158 47 女166 60 女169 54 女160 50 女179 65 男177 63 男162 55 女172 54 女175 64 男159 54 女173 59 男162 47 女160 60 女161 53 女170 63 男182 90 男163 55 女157 52 女165 55 男164 53 女161 60 女165 55 男176 68 男170 55 男163 55 女159 54 女173 60 男176 80 男158 40 女162 53 女173 58 男176 68 男167 52 女160 58 女172 55 男168 54 女180 62 男160 48 女155 45 女167 57 女172 65 男163 48 女186 88 男165 53 女175 65.5 男162 47 女175 56 男163 50 女160 50 女163 55 女165 55 男162 51 女180 78 男162 47 女168 54 女160 46 女158 53 女160 51 女170 65 男167 52 女181 80 男160 57 女170 55 男165 50 女172 60 男160 44 女165 53 女161 47 女172 76 男165 51.5 女165 53 女160 51 女176 73 男162 50 女163 48 女160 45 女163 52 女170 60 男159 55 女160 52 女173 65 男175 65 男181 78 男160 54 女161 60 女170 58 男170 66 男160 46 女164 50 女171 80 男158 46 女162 57 女166 53 女166 59 男162 50 女176 71 男187 80 男167 54 女168 62 女187 70 男163 53 女167 55 女163 50 女187 70 男161 55 女170 60 男165 54 女172 56 男173 65 男172 76 男159 52 女178 75 男176 70 男170 55 男168 52 女175 60 男178 69 男176 70 男155 50 女163 42 女170 60 男169 61 男163 60 女178 61 男172 56 女169 72 男160 58 女175 60 男163 53 女170 72 男160 45 女175 75 男174 60 男172 55 男168 58 女179 64 男158 43 女178 75 男163 50 女176 95 男167 55 男175 65 男175 65 男162 55 女 175 75 男

用身高和体重数据进行分类实验

用身高和体重数据进行性别分类的实验报告 一、基本要求: 1.用FAMALE.TXT和MALE.TXT的数据作为训练样本集,建立Bayes分类器,用测试样本数据对该分类器进行测试。调整特征、分类器等方面的一些因素,考察它们对分类器性能的影响,从而加深对所学内容的理解和感性认识。二、具体做法: (1)应用单个特征进行实验:以(a)身高或者(b)体重数据作为特征,在正态分布假设下利用最大似然法或者贝叶斯估计法估计分布密度参数,建立最小错误率Bayes分类器,写出得到的决策规则,将该分类器应用到测试样本,考察测试错误情况。在分类器设计时可以考察采用不同先验概率(如0.5对0.5, 0.75对0.25, 0.9对0.1等)进行实验,考察对决策规则和错误率的影响。 (2)应用两个特征进行实验:同时采用身高和体重数据作为特征,分别假设二者相关或不相关,在正态分布假设下估计概率密度,建立最小错误率Bayes分类器,写出得到的决策规则,将该分类器应用到训练/测试样本,考察训练/测试错误情况。比较相关假设和不相关假设下结果的差异。在分类器设计时可以考察采用不同先验概率(如0.5 vs. 0.5, 0.75 vs. 0.25, 0.9 vs. 0.1等)进行实验,考察对决策和错误率的影响。 (3)自行给出一个决策表,采用最小风险的Bayes决策重复上面的某个或全部实验。 三、原理简述及程序框图 最小错误率Bayes分类器 (1)基于身高 第一步求出训练样本的方差和期望 第二步利用单变量正态分布公式算出条件概率 第三步将前两步的值带入贝叶斯公式

第四步 若pF>=pM ,则判断其为第一类,反之,第二类 (2-1) 假设身高与体重不相关 令协方差矩阵次对角元素为零 判别函数可简化为()0T T i i i i g x x W x w x w =++ 其中 11 2 i i W -=-∑,1i i w μ-=∑ ()1 01122 i T i i i i w u u In InP ω-=-∑-∑+ 具体算法步骤如下: 第一步将训练样本集数据转为矩阵FA ,MA 。 第二步分别对FA ,MA 求取协方差12,∑∑,令协方差矩阵次对角 元素为零,平均值12,μμ并输入先验概率()()12,P P ωω 第三步将第二步所得数值代入判别函数表达式得()()12,g x g x 。 第四步将待测样本集数据转为矩阵T ,将T 中数值依次代()()12g x g x - ,若()()120g x g x ->,则判断其为第一类,反之,第二类。

用身高和或体重数据进行性别分类的实验

未来若干次作业需要用到的数据文件: ●FAMALE.TXT 50个女生的身高、体重数据 ●MALE.TXT 50个男生的身高、体重数据 ----- 训练样本集 ●test1.txt 35个同学的身高、体重、性别数据(15个女生、20个男生) ●test2.txt 300个同学的身高、体重、性别数据(50个女生、250个男生) ----- 测试样本集 作业. 用身高和/或体重数据进行性别分类的实验(一) 基本要求: 用FAMALE.TXT和MALE.TXT的数据作为训练样本集,建立Bayes分类器,用测试样本数据对该分类器进行测试。调整特征、分类器等方面的一些因素,考察它们对分类器性能的影响,从而加深对所学内容的理解和感性认识。 具体做法: 1.应用单个特征进行实验:以(a)身高或者(b)体重数据作为特征,在正态分布假设下利用最大似然法或者贝叶斯估计法估计分布密度参数,建立最小错误率Bayes分类器,写出得到的决策规则,将该分类器应用到测试样本,考察测试错误情况。在分类器设计时可以考察采用不同先验概率(如0.5对 0.5, 0.75对0.25, 0.9对0.1等)进行实验,考察对决策规则和错误率的影响。2.应用两个特征进行实验:同时采用身高和体重数据作为特征,分别假设二者相关或不相关,在正态分布假设下估计概率密度,建立最小错误率Bayes分类器,写出得到的决策规则,将该分类器应用到训练/测试样本,考察训练/测试错误情况。比较相关假设和不相关假设下结果的差异。在分类器设计时可以考察采用不同先验概率(如0.5 vs. 0.5, 0.75 vs. 0.25, 0.9 vs. 0.1等)进行

SPSS实验报告

描述性统计分析 一、实验目得 1.进一步了解掌握SPSS专业统计分析软件,能更好地使用其进行数据统计分析。 2.学习描述性统计分析及其在SPSS中得实现,内容具体包括基本描述性统计量得定义及 计算﹑频率分析﹑描述性分析﹑探索性分析﹑交叉表分析等。 3.复习权重等前章得知识。 二﹑实验内容 题目一 打开数据文件“data4-5、sav”,完成以下统计分析: (1)计算各科成绩得描述统计量:平均成绩、中位数、众数、标准差、方差、极差、最大值与最小值; (2)使用“Recode”命令生成一个新变量“成绩段”,其值为各科成绩得分段:90~100为1,80~89为2,70~79为3,60~69为4,60分以下为5,其值标签设为:1-优,2-良,3-中,4-及格,5-不及格。分段以后进行频数分析,统计各分数段得人数,最后生成条形图与饼图。1.解决问题得原理 因为问题涉及各科成绩,用描述性分析,第二问要先进行数据分段,其后利用频数分析描述统计量并可以生成条形图等。 2、实验步骤 针对第一问 第1步打开数据 菜单选择:“文件→打开→数据”,将“data4-8、sav”导入。 第2步文件拆分 菜单选择:“数据→拆分文件”,打开“分割文件”对话框,点击比较组按钮,将“科目”加入到“分组方式”列表框中,并确定。

第3步描述分析设置: (1)选择菜单:“分析→描述统计→描述”, 打开“描述性”对话框,将“成绩””加入到“变量”列表框中。 打开“选项”对话框,选中如下图中得各项。 点击“继续”按钮。 (4)回到“描述性”对话框,点击确定。 针对第二问 第1步频率分析设置: (1)选择菜单:“分析→描述统计→频率”, (2)打开“频率(F)”对话框,点击“合计”。再点击“继续”按钮、

人体尺寸实验报告

实验报告 一、实验目的 通过课桌椅设计,切实感受和认识人的因素在产品设计中的重要性,初步领会在产品设计中正确处理人的因素的方法。 同时了解座椅与人体骨骼结构、血液循环、体压、肌肉、神经等生理解剖因素的关系,以及怎么样才能设计符合人体生理解剖要求的课桌椅。 二、实验要求 通过对人体测量部分知识的复习,并对如何进行正确的人体测量,以及各种测量工具使用的介绍,要求学生全面掌握人体测量的正确方法并熟练运用到设计中。利用已掌握的正确人体测量方法,运用相应的测量工具,3-5人一组,完成个人数据的测量,并对如何进行课桌椅的设计展开初步的方案思考。 三、实验步骤: 1、认识测量工具 测量中所需仪器:人体侧高仪、人体测量用直角规、人体测量用弯角规、软卷尺 A、人体侧高仪 技术标准:国标GB5704.1-85 适用范围:适用于读数为1mm,测量范围为0-1996mm人体高度尺寸的测量 B、人体测量用直脚规 技术标准:国标GB5704.2-85 适用范围:适用于读数为1mm和0.1mm,测量范围为0-200mm和0-250mm人体尺寸的测量 C、人体测量用弯脚规 技术标准:国标GB5704.3-85 适用范围:适用于读数为1mm,测量范围为0-300mm的人体尺寸的测量

2、介绍人体测量方法 1)测量条件 本标准所规定的测量方法,只有在被测者姿势、测量基准面和其他测量条件符合下列要求的前提下始有效。 1.1 基本姿势 1.1.1 直立姿势(简称:立姿)被测者挺胸直立,头部以眼耳平面定位,眼睛平视前方,肩部放松,上肢自然下垂,手伸直,手掌朝向体侧,手指轻贴大腿侧面,膝部自然伸直,左、右足后跟并拢,前端分开,使两足大致呈45°夹角,体重均匀分布于两足。为确保直立姿势正确,被测者应使足后跟、臀部和后背部与同一铅垂面相接触。(内容可略) 1.1.2 坐姿被测者挺胸坐在被调节到腓骨头高度的平面上,头部以眼耳平面定位,眼睛平视前方,左、右大腿大致平行,膝大致弯屈成直角,足平放在地面上,手轻放在大腿上。为确保坐姿正确,被测者的臀部、后背部应同时靠在同一铅垂面上。(内容可略) 无论何种测量姿势,身体都必须保持左右对称。由于呼吸而使测量值有变化的测量项目,应在呼吸平静时进行测量。 1.2 测量基准面 矢状面、正中矢状面、冠状面、水平面、眼耳平面 1.3 测量方向 足侧端、内侧、外侧、近位、远位、尺侧、胫侧、腓侧。 1.4 支撑面 立姿时站立的地面或平台以及坐姿时的椅平面应是水平的、稳固的和不可压缩的。 1.5 被测者的衣着 要求被测者裸体或穿着尽量少的内衣(例如只穿内裤和汗背心)在后者的情况下,在测量胸围时,男性应撩起汗背心、女性应松去胸罩后进行测量。 1.6 测量值读数精度 线性测量项目的测量值读数精度为1毫米,体重的读数精度为0.5公斤。 2)坐姿测量项目的测量方法

统计学实验报告

统计学实验报告

实验一:数据特征的描述 实验内容包括:众数、中位数、均值、方差、标准差、峰度、偏态等实验资料:某月随机抽取的50户家庭用电度数数据如下: 88 65 67 454 65 34 34 9 77 34 345 456 40 23 23 434 34 45 34 23 23 45 56 5 66 33 33 21 12 23 3 345 45 56 57 58 56 45 5 4 43 87 76 78 56 65 56 98 76 55 44 实验步骤: (一)众数 第一步:将50个户的用电数据输入A1:A50单元格。 第二步:然后单击任一空单元格,输入“=MODE(A1:A50)”,回车后即可得众数。 (二)中位数 仍采用上面的例子,单击任一空单元格,输入“=MEDIAN(A1:A50)”,回车后得中位数。 (三)算术平均数 单击任一单元格,输入“=AVERAGE(A1:A50)”,回车后得算术平均数。 (四)标准差 单击任一单元格,输入“=STDEV(A1:A50)”,回车后得标准差。 故实验结果如下图所示:

上面的结果中,平均指样本均值;标准误差指样本平均数的标准差;中值即中位数;模式指众数;标准偏差指样本标准差,自由度为n-1;峰值即峰度系数;偏斜度即偏度系数;区域实际上是极差,或全距。 实验二:制作统计图 实验内容包括: 1.直方图:用实验一资料 2.折线图、柱状图(条形图)、散点图:自编一时间序列数据, 不少于10个。 3.圆形图:自编有关反映现象结构的数据,不少于3个。 实验资料:1.直方图所用数据:某月随机抽取的50户家庭用电度数数据如下: 88 65 67 454 65 34 34 9 77 34 345 456 40 23 23 434 34 45 34 23 23 45 56 5 66 33 33 21 12 23 3 345 45 56 57 58 56 45 5 4 43 87 76 78 56 65 56 98 76 55 44 2.折线图、柱状图(条形图)、散点图、圆形图所用数据: 2005年至2014年各年GDP总量统计如下: 年份 GDP (亿元) 2005 184575.8 2006 217246.6 2007 268631 2008 318736.1 2009 345046.4 2010 407137.8 2011 479576.1 2012 532872.1 2013 583196.7 2014 634043.4 实验步骤:

2-18岁男生身高体重对照表

2-18岁男生身高体重对照表注:根据2005年九省/市儿童体格发育调查数据研究制定 年龄矮小偏矮正常偏高高个 3rd 10th 50th 90th 97th 身高 (cm) 体重 (kg) 身高 (cm) 体重 (kg) 身高 (cm) 体重 (kg) 身高 (cm) 体重 (kg) 身高 (cm) 体重 (kg) 2岁82.1 10.22 84.1 10.90 88.5 12.54 93.1 14.64 95.3 15.46 2.5 岁 86.4 11.11 88.6 11.85 93.3 13.64 98.2 15.73 100.5 16.83 3岁89.7 11.94 91.9 12.74 96.8 14.65 101.8 16.92 104.1 18.12 3.5 岁 93.4 12.73 95.7 13.58 100.6 15.63 105.7 18.08 108.1 19.38 4岁96.7 13.52 99.1 14.43 104.1 16.64 109.3 19.29 111.8 20.71 4.5 岁 100.0 14.37 102.4 15.35 107.7 17.75 113.1 20.67 115.7 22.24 5岁103.3 15.26 105.8 16.33 111.3 18.98 116.9 22.23 119.6 24.00 5.5 岁 106.4 16.09 109.0 17.26 114.7 20.18 120.5 23.81 123.3 25.81 6岁109.1 16.80 111.8 18.06 117.7 21.26 123.7 25.29 126.6 27.55 6.5111.7 17.53 114.5 18.92 120.7 22.45 126.9 27.00 129.9 29.57

身高体重标准表

0~10岁儿童身高体重标准表

儿童身长可预测成年身高 用小儿身长预测成年时身高法: 1、男性身高=出生时身长(厘米)÷0.2949;女性身高=出生时身长(厘米)÷0.3109。用此公式要注意:只适用于正常足月新生儿;测量身长数据时如能精确到0.1厘米,身高的预测将更准确: 2、男性身高=3岁时身高×0.545+父母平均身高×0.544+37.69(厘米):女性身高=3岁时身高×0.545+父母平均身高×0.544+25.63(厘米)。人体标准身高预测公式(遗传法则) 男性身高=(父亲身高+母亲身高)×1.08÷2(厘米) 女性身高=(父亲身高×0.923+母亲身高)÷2(厘米) 上述公式大体上符合高加高生高,高加矮生高,矮加矮生矮的遗传学原则。 骨龄可知孩子的生长潜力: 骨龄和年龄不是一回事,骨龄是生物年龄,与生长密切相关,常用来评价人生长发育的成熟状态判断骨龄主要是利用X线,拍一张小儿右手腕骨的X片,根据腕骨X片显示的骨化点的个数及小儿的实际年龄就可以确定小儿的生长潜力 骨化点出现比实际年龄早,说明孩子的生长潜力较小;相反说明小儿生长潜力很大有些家长为了孩子能长高些,给孩子服用一些催长的药物,虽然暂时加快了小孩的生长,但由于刹车时间提前反而影响了最终的身高,这种做法显然是不可取的 以上几种方法可相互参照,还可以预知孩子生长发育是否正常和孩子的生长潜力,如发现骨龄和孩子的实际年龄不符,应到医院检查。 青少年身高与哪些因素有关 在青春期生长突增中,身高的增长非常快长高的原因主要是骨骼的发育男孩平均每年可增高7~9厘米,最多可达10~12厘米女孩平均每年可增高5~7厘米,最多可达8~10厘米这主要靠下肢和脊柱的增长一般女性在19~23岁男性在23~26岁身高才停止增长这时因为骨骺闭合,所以不能再生长了由于女性的骨骺闭合一般比男性早,所以成年女性比男性矮青春期的少男少女都希望自己有较高的身材,这就要进一步了解可能影响身高的因素: (1)身高与性成熟早晚有关 成熟年龄的迟早会影响急速成长的身高一般是急速成长现象发生较早的人,就较快达到终止点;较晚发生的,也较晚达到其终点当性早熟的少女不再长高时,性晚熟的少女却还在长高因此,性晚熟的少女就比较高身高长得最快的时期是青春前

用身高和体重数据进行性别分类的实验报告

用身高和体重数据进行性别分类的实验报告 一、 基本要求 用FAMALE.TXT 和MALE.TXT 的数据作为训练样本集,建立Bayes 分类器,用测试样本数据对该分类器进行测试。调整特征、分类器等方面的一些因素,考察它们对分类器性能的影响,从而加深对所学内容的理解和感性认识。 二、 具体做法 (1)应用两个特征进行实验:同时采用身高和体重数据作为特征,分别假设二者相关或不相关,在正态分布假设下估计概率密度,建立最小错误率Bayes 分类器,写出得到的决策规则,将该分类器应用到训练/测试样本,考察训练/测试错误情况。比较相关假设和不相关假设下结果的差异。在分类器设计时可以考察采用不同先验概率(如0.5 vs. 0.5, 0.75 vs. 0.25, 0.9 vs. 0.1等)进行实验,考察对决策和错误率的影响。 (2)自行给出一个决策表,采用最小风险的Bayes 决策重复上面的实验。 三、 原理简述及程序框图 A. 正态分布的监督参数估计 监督参数估计:样品所属的类别及类条件总体概率密度函数的形式 为已知,而表征概率密度函数的某些参数是未知的。 本实验符合上述条件且在正态分布假设下估计分布密度参数故使用正态分布的监督参数估计 对于多元正态分别,其最大似然估计的结果为: 1 1?N K K X n μ ==∑ ()()1 1???N T K K K X X N μμ=∑=--∑ B. 最小错误率Bayes 分类器

在多元正态模型下的最小错误率角度来分析Bayes 分类器 (1) 假设身高与体重不相关 令协方差矩阵次对角元素为零 判别函数可简化为()0T T i i i i g x x W x w x w =++ 其中 11 2 i i W -=-∑,1i i w μ-=∑ ()1 01122 i T i i i i w u u In InP ω-=-∑-∑+ 具体算法步骤如下: 第一步将训练样本集数据转为矩阵FA ,MA 。 第二步分别对FA ,MA 求取协方差12,∑∑,令协方差矩阵次对角 元素为零,平均值12,μμ并输入先验概率()()12,P P ωω 第三步将第二步所得数值代入判别函数表达式得()()12,g x g x 。 第四步将待测样本集数据转为矩阵T ,将T 中数值依次代()()12g x g x - ,若()()120g x g x ->,则判断其为第一类,反之,第二类。 (2) 假设身高与体重相关 判别函数可简化为()0T T i i i i g x x W x w x w =++ 其中 11 2 i i W -=-∑,1i i w μ-=∑ ()1 01122 i T i i i i w u u In InP ω-=-∑-∑+ 具体算法步骤如下: 第一步将训练样本集数据转为矩阵FA ,MA 。

身高体重实验报告

实验报告:身高体重模型 一、实验目的 为了分析身高与体重之间是否存在稳定的相关关系,并考察性别因素对身高的影响。本文以河南财法大学经济学院09级学生的身高体重数据为例,利用普通最小二乘法对其进行了回归分析,并试图找出身高与体重之间的关系。 二、数据说明 以下数据来自河南财经政法大学经济学院09级学生身高体重调查表。 表一:经济学院学生身高体重数据 经济一班经济二班经济三班经济四班 身高体重性别身高体重性别身高体重性别身高体重性别165 58 女180 80 男165 70 男160 46 女170 60 男172 59 男160 63 女165 55 女176 56 男170 66 男171 62 女165 50 女168 58 女169 52 女174 62 男161 53 女164 50 女164 52 女158 46 女168 58 女173 75 男170 55 男158 47 女166 60 女169 54 女160 50 女179 65 男177 63 男162 55 女172 54 女175 64 男159 54 女173 59 男162 47 女160 60 女161 53 女170 63 男182 90 男163 55 女157 52 女165 55 男164 53 女161 60 女165 55 男176 68 男170 55 男163 55 女159 54 女173 60 男176 80 男158 40 女162 53 女173 58 男176 68 男167 52 女160 58 女172 55 男168 54 女180 62 男160 48 女155 45 女167 57 女172 65 男163 48 女186 88 男165 53 女175 65.5 男162 47 女175 56 男163 50 女160 50 女163 55 女165 55 男162 51 女180 78 男162 47 女168 54 女160 46 女158 53 女160 51 女170 65 男167 52 女181 80 男160 57 女170 55 男165 50 女172 60 男160 44 女165 53 女161 47 女172 76 男165 51.5 女

用身高和体重数据进行性别分类的实验报告

用身高和体重数据进行性别分类的 实验报告 部门: xxx 时间: xxx 整理范文,仅供参考,可下载自行编辑

用身高和体重数据进行性别分类的实验报告<二) 一、基本要求 1、实验非参数估计,体会与参数估计在适用情况、估计结果方面的异同。 2、实验直接设计线性分类器的方法,与基于概率密度估计的贝叶斯分类器进行比较。 3、体会留一法估计错误率的方法和结果。 二、具体做法 1、在第一次实验中,挑选一次用身高作为特征,并且先验概率分别为男生0.5,女生0.5的情况。改用Parzen窗法或者kn近邻法估计概率密度函数,得出贝叶斯分类器,对测试样本进行测试,比较与参数估计基础上得到的分类器和分类性能的差别。b5E2RGbCAP 2、同时采用身高和体重数据作为特征,用Fisher线性判别方法求分类器,将该分类器应用到训练和测试样本,考察训练和测试错误情况。将训练样本和求得的决策边界画到图上,同时把以往用Bayes方法求得的分类器也画到图上,比较结果的异同。p1EanqFDPw 3、选择上述或以前实验的任意一种方法,用留一法在训练集上估计错误率,与在测试集上得到的错误率进行比较。DXDiTa9E3d 三、原理简述及程序框图

1、挑选身高(身高与体重>为特征,选择先验概率为男生0.5女生0.5的一组用Parzen窗法来求概率密度函数,再用贝叶斯分类器进行分类。RTCrpUDGiT 以身高为例 本次实验我们组选用的是正态函数窗,即,窗宽为

相关文档
最新文档