地沟油Fisher判别

合集下载

地沟油识别问题

地沟油识别问题

地沟油识别问题摘要本文研究的是一个判别分类问题,解决的是如何根据样本油的各成分含量指标数据来判别样本是优质食用油还是地沟油,并确定哪些指标是影响油质的关键因素,从而减少化验的指标,以便降低化验成本减少化验时间。

问题一中,我们根据数据特征建立Fisher判别函数,确定判别标准与判别临界值,利用SPSS软件将60组优质食用油与24组地沟油样本的7种化学成分含量数据进行处理分析,求出判别函数的非标准化系数,最终求解出具体的判别函数表达式。

然后再根据SPSS分析结果对模型进行有效性评价,模型总的预判正确率为91.7%,说明模型的判别效果是较为理想的。

问题二中,我们利用优质食用油与地沟油的各种成分的均值计算出Fisher 函数判别临界值,再把剩余的16个样本的判别值求解出来,进行对比得出号85、86、87、88、90、91、92为优质食用油,其他的为地沟油。

问题三中,我们分别作出7种化学成分在优质食用油与地沟油内含量的走势图,并对其差异进行比较,判断出成分1,成分4,成分6,成分7为关键因素。

然后采用问题一中Fisher判别函数模型思想,利用SPSS软件对原数据进行分类,得出优质油判别正确率为86.7%,地沟油判别正确率为100%,综合判别正确率为90.5%,与模型一的91.7%差距很小,证明了关键因素提取的正确性。

关键词:地沟油;Fisher判别法;主成分分析法1.问题重述1.1问题背景地沟油,泛指在生活中存在的各类劣质油,如回收的食用油、反复使用的炸油等。

地沟油最大来源为城市大型饭店下水道的隔油池。

油类经长期高温使用后,油内含有分解成苯、芘、萘、蒽及硝酸盐和亚硝酸盐等有毒、有害、甚至是“三致”物质,长期食用可能会引发癌症,对人体的危害极大。

因而地沟油的识别迫在眉睫。

附录中表3是一组数据,分别是优质食用油(编号1-60)和地沟油(编号61-84)以及需要识别的油(编号85-100)的7种化学物质成分的含量。

Fisher 判别法及 主成分分析法 论文

Fisher 判别法及 主成分分析法 论文

地沟油的识别问题摘要本文要解决的问题是根据所给的油的成分,判断该油属于地沟油还是优质油,以及在保证一定的准确率的条件下,用最少的化验指标来判断该油的类别。

问题一模型的建立,通过fisher 算法,依次计算出了地沟油、优质油的样本均值,类内离散度矩阵和类间离散度矩阵,根据类间离散度矩阵与类内离散度矩阵的比值最大,求得最佳投影矩阵。

利用样本数据与最佳投影矩阵的乘积与阈值进行比较,得出判定油类别的判别式。

问题二根据第一问题中所建立的模型,通过matlab编写程序,与阈值进行比较后,得出最后的16组测试数据,前8组属于优质油,后8组属于地沟油。

问题三即需要减少化验指标。

因为影响油的类别的因素十分复杂,该题中给了7种判别油类别的成分,我们需要用为数极少的互补相关的新变量来反映原变量所提供的绝大部分信息。

本题中我们采用了主成份分析法,依次求解出相关系数矩阵、特征值、特征向量、贡献率和累计贡献率,最后通过对综合比重数据的分析,得出将第4种成分、第6种成分和第7种成分作为化验指标比较合理。

模型建立合理,结构清晰,逻辑性强,能够反映实际问题。

本文要解决的问题是根据所给的油的成分,判断该油属于地沟油还是优质油,以及在保证一定的准确率的条件下,用最少的化验指标来判断该油的类别。

关键字:fisher算法、主成分分析、地沟油、优质油一、问题重述1.1问题背景近年来,我国许多地方都存在一个令人发指的问题——“地沟油”问题,这个问题可以说已经成为一个公开的“秘密”。

有些人长期以倒卖“地沟油”为生,他们把这些地沟油经过化学处理后装入成品油流入餐桌,这些地沟油入餐桌严重威胁到我国公众的生命健康。

“地沟油”事件频频发生,已震惊全国,其涉及范围之广,生产规模之大,出乎人们的想象。

虽然我国有关部门经过严厉打击,但“地沟油”事件依然阴魂不散,据专家统计每年返回餐桌的地沟油达百万吨级。

在利益的驱使下,“地沟油”制售从小作坊升级到大工厂,产业分工细化为掏捞、粗炼、倒卖、深加工、批发、零售等多个环节,“地沟油”生意不但打不死,甚至越做越大。

如何分辨地沟油

如何分辨地沟油

如何分辨地沟油
日常生活中,居民如何分辨地沟油?省公安厅治安总队有关负责人教您四招——
一看,看透明度,色泽。

颜色发暗,比较混浊,且有沉淀物,低温易凝固的可能是地沟油。

检测窍门一是给冰棍上倒上一点油,油很快凝固并附着在冰棍上,则很可能是地沟油做成的;窍门二是在玻璃上倒上一点油,如果油流得很慢,则可能有问题。

二闻,每种油都有各自独特的气味。

可以在手掌上滴一两滴油,双手合拢摩擦,发热时仔细闻其气味。

有异味的油,说明质量有问题;有臭味的很可能就是地沟油;若有矿物油的气味更不能买。

三尝,用筷子取一滴油,仔细品尝其味道。

口感带酸味的油是不合格产品,有焦苦味的油已发生酸败,有异味的油可能是“地沟油”。

含地沟油的油炒菜不香,残油渣呈黑炭状。

四听,取油层底部的油一两滴,涂在易燃的纸片上,点燃并听其响声。

燃烧正常无响声的是合格产品;燃烧不正常且发出“吱吱”声音的,水分超标,是不合格产品;燃烧时发出“噼叭”爆炸声,表明油的含水量严重超标,而且有可能是掺假产品。

外卖地沟油怎么分辨

外卖地沟油怎么分辨

外卖地沟油怎么分辨现在一些不法商家为了谋取暴利,经常会用一些准备废弃的地沟油来进行二次烹制,所以大家一定要留心。

但是有时候不在餐厅吃饭,直接点外卖,大家知道外卖地沟油怎么分辨吗?今天就来教大家几招。

外卖地沟油怎么分辨1.闻味道地沟油一般都是从餐厨垃圾当中进行提炼出来的,所以再怎么提炼还会有一股比较怪异的味道。

所以点的外卖拿到家之后先闻一闻,如果没有任何异味的话,可以放心食用。

如果闻上去与自己点的菜的味道不一样,或者是闻到一股奇特的,或者是形容不出的味道臭味,或者是其他菜的味道,那么就要留个心眼,有可能就是地沟油。

2.看颜色如果是新鲜的油,即使放入一些香料熬制成红色之后,油看上去颜色也是比较鲜亮一些。

但是如果是地沟油的话,由于经过提炼,所以油有可能会发黑。

因此点回来的外卖打开之后看一看颜色,如果颜色比较清亮有光泽,那么证明是新鲜的油。

而如果看上去黑乎乎的,甚至颜色非常浓重,那么就有可能怀疑就是地沟油。

3.尝味道吃上一口外卖,如果点的是素菜,但是吃上去不光有素菜的味道,还会有其他菜的味道的话,那么十有八九就是地沟油。

另外明明点的是一种菜,但是吃上去还有另外其他菜的,甚至形容不出来的味道,也有有可能是地沟油。

4.看浓稠度如果是清油的话,吸附在菜的表面比较轻薄,所以用水一涮的话,油就下来了。

但是地沟油的话呢,听过提炼而且特别的粘稠,因此它会粘在菜上,不宜清洗干净。

所以可以准备一碗水去涮一涮菜,如果很容易就把油涮下来,那就证明是干净的油。

而如果怎么涮都不下来,甚至非常的黏的粘在菜上,那肯定是地沟油。

所以大家平时买回来的外卖,首打开之后留心观察,闻一闻它的味道,看看它的颜色,初步判断一下。

实在判断不出的时候,再尝一尝。

而且点外卖的时候还建议大家,一定要选择口碑好,最好是有实体店的外卖店,这样的话吃的才会比较放心。

地沟油简要鉴定指标

地沟油简要鉴定指标

被较多认可的四项指标判定地沟油1.多环芳烃(PAHs):多环芳烃是食用油加热如炒、烤、炸、煎等后产生的含多个苯环的芳香族化合物,属于持久性有机污染物,已被国际癌症研究中心列为致癌物。

2.胆固醇:食用植物油中一般不含胆固醇或含量极低,而地沟油中可能含有动物源性成分,推断如检出胆固醇可怀疑该油脂为地沟油。

3.电导率:正常油脂几乎是不导电的,但油脂酸败后产生极性物质可使油脂产生导电性。

地沟油由于掺杂大量金属离子而产生导电性。

(个人认为成本较低,检测方法简单易行,比较可行)(油样与水进行乳化作用形成混合溶液,测定电导率)4.特定基因组成:地沟油是多种不同来源的废弃油脂混合而成,往往含有动物油脂,检测人员根据分子生物学基因鉴定方法,鉴定油脂中的动物基因,来判定食用油中是否含有动物源性成分。

其他检测方法1.食用油与地沟油紫外可见光谱的吸收特征峰不同,根据光谱曲线形状及吸光度大小鉴别掺了地沟油的食用油,并能鉴定掺兑地沟油的比例:取油样水浴加热,双氧水和活性白土脱色后,紫外分光光度计在230-800范围内扫描吸收光谱。

2.用荧光分析法检测地沟油中含有的表面活性剂成分十二烷基苯磺酸钠:取油样水浴,水相中十二烷基苯磺酸钠具有特征荧光λex/λem=230/290nm,合格食用油的水相在此波长下没有吸收峰。

3.薄层分析法检测,检测食用油中不存在而地沟油中存在的醛、酮类物质:在展开剂作用下,油样中各种成分在硅胶板上进行扩散分离,计算不同薄层斑点的比移值(Rf)。

4.气相色谱法鉴别地沟油,测定油样中胆固醇的含量:油样中脂肪酸经甲酯化处理,程序升温分离,氢火焰离子化检测器进行检测,地沟油有多种油脂的脂肪酸谱图特征。

5.测定折光率:短链饱和脂肪酸酯折光率低,而亚麻油等不饱和脂肪酸含量高的油,折光率就高。

6.皂化值:油脂中脂肪酸分子量大的皂化值小,根据皂化值计算油脂中脂肪酸平均分子量,一般油脂的皂化值在180-200之间。

7.酸价:地沟油与煎炸老油酸价较高。

火锅地沟油怎么分辨

火锅地沟油怎么分辨

火锅地沟油怎么分辨经常看见有些不良商家为了谋取暴利,将原本吃剩下应该倒掉的餐厨垃圾,把它进行二次提炼,制作成各种油来进行烹制。

那今天咱们就聊聊,如果去到火锅店,火锅地沟油怎么分辨呢?其实只要这样做就可以了。

火锅地沟油怎么分辨1.看颜色不管是清油还是牛油锅底,如果是用新鲜的油进行熬制的话,那么的颜色会比较清亮一些,而且是有光泽度,透感比较好。

而如果是用地沟油做二次锅底的话,那么油看上去就比较浑浊,而且看上去会发黑,甚至出现其他的颜色,所以通过颜色,首先可以初步判断是否是地沟油。

2.看成分如果是用新鲜的油现场熬制的,里面除了一些香料之外,是没有其它食材的。

但是如果是用地沟油熬制的火锅锅底,那么有可能在过滤当中,没有完全过滤清干净,所以火锅锅底里面有可能,还会漂浮之前剩下的一些残渣或者一些菜。

所以当火锅锅底端上来之后,要用勺子捞一捞,看看有没有其他食物残渣混在里面,如果有的话,很有可能就是地沟油。

3.闻味道新鲜的油熬制出来的锅底香,没有其他的异味。

但是如果是用地沟油做的锅底的话,那么闻上去会有一股比较浓重的味道,而且这里面还夹杂着其他食材的味道,所以如果通过气味也可以进行辨别。

4.看粘稠度新鲜的油经过熬制之后,虽然有点粘稠,但是还是比较轻薄的。

但是经过过滤的地沟油,因为反复烹煮过滤,所以油是浓稠的,甚至有的时候就像粘液一样,一旦看到这样的油,那么肯定是地沟油就无疑了。

所以通过以上几个方法,可以初步判断是否是地沟油。

但是有些商家会用比较高超一些的手段,把地沟油看的让人无法从肉眼去辨别。

因此大家还是要选择品牌大,正规的火锅店去吃,一些街边流动小摊,或者是无证经营的摊点,就不要去吃了,多半是地沟油。

曝地沟油鉴别八法

曝地沟油鉴别八法

曝地沟油鉴别八法
曝地沟油鉴别八法
辩认法之一:小作坊生产的地沟油,其颜色比正常油要淡,呈淡黄色且有点浑浊,不透明。

“跟93号汽油的颜色差不多。

”阿混指出,这与沉淀过滤不精细有关。

之二:将油倒置,如冒出大量气泡,或有茶末一般的沉淀碎屑物,则是小作坊地沟油。

表明油中的酸败物质未除干净,且过滤设备不精良。

辨认法之三:将几滴油倒入掌心,搓几下闻其味,正常植物油有其淡淡的本色清香味,如花生油有花生味,菜籽油有菜籽味,地沟油则无,有的甚至有点酸臭味。

之四:炒新鲜蔬菜,好油炒出的菜很鲜且有油香,地沟油炒的则反而破坏蔬菜的鲜美,吃起来腻味重,甚至有一种焦苦味,无油香。

辩认法之五:用地沟油烧蛋汤,烧好后,汤上会浮着不少气泡,用筷子弄一下才会破。

阿混指出,汤冷却后,地沟油浮在上面有时五颜六色。

另外,地沟油煎鱼,鱼块易碎。

之六:地沟油炒的菜,吃过后立即洗碗,往往不用洗洁精也能将碗冲洗干净,这些可能与油变性和含有少量废弃洗涤剂有关。

辨认法之七:地沟油里常含动物油,而动物油的凝结温度一般比植物油高(棕榈油例外)。

买回后放冰箱,地沟油在8摄氏度左右可能会凝结,呈絮状不匀整。

而植物油多数零度以下才凝结。

之八:好油开汤喝后,嘴里会感觉有油的余香;如吃后无余香或肠胃不舒服,则很可能是地沟油或劣质油。

FTIR法用于食用油和地沟油的区分及真伪鉴定

FTIR法用于食用油和地沟油的区分及真伪鉴定
关键词 傅立叶变换红外光谱法 地沟油 鉴别
引言
地沟油是质量极差的非食用油,“地沟油”实际上是一个泛指的概念, 是人们在生活中对各类劣质油的通称,其来源主要有:(1)将下水道 中的油腻漂浮物或者将宾馆、酒楼的剩饭、剩菜(通称泔水)经过简单 加工、提炼出的油,属于餐饮业废弃油脂;(2)劣质猪肉、猪内脏、 猪皮加工以及提炼后产出的油;(3)用于油炸食品的油使用次数超过 规定要求后,再被重复使用或往其中添加一些新油后重新使用的油。本 文涉及的“地沟油”主要是指通过来源(1)所得到的“地沟油”。
图 7 样品的Score vs Score图 可以看到样品有较明显的聚类分布,说明用红外光谱对 食用油进行整体鉴别是完全可行的。其中12#、20#样品 的位置与5#、6#、7#不同,其原因有待进一步分析。
而1711附近的吸收是有机酸的C=O振动吸收,比酯基的 吸收要偏向于低波数一些,在这个区域有较大的吸收, 是样品酸价较高的表现。实验中2#、3#这个峰非常明 显,而16#、17#样品也有相对较强的吸收,这与样品的 感官表现一致。
3
使用Quant+软件对所有样品进行PCR分析,得到如下的 样品Score vs Score图:
市售食用油样品与地沟油样品在3600~2700 cm-1范围和 1800~1000 cm-1范围的某些区域存在着较明显的差异, 其中又以1710 cm-1和1120 cm-1峰的变化特别显著。如图 5和图 6所示:
图 5 地沟油的红外光谱图 (局部)
图 6 市售食用油的 红外光谱图(局部)
图 2 植物油中碘值的相关光谱区域
建立简单、快速的地沟 油鉴定方法,对于加强食品安全,杜绝危害健康 的地沟油重新流向餐桌具有重要意义。傅立叶变换红外光谱(FTIR) 法具 有宏观整体鉴定复杂体系的优点以及简便快速的特点,目前已经开始用 于药用动、植物的真伪优劣鉴别 。本文采用FTIR 法鉴别各种食用油和地 沟油样品,得到了令人满意的结果。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于Fisher 判别法的地沟油识别摘 要Fisher 判别分析法是根据已有观测样本的若干数量特征对新获得的样本进行识别,判断其属性的预测预报分析方法。

本文研究的是地沟油的识别问题,运用了fisher 判别法建立了基于7个指标和基于3个指标的2种判别模型,就如何根据各种样本的化学成分含量正确判别地沟油作出了回答,确定了影响油质的关键指标。

对于问题一,首先我们将84组数据分为了优质食用油与地沟油两类总体,利用Spss 软件对84组样本数据进行分析,绘制箱线图对5组异常值进行识别与合理剔除。

然后通过*w 变换映射进行降维处理,借助方差分析构造线性判别函数,根据类间距离最大、类内距离最小原则,建立Fisher 判别分析(FDA )模型。

接着我们通过Matalb 软件求解算得到地沟油的Fisher 判别式与判别准则,最后用79组已测样本数据进行回代检验,采用回代估计计算出误判率为8.86%,即判别正确率为91.14%。

对于问题二,我们运用Matalb 软件,将16组待判样本数据代入问题一的Fisher 判别式中求解,从而得到判断结果:编号85-100样本中有8种为地沟油8种为优质食用油,其中编号85-92样本为优质食用油,编号93-100样本为地沟油。

对于问题三,为一定的准确率条件下,减少化验指标,我们利用Fisher 权函数,通过各个成分指标对判别函数的贡献度j F 和贡献百分率j Q 比较,经计算成分4、6、7累计贡献百分率为91.11%,为主要成分指标;成分1,2,5,3的累计贡献百分率为8.89%<10%,对判别的贡献度小,为次要成分指标,可以进行剔除。

剔除了次要成分指标后,我们将三个成分对应数据重新代入问题一的FDA 模型。

最终求解新得到的判别函数为:467()0.005310.004660.00003k k k y x x x x =++,判别函数临界值:0y =0.2897。

回代检验得到判别正确率为91.14%,说明新的Fisher 判别法有效性强,吻合度较高。

关键词: 地沟油 识别 Fisher 判别分析 Matalb 软件1. 问题重述1.1问题背景民以食为天,食用油作为每日膳食不可或缺的重要部分,其质量安全直接关系到人们的健康。

在目前食用油掺假行为中最恶劣、最严重、最受关注当属地沟油的非法回收利用。

地沟油,泛指生活中的各类劣质油,如回收的食用油、反复使用的炸油等。

其最大来源为大型饭店下水道的隔油池,长期食用可能会引发癌症,严重危害人的身体健康。

至2001年以来有关“地沟油”的负面事件层出不穷,据2010年何东平教授估计:我国每年有200万至300万吨的“地沟油”流回餐桌,“地沟油”含有致癌物质黄曲霉素,其毒性是砒霜的100倍。

[1]严格对优质食用油和地沟油进行鉴别,加强对油质的监测和食品安全的监管,保证人们舌尖上的安全与身体健康刻不容缓。

如何在了解食用油部分化学成分的情况下,对优质食用油和地沟油进行合理的判别区分,是本文需要思考的问题。

1.2各样本的化学成分信息已知条件中提供了一组数据,如附录表1所示。

表中分别给出了100个样本的7种化学成分含量信息,编号1-60是优质食用油,编号61-84是地沟油,编号85-100样本类别待判定。

1.3本文需解决的问题问题一:建立判别地沟油的数学模型,并对建立的模型进行评价。

问题二:利用问题一中所建立的模型,对编号85-100的样品是否为地沟油或优质食用油进行判别。

问题三:化验7种化学物质含量花费较大,要求在保证一定的准确率条件下,减少化验指标数。

2. 模型的假设与符号说明1)模型假设通过对题目的分析,为了使问题得到简化,我们做出了以下合理假设:假设1:食用油只有优质食用油和地沟油两类;假设2:地沟油判别只与题目中所给的7个成分指标相关,而与其他因素无关;假设3:题目中所给的7个成分指标对食用油性质的影响是相互独立;假设4:各项成分指标的测定误差忽略不计;假设5:题目中所给的7个成分指标数据是在相同的条件下测得的。

2)符号说明i=;(1,2)1S-:w*w:*Tw:1,2,,7);j=;1,2,,7);3. 问题分析此问题研究的是多元判别分析问题,基于已知数据建立优质食用油和地沟油两个总体判别分析模型,通过回代检验与改进,最终寻找出地沟油的判别方法,并进一步通过数据特征分析,确定出影响判别结果的关键因素,以减少判别指标。

Fisher判别分析法是根据已有观测样本判别因子对新货的样本进行识别,判断其属性的预测预报分析方法,[2]综合性强、适用面广,对原始数据分布无特殊要求,可以全面考虑影响判别的的各因素,鉴于此我们采用了Fisher判别分析法。

3.1针对问题一的分析问题一要求通对优质食用油地沟油两类总体中84组已判样本的数据特征分析,得到地沟油的判别方法,并检验评价该方法的正确性。

根据要求我们可以从下几方面着手:1)为方便对样本特征的识别,利用Spss软件初步分析处理原始数据,衡量7个成分指标对应的均值、标准差、方差等;为避免个别特殊样本数据影响各类总体普遍属性,我们用对数据中异常值进行剔除处理。

2)为得到地沟油判别方法,根据Fisher 线性判别思路,将七维特征向量空间投影到一维空间,给出2类总体的对应成分的平均值kj x ①、kj x ②和类内离散度1S 、2S ,基于两类总体平均值之间的距离越大越好,总体类内离散度越小越好的原则建立Fisher 判别分析(FDA )模型,利用处理后的79组确判样本数据求解出判别函数。

3)为了评价该判别法的有效性,采用回代估计法,将两类总体样本84组数据逐个代入已建立的判别模型中判断其归属,并将误判个数与总样本数的比值作为误判率的回代估计,从而来检验该判别式的正确性。

3.2针对问题二的分析问题二要求利用问题一中得到的判别方法,判别附录表1中编号85-100样本类别,明确16组样本中哪些属于地沟油,哪些属于优质食用油。

对此我们只需将16组待判样本的数据代入问题一中的FDA 模型中,即可通过判别准则得到结果。

(为了优化FDA 模型,使判别方法更有效,我们考虑利用上述结果再重新将所有确判数据和16组样本初判结果数据代入FDA 模型,利用Matalb 计算得到新的判别函数,再次通过回代估计计算误判率,比较判别法的正确性与有效性。

) 3.3针对问题三的分析问题三要求在保证地沟油判别方法一定的准确率条件下,减少样本化学成分的化验指标。

即要求在不影响判别准确性的同时,剔除作用不明显的指标,仅在判别函数中保留影响度较高的几个指标。

对此我们可以利用Fisher 权函数,求各个成分指标对判别的贡献度j F 、贡献百分率j Q ,以此衡量7个指标对判别结果的影响程度,通过贡献率排序,当前几项指标累计贡献百分率达到90%时,我们将这几项指标视为主要指标,其他为次要指标。

对贡献度小的次要指标进行剔除后,再次建立FDA 模型,经过原始数据验证后才能确定判别的主成分指标。

4. 数据处理4.1描述性分析由于已知条件将84组样本已经分为了两类,考虑到分属优质食用油和地沟油两类样本数据综合特征可能不同,我们通过Spss 对两类数据分别进行描述性分析,利用数据对变量的基本特征进行基础性描述,得到的优质食用油与地沟油描述统计量如下表所示。

通过均值、最小值、最大值、标准差与方差这些描述性统计量,我们发现:优质油食用油中成分2、5、6对应变量和地沟油中成分3和5的离散程度过大,怀疑存在异常值。

4.2箱线图法识别剔除异常值在处理数据的时,我们发现个别数据值偏离大量统计数据值结果,如果不加剔除地把异常值包括进数据的计算分析过程中,可能会影响结果的正确性;如果把这些数据值简单地剔除,又可能忽略了重要的数据信息。

目前人们对异常值的判别与剔除主要采用物理判别法和统计判别法两种方法。

此处物理识别不易判断时,我们采用统计识别法。

与格拉布斯法(Grubbs)、3σ法、Z分数法等不同的是,箱线图法既可以用作服从正态分布数据异常值的判断,也可以用作不服从正态分布数据异常值的判断,本问题题中部分数据并非呈正态分布,在此我们采取箱线图法。

箱线图是一种用作显示一组数据分散情况的统计图为我们提供了识别异常值的一个标准:异常值被定义为小于Q1-1.5IQR或大于3+1.5IQR的值,能直观明了地识别数据批中的异常值。

我们利用Spss绘制箱图用于判别剔除异常数据,如下图1所示:图1 各样本7种成分含量数据值分布箱线图通过箱线图发现5个极端异常值,对应样本:编号42、70、57、26、14;4个温和异常值,对应样本:编号64、7、18、6。

如下表所示:为了不影响我们判别模型的正确性,我们对这极端异常样本数据进行剔除。

4.3对应程序样本编号为了方便编程计算,我们对剔除后剩余的79组样本和16组待判别样本,分优质食用油、地沟油和待测油三类进行重新编号,详见附录中表2、表3、表4。

5. 问题一的解答针对问题一,我们建立Fisher 判别模型,进行求解,并检验模型判别正确率。

1)模型建立①计算各类在d 维特征空间里的样本均值向量:1,1,2k ii kx X iM x i n ∈==∑②计算各类的类内离散度矩阵:()(),1,2k iT i ki k i x X S xM x M i ∈=--=∑③计算类内总离散度矩阵:2121W i i S S S S ===+∑④计算使样本由d 维空间向一维空间映射的最优向量:1*12()w w S M M -=-⑤建立的判别函数为:****112277()T k k k k y x w x w x w x w x =+++= 其中,****127127(,,,),(,,,)k k k k w w w w x x x x ==。

⑥各类总体样本均值的判别值:****11122771T k k k y w x w x w x w M =+++=①①①****21122772T k k k y w x w x w x w M =+++=②②②其中,12111211=,=,1,2,,7n n kjkj kj kj k k x x x x j n n ===∑∑①②。

⑦计算判别函数的临界值:1122012n y n y y n n +=+⑧作判别。

若有一个待判别对象,其成分指标向量为127(,,,)T k k k k x x x x =,求其判别值为()y x ,再根据以下准则作判别:当102y y y >>时,若0()y x y >,则该待判别对象属于优质食用油;若0()y x y ≤,则该待判别对象属于地沟油。

当201y y y >>时,若0()y x y ≥,则该待判别对象属于地沟油;若0()y x y <,则该待判别对象属于优质食用油。

相关文档
最新文档