建立作物遗传资源核心样品的统计方法

合集下载

柑橘品种资源调查与遗传多样性分析

柑橘品种资源调查与遗传多样性分析

柑橘品种资源调查与遗传多样性分析柑橘是我国重要的经济作物之一,具有丰富的遗传多样性。

通过对柑橘的品种资源进行调查和遗传多样性分析,可以为柑橘的改良和保护提供重要的理论和实践参考。

本文将就柑橘的品种资源调查和遗传多样性分析进行详细论述。

一、柑橘品种资源调查柑橘品种资源调查是对柑橘不同种植区域和不同栽培类型的柑橘品种进行广泛的收集和整理的过程。

柑橘的品种资源调查对于了解柑橘的遗传多样性、筛选优质品种、保护珍稀品种等方面具有重要意义。

品种资源调查的过程一般包括以下几个步骤:1. 收集样品:通过走访农户、柑橘种植基地和科研机构等途径收集柑橘样品,包括不同的树龄、不同地理位置和不同栽培类型的柑橘品种。

2. 采集数据:对每个样品进行详细的调查,包括品种名称、树的特征、果实特征、产量表现等信息,并进行记录。

3. 样品保存:对于收集到的柑橘样品进行正确的保存,如鲜果样品可以进行冷藏,种子样品可以进行干燥。

4. 数据整理:对收集到的数据进行整理和分析,包括品种来源、地理分布、品质评价等方面,并进行统计和图表展示。

通过柑橘品种资源调查,可以全面了解柑橘的品种组成和分布情况,为后续的遗传多样性分析提供基础数据和样品来源。

二、柑橘遗传多样性分析柑橘的遗传多样性分析是通过对柑橘不同品种之间的遗传差异进行分析,以了解柑橘的遗传背景和遗传多样性水平。

常用的柑橘遗传多样性分析方法包括:1. 同功酶电泳(Isoenzyme electrophoresis):通过分析不同柑橘品种与亲本品种在同功酶带谱上的差异,了解不同品种之间的遗传关系。

2. 随机扩增多态性DNA(Random Amplified Polymorphic DNA, RAPD):利用随机引物扩增不同柑橘品种的DNA片段,根据扩增片段的长度差异判断不同柑橘品种之间的遗传差异。

3. 种质资源DNA指纹图谱构建:利用分子标记技术如SSR、SNP等方法对不同柑橘品种进行DNA指纹图谱构建,形成不同品种之间的遗传差异信息。

植物遗传资源的收集保存和利用策略与方法

植物遗传资源的收集保存和利用策略与方法

植物遗传资源的收集保存和利用策略与方法植物遗传资源是丰富的自然资源之一,包括了植物的种子、花粉、胚胎、组织和细胞等。

这些植物遗传资源对于农业发展、生物多样性保护以及新品种培育都具有重要意义。

本文旨在探讨植物遗传资源的收集、保存和利用的策略与方法,以期提高资源利用效率和保护遗传多样性。

一、植物遗传资源的收集策略与方法1. 地域调查和野外考察:通过地理调查和野外考察,了解特定地区的植物多样性和分布情况。

这有助于确定有潜在利用价值的植物遗传资源的收集目标。

2. 采集样本:采集植物样本是收集植物遗传资源的关键步骤。

采集时应注意选择具有代表性的种群进行样本采集,并保证采集样本的多样性。

3. 采集记录和标本制备:在采集过程中,要准确记录采集样本的相关信息,如植物的生态环境、生长状态等。

同时,还要将采集到的样本进行标本制备,以便后续保存和利用。

二、植物遗传资源的保存策略与方法1. 构建植物遗传资源库:建立植物遗传资源库是确保资源保存和管理的基础。

资源库应具备适宜的环境条件,如温度、湿度等,以保证植物遗传资源的长期保存。

2. 种子保存:种子是保存植物遗传资源的一种常用方法。

种子保存时,要注意选择正常成熟的种子,并使用适当的方法进行保存,如干燥和低温保存等。

3. 组织培养和冷冻保存:对于难以通过种子保存的植物遗传资源,可以采用组织培养和冷冻保存等方法。

组织培养是指将植物的组织和细胞进行体外培养,以保存其遗传信息。

冷冻保存则是通过超低温处理,将植物材料保存在液氮中,以便长期保存和利用。

三、植物遗传资源的利用策略与方法1. 遗传改良:植物遗传资源在遗传改良中发挥着重要作用。

通过对植物遗传资源的筛选、杂交等方法,可以培育出具有优良性状的新品种。

2. 基因资源开发:植物遗传资源中蕴含着丰富的基因信息,可以用于基因资源的开发和利用。

例如,利用植物遗传资源中的抗病性基因进行基因克隆和转基因研究,有助于提高植物的抗病能力。

3. 药用和保健品开发:植物遗传资源中的许多植物具有药用和保健功能,可以用于药物和保健品的开发。

构建贵州地方稻种遗传资源核心样品种质库的基本原则与程序

构建贵州地方稻种遗传资源核心样品种质库的基本原则与程序

构建贵州地方稻种遗传资源核心样品种质库的基本原则与程序一、基本原则1.综合性原则:在构建贵州地方稻种遗传资源核心样品种质库的过程中,需要综合考虑贵州地区的气候、土壤、地形及农业生产的需求等因素,选取适应当地环境的种质资源作为核心样品种质。

2.典型性原则:选择代表性、典型的地方稻种遗传资源进行保存和利用,以展示该地区丰富的地方特色。

3.多样性原则:确保贵州地方稻种遗传资源核心样品种质库中包含多样性的种质资源,以满足不同需求和适应不同生态条件。

二、构建程序1.调查和收集资料:对贵州地方稻种遗传资源进行调查和收集资料,包括地方稻种的名称、起源、性状特征、耐性等方面的信息。

2.筛选和鉴定:根据所收集到的地方稻种遗传资源资料,筛选出具有代表性、典型和多样性的种质资源,组成贵州地方稻种遗传资源的核心样品集。

3.保存和利用:将选取的地方稻种遗传资源进行保存,采用冷冻、干燥等方式进行贮藏,以确保其遗传特性的保存。

并将保存的种质资源用于研究、育种和推广生产等多个方面。

4.建立数据库:建立贵州地方稻种遗传资源核心样品种质库的数据库,记录保存的种质资源信息,包括名称、特征、保存方式等,以便于管理和利用。

三、运行与管理1.制定管理规定:建立贵州地方稻种遗传资源核心样品种质库的运行管理制度,包括保存、利用、更新和管理等方面的规定,确保良好的运行和管理。

2.定期更新:定期对贵州地方稻种遗传资源核心样品种质库中的种质资源进行评估和更新,剔除低质量或有损种质资源,并根据需要添加新的种质资源。

3.推广利用:将保存在贵州地方稻种遗传资源核心样品种质库中的种质资源推广应用于生产中,推动优质稻种的生产和发展,并参与相关科研项目的合作与交流。

通过以上基本原则与程序,构建贵州地方稻种遗传资源核心样品种质库,既有利于地方稻种的保护和利用,同时也能推动贵州地区稻米产业的健康发展,提高贵州地方稻的品质和产量。

作物种质资源遗传多样性的评价方法

作物种质资源遗传多样性的评价方法

作物种质资源遗传多样性的评价方法王海岗1,吕建珍2,彭锁堂1(1.山西农业大学农学院,山西太谷030801;2.中国水稻研究所水稻生物学国家重点实验室,浙江杭州310006)摘要:通过总结目前遗传多样性研究中的常用分子标记方法和统计指标,介绍了遗传多样性评价的新的研究方法。

通过对分子数据采用分子方差(AM OVA),了解作物种质资源在不同时期的变异来源。

对种质资源进行系统遗传多样性提供了一种更为有效的方法。

关键词:铬;遗传多样性;分子标记;统计方法中图分类号:S330文献标识码:A文章编号:1002-2481(2007)11-0026-02Assessing Method of Genetic Diversity of Crop Germplasm ResourceWANG Hai-g ang 1,L üJian-zhen 2,PENG Suo-tang 1( 1.College of Agriculture,Shanxi Agricultural University,Taiyuan Shanxi,030801, 2.State Key Laboratory of RiceBiology,China National Rice Reasearch Institute,Hangzhou Zhejiang,310006)Abstr a ct:The pa per summa riz e d the me thods of m olec ula r m ar ke r use d wide ly in gene tic diversity study and intr oduc ed the ne w way a ssessed.By using ana lysis of mole cular va riance (AMOV A),the source of ge netic va ria tion in diff e re nt periods wa s investigate d in c rop ge rmplasm resourc e.It provided a effe ctive method to a sse ss ge netic diver sity of cr op ge rm plasm re sour ce by the num bers.Ke y wor ds:Chro me;Ge netic dive rsity;Mole cula r mar ker;Statistic me thod*收稿日期5作者简介王海岗(8),男,山西平定人,在读硕士,主要从事基因工程与分子遗传方向研究。

作物育种学知到章节答案智慧树2023年中国农业大学

作物育种学知到章节答案智慧树2023年中国农业大学

作物育种学知到章节测试答案智慧树2023年最新中国农业大学绪论单元测试1.作物育种的过程,其实是作物在人工控制下的进化过程。

参考答案:对2.由于作物育种中的选择主要为人工选择,可以脱离自然选择来选择符合育种目标的材料,进而培育成可在生产上推广利用的品种。

参考答案:错3.品种是植物分类中的最小单位。

参考答案:错4.水稻杂种优势利用的成功是“第一次绿色革命”的标志性成果。

参考答案:错5.CIMMYT是指:参考答案:国际玉米小麦改良中心6.IRRI是指:参考答案:国际水稻研究所第一章测试1.自花授粉作物表现型与基因型相对一致;异花授粉作物表现型与基因型常常不一致。

参考答案:对2.自花授粉作物自交有害,异花授粉作物自交无害。

参考答案:错3.虽然异花授粉作物品种群体异质,个体杂合,杂合体分离,遗传基础较复杂;但不断自交可导致基因型纯合。

参考答案:对4.下列哪组作物全部为自花授粉作物参考答案:小麦、大麦、大豆、水稻5.下列哪组作物全部为异花授粉作物参考答案:甘薯、银杏、蓖麻、玉米6.下列哪组作物全部为常异花授粉作物参考答案:高粱、棉花、粟、蚕豆第二章测试1.目前,我国作物育种目标中,高产仍为第一位。

参考答案:对2.任何作物中的任何品种都具有时间性和区域性。

参考答案:对3.作物高产的关键是各种产量因素的合理组合,从而得到产量因素的最大乘积。

参考答案:对4.根据不同地区的气候特点,南方稻区,选育大穗、大粒型高产水稻品种;北方稻区,选育矮杆、叶面积较大的高光效水稻品种。

参考答案:对5.在优质品种选育方面,品质指标越高,品种品质越好参考答案:错第三章测试1.遗传多样性中心不一定就是起源中心,起源中心不一定是多样性的基因中心。

参考答案:错2.由于人工创造的种质资源具有一些明显的优良性状,大多可以作为品种进行推广。

参考答案:错3.初级基因库一般包括种内各种材料;次级基因库包括种间材料和近缘野生种;三级基因库包括种间以上材料。

加强农作物种质资源普查与收集行动工作方案

加强农作物种质资源普查与收集行动工作方案

加强农作物种质资源普查与收集行动工作方案一、背景介绍农作物种质资源是农业生产的基础,也是实现国家粮食安全和农业可持续发展的重要保障。

为了加强对农作物种质资源的普查与收集工作,保护和利用农作物遗传资源,制定一套科学合理的工作方案显得尤为重要。

二、目标与任务1.目标2.任务(1)建立健全农作物种质资源普查与收集的组织机构体系,明确工作任务和责任。

(2)制定并完善农作物种质资源普查与收集的技术方法和标准。

包括界定农作物种质资源普查与收集的范围,确定普查和收集的时间、地点和对象等。

(3)开展农作物种质资源的普查工作,组织专业人员对农作物种质资源进行野外调查与采集。

(4)建立健全农作物种质资源信息库,整合和管理已普查和收集的农作物种质资源信息。

(5)对优良的农作物种质资源进行筛选、评价和鉴定,确保其质量和可靠性。

(6)加强农作物种质资源的保存和利用,提高种质资源的利用率和保护水平。

三、工作方案1.组织机构体系建立农作物种质资源普查与收集的领导小组,负责组织、协调和指导整个工作。

在各级农业部门设立工作专班,负责具体的实施。

2.技术方法和标准制定农作物种质资源普查与收集的技术方法和标准,包括野外调查与采集的方法、保存与鉴定的要求等。

3.农作物种质资源普查工作(1)制定普查计划,确定普查的目标、范围和时间。

根据区域特点和种质资源的分布情况,制定相应的普查方案。

(2)组织专业人员进行野外调查与采集工作,确保采集到的种质资源具有代表性和可靠性。

(3)建立农作物种质资源样本库,按照标准规范保存和管理种质资源样本,确保其质量和可靠性。

4.农作物种质资源信息管理(1)建立农作物种质资源信息库,整合和管理已普查和收集的农作物种质资源信息。

(2)建立数据管理系统,方便查询和提取农作物种质资源信息。

(3)加强数据的统计和分析,实施动态管理,及时反馈农作物种质资源的动态变化。

5.优良种质资源筛选和利用(1)制定优良种质资源筛选和评价的标准和方法,确保筛选结果准确可靠。

我国水稻种质资源创新研究与利用进展

我国水稻种质资源创新研究与利用进展

植物遗传资源学报 2024,25 (4 ):495-508DOI:10.13430/ki.jpgr.20231029001 Journal of Plant Genetic Resources我国水稻种质资源创新研究与利用进展杨德卫1,张海峰2,余文权3(1福建省农业科学院水稻研究所,福州 350019;2福建省农业科学院资源环境与土壤肥料研究所,福州 350000;3福建省农业科学院茶叶研究所,福州 350000)摘要:农业种质资源主要包括农作物、畜禽、农业微生物和药用植物等种质资源。

截止到2023年,我国保存的作物种质资源有超过54万份,其中有8万多份是水稻种质资源,如何对这么庞大的水稻种质资源进行精确评价与利用,这将对今后水稻种质创新与育种具有重要意义。

本文梳理了我国水稻种质资源收集、评价与精确鉴定、水稻新品系创制、水稻杂种优势利用、水稻种质创制新技术、新方法以及水稻优异基因资源的挖掘与利用等方面的进展,并归纳形成了水稻种质资源创制与利用的新模式。

最后,本文就当前水稻核心种质构建、种质资源鉴定与挖掘以及种质资源共享共赢机制等方面的问题进行了探讨,并就如何加强专用型核心种资的构建、种质资源的精确鉴定、种质资源的创新研究、种质资源的共享机制以及种质资源的合作交流进行了分析与展望,以期为进一步深入开展水稻种质资源鉴定评价与创新利用提供一定的参考和帮助。

关键词:水稻;种质资源;创新;利用;基因Progress on Innovative Research and Utilization of RiceGermplasm Resources in ChinaYANG Dewei1,ZHANG Haifeng2,YU Wenquan3(1Rice Research Institute, Fujian Academy of Agricultural Sciences, Fuzhou 350019;2Institute of Resources, Environment and Soil Fertilizer, Fujian Academy of Agricultural Sciences, Fuzhou 350000;3Tea Research Institute,Fujian Academy of Agricultural Sciences, Fuzhou 350000)Abstract:Agricultural germplasm resources mainly include crops,livestock and poultry,agricultural microorganisms and medicinal plants. There are 134,000 crop germplasm resources preserved in China, among which 74,000 are rice germplasm resources. How to accurately evaluate and utilize such huge rice germplasm resources is of great significance in rice germplasm innovation and breeding. In this paper,we reviewed the progress in collection,evaluation and accurate identification of rice germplasm resources,creation of new strains of rice,utilization of heterosis of rice,new techniques and methods of rice germplasm creation,and exploration and utilization of excellent genetic resources of rice,and summarized a new model of rice germplasm resource creation and utilization. Finally,this article discussed the current problems of rice core germplasm construction, germplasm resources identification and mining, and germplasm resources sharing and win-win mechanism. At the same time,we analyzed and prospeced how to strengthen the construction of specialized core seed resources, the accurate identification of germplasm resources, the innovative research of germplasm resources,the sharing mechanism of germplasm resources and the cooperation and exchange of收稿日期:2023-10-29 修回日期:2023-12-06 网络出版日期:2023-12-19URL: https:///10.13430/ki.jpgr.20231029001第一作者研究方向为水稻优异基因挖掘与利用,E-mail:***************通信作者:余文权,研究方向为茶树资源利用与茶文化,E-mail:****************基金项目:福建省农业高质量发展超越“5511”协同创新工程(XTCXGC2021019);院平台提升建设项目(CXPT20230003);院东西部合作项目(DKBF-2024-12)Foundation projects:Fujian Agricultural High-quality Development Beyond the "5511" Collaborative Innovation Project (XTCXGC2021019);Institute Platform Upgrading Project (CXPT20230003); The College's East and West Cooperation Project (DKBF-2024-12)植物遗传资源学报25 卷germplasm resources, in order to provide some reference and help for further development of the identification,evaluation and innovative utilization of rice germplasm resources.Key words:rice;germplasm resources;innovate;utilization;gene农业种质资源又称遗传资源、基因资源,是指一切对人类具有实际或潜在利用价值的遗传材料[1]。

种质资源核查方案

种质资源核查方案

种质资源核查方案1. 引言种质资源是农业科研和生产的重要基础,对于保护农作物品种、推广新品种具有重要的意义。

为了确保种质资源的真实性和有效性,需要进行种质资源的核查工作。

本文档旨在介绍种质资源核查的方案。

2. 核查目标种质资源核查的目标是确认种质资源的真实性和完整性,包括以下方面:•确认种质资源的来源和鉴定信息是否准确;•检查种子或植株的外部特征和性状是否符合鉴定描述;•验证种质资源的纯度和一致性。

3. 核查步骤种质资源核查应包括以下步骤:3.1. 样品采集从待核查的种质资源中随机选取样品,并按照一定的比例进行采样。

样品数量应根据实际情况确定,一般建议不少于30个样品。

3.2. 样品检验对采集的样品进行外部特征和性状的检验。

主要包括以下方面:•观察植株的生长情况和外部形态;•检查种子的大小、颜色、形状等特征。

3.3. 遗传分析对采样的样品进行遗传分析,以确认种质资源的纯度和一致性。

常用的遗传分析方法包括:•核酸分析:通过DNA或RNA的提取和PCR扩增等分子生物学技术,对种质资源进行遗传标记分析。

•蛋白质分析:通过蛋白质电泳等方法,对种质资源进行蛋白质组分的研究。

3.4. 数据分析根据样品检验和遗传分析的结果,进行数据统计和分析。

可以使用统计学方法对结果进行验证和判断,如方差分析、聚类分析等。

4. 数据管理种质资源核查的数据应进行科学管理和储存,以确保数据的安全性和可追溯性。

具体措施包括:•建立数据库:将核查结果和相关信息录入数据库中,方便后续数据查询和分析。

•数据备份:定期对数据库进行备份,以防止数据丢失和损坏。

•数据安全:加强数据的访问权限管理,确保数据的机密性和完整性。

5. 结论种质资源核查是保护农作物种质资源的重要工作,对于推广优良品种和保护农业遗传资源具有重要意义。

通过采样、样品检验和遗传分析等步骤,可以有效地核查种质资源的真实性和有效性。

同时,科学的数据管理和分析可以提高核查工作的效率和可信度。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

建立作物遗传资源核心样品的统计方法王磊魏兴华(中国水稻研究所,浙江杭州 310006)提要:本文主要介绍了在建立作物遗传资源核心样品中的统计方法:(1)在系统聚类分析中如何同时利用定量和定性变量;(2)非系统聚类方法中的正态混合模型聚类方法,以及(3)利用多环境试验数据进行聚类分析。

关键词:核心样品;聚类方法;正态混合模型;三元分析;模式分析所谓作物遗传资源核心样品是指以最少量的种质材料代表一个物种及其近缘野生种最大限度的遗传多样性。

核心样品的建立,不仅可以提高种质库的利用效率,而且有利于种质库管理、新种质收集、种质创新及种质资源的深层次的研究。

核心样品概念在1984年提出后,立即引起了全球广泛的兴趣,先后在西非秋葵、澳州大豆、野生稻等作物得以实践,而我国的核心样品研究始于1994年,近年来有了快速的发展。

建立核心样品中用到的统计方法主要是聚类分析和排序。

本文首先介绍同时利用定性和定量变量进行系统聚类分析的Gower方法;然后介绍非系统聚类方法中的一种最常见的正态混合模型聚类方法,最后介绍利用多环境试验数据进行聚类分析的模式分析(Pattern Analysis)和三元分析(Three-Mode Analysis)。

1 同时利用定性和定量变量进行聚类聚类分析涉及如何结合不同类型的变量,选择合适的距离度量,应用合理的聚类策略,决定最佳的类的数目,并鉴别出有显著区别力度(discriminatory power)的变量。

标准的聚类分析使用的或者是定量变量,或者是分类变量,而不是同时在这两类变量上进行聚类。

Gower(1971)提出了可同时利用连续和定性变量的两样品之间的距离度量,Wishart(1986)利用该距离度量提出了系统聚类策略。

聚类分析中的样品之间关系有二种:相似或相异系数和距离。

而它们的定义与样品的变量的类型关系极大,通常变量按照测量它们的尺度来进行分类:(1)间隔尺度:指标用连续的量来表示如产量、株高等。

如在间隔尺度存在绝对零点,又称比例尺度。

(2)有序尺度:指标度量时没有明确的数量表示,只有次序关系,如米质分成好、中、次三等,三个等次有次序关系,但没有数量表示。

(3)名义尺度:指标度量时既没有数量表示,也没有次序关系。

如品种的外观颜色。

名义尺度中只取两种状态的变量(binomial)是最简单的一种。

一般说来,通常所说的连续变量或定量变量是指按照间隔尺度度量的变量,而按照有序尺度或名义尺度度量的变量称为定性变量。

Cole-Rodgers 等(1997)提出了能同时利用定性和定量变量计算样品之间欧氏距离的统计方法:标准两元度量方法(normed binary scale),进而对样品进行聚类分析。

对定性(名义尺度)变量,譬如外观颜色变量C有四种颜色:绿色(G),棕色(B),红(R),和黄(Y),则生成四个子变量CG,CB,CR和CY,如某一样品的颜色为棕色和红色,则,而CG=0,CY=0,其中4为颜色数目。

如某一样品A1的颜色为B和R,而另一样品A2的颜色为B和Y,则由颜色变量而决定的该两样品之间的相异系数为:。

事实上该相异系数为。

而对于定量变量,譬如产量Yield,在计算欧氏距离之前先进行变量转化。

如样品中的最低和最高产量分别为min(yield)和max(yield),变幅R=max(yield)-min(yield),则变换为,其实在计算欧氏距离时,变换只需。

p个两元性状在两样品i和j出现或不出现的记录组成的向量记为 (x1,…,x p) 和(y1,…,y p),其中x k=1或0表明性状k在样品i出现或没有出现。

定义:分别表示 (x i, y i) =(1,1), (0,1),(1,0) 和 (0,0) 的频率。

两样品的相似系数可定义为:s1= 或s2 = 。

当同时有定性和定量的变量时,Gower(1971)提出了两样品i和j之间的相似系数:如果第k个变量为定性变量,则w k=1,不然,R k是第k个变量的变幅。

而距离。

对更一般的情形,,其中d ijk是第k个性状对样品i和j之间距离的贡献,w ijk是d ijk对应的权重,当变量值缺失,w ijk=0。

对于名义尺变变量,如果两样品有相同的值,d ijk=0,不然d ijk=1。

对于有序尺度和间隔尺度变量,。

进一步,对于Gower距离,Wishart(1986)给出了如何计算类之间距离。

第k 个变量在第s类的均值和权重为:类i和j之间的距离(对第k个变量,非名义尺度变量)Manbattar距离:欧氏距离平方:对于名义尺度变量(假设有t个状态)X ikl:为在第i类的第k个名义尺度变量的第l个状态出现的比例。

注意变量对总的距离的贡献是上面两等式中的分母2是为了保证u ijk的值在0和1之间。

2正态混合模型聚类方法非系统聚类方法,比如像正态混合模型(Normal Mixture Model,可简写为GM模型或Nomix模型)和密度插索方法,则用于描述种质资源中的表现型多样性的模式,并进行聚类,进而建立核心样品。

下面主要介绍极大似然方法和Nomix 模型聚类。

2.1极大似然方法假定样本数为n,样本x1…,x n相互独立,假设来自g个可能的密度函数为f(x;θk)(k=1,2,…,g)的子群体中的某一个。

记r=(r1,…,r n)'为一组鉴别标签(identifying labels),r i=k表明x j来自第k个子群体,i=1,…,n;k=1,…,g 。

如果C k={x i:r i=k},k=1,…,g,似然函数:L(r;θ1,…,θg)=假设极大似然估计(m.l.e.)为,而对应的一个划分为。

如将中的一个样本点移入,似然函数值将减少:所以当密度函数为正态分布时,即的密度函数。

很容易解得 k和的m.l.e.:,和S k分别是中的n k个样本的均值和协方差。

所以r的m.l.e.是使极小的一种聚类。

如果假定(未知)这时r的m.l.e.为使|w|极小的聚类,其中在上面的讨论中假设g是已知的。

所以我们需要先确定g。

当方差一致时,Marriott(1971)建议g取使为最小的值。

经验公式为。

2.2混合模型假设x k以概率p k来自第k个子群体;k=1,2,…,g那么x1,…,x n是来自f(x)的一个样本这里的密度函数。

当其中如果,则x i属于第k个子群体。

那么类的数目g如何确定呢?这可以通过似然比检验确定:通过Monte Carlo研究,Wolfe推荐近似关系:,f=2p(g’-g)注意这一混合模型其实是和前面的极大似然方法几乎是等价的,只是在极大似然方法中r是一个不可观测的随机变量。

3 多环境试验数据分析保存和利用遗传资源的一个重要步骤是对其进行评价。

当样品在不同环境进行评价,通常用聚类分析对样品进行分类,进而建立核心样品,而更常见的是同时利用一些多元统计方法,比如主成分分析,用于描述种质资源中的表现型多样性的模式,并进行聚类,进而建立核心样品。

3.1模式分析所谓模式分析是指在单一分析变量的基础上,利用由样品和环境(G⨯E)组成的矩阵对样品和环境同时进行聚类和排序的一种方法。

在对品种和环境聚类的基础上,将转化后的G⨯E矩阵简化为新的行数和列数都已变小的G⨯E矩阵,再通过排序,对品种和环境,以及样品和环境的互作进行更深入的分析。

一般对G⨯ E矩阵需进行转化分析,一些常用的转化为:(1)环境中心化2.(2)环境标准化(3)均值磨和3.(4)环境标准残差下面将转化用公式表达,并更进一步解释转化的具体意义。

假设有n个参试品种p个地点,则在第j个地点的第i个品种的产量可用下列模型表述(为解释方便计算公式中不包括随机误差项):y ij = μ + g i + e j + ge ij其中ge ij为第i个品种与第j个地点的互作。

1.环境中心化:y = y ij -= g i + ge ij这一转化剔除了环境效应,但仍保留品种的适应性(品种主效和互作之和)。

相应的环境聚类则是根据环境对品种的适应性模式的鉴别影响力,而品种的聚类则是根据品种的适应性模式,从变序G⨯ E互作的角度,聚合在一起的品种不是与性状的平均值接近的品种,而是彼此地点之间变序较少的品种。

但环境之间的标准差通常不一致,采用下一转化更合适。

(2) 环境标准化:y= (y ij - ) / s j = (g i + ge ij) / s j = g i / s j + ge ij / s j其中s j是环境j的品种表现的标准差:s j= ,其中n j为环境j 的参试品种。

(3) 均值磨和:y = y ij - = ge ij每一环境的品种表现的变异是互作的重要方面,所以没有再进一步对每一环境标准化。

(4) 环境标准残差:y =( y ij - )/ s其中s =,其中n j为环境j的参试品种。

这一转化的解释与上一转化基本类似,只是这一转化的分析可能更可靠些。

3.2 聚类和排序对品种和环境的聚类的原则是聚合在一起的类的品种或环境有类似的模式。

品种的聚类是按照品种对环境的(转化后的)反映,而环境的聚类是按照环境对品种的鉴别影响。

目前通常推荐使用的聚类方法为Ward方法,这一方法也叫做最小离差平方和方法,每次聚类是将类内平方和增加为最少的对象聚合。

那么,最终的品种或环境的类数怎么定呢? 因为每一聚类都损失一部分信息,所以我们希望通过聚类原始矩阵得到简化,同时损失的信息尽可能的小。

一般的原则是损失的信息控制在15%和25%之间。

为研究品种在各环境中的表现模式,需对在转化矩阵和聚类后简化的矩阵进行主成分分析,便可对品种或环境进行排序。

常用的图形工具是在同一图上同时给出地点和品种的图标的双标图(biplot)。

3.3 三元分析(Three-Mode Analysis)在对样品进行评价时,对性状单独进行分析是不够的,需要对多个性状同时进行分析。

聚类分析所使用的方法为混合极大似然聚类法,而排序是三元主成分分析。

这里所要处理的数据为样品⨯地点⨯性状的三向(Three-way)数据,而所谓的三元(Three-mode)对应于样品、地点和性状。

3.3.1混合极大似然聚类方法这是非系统聚类方法,根据性状和地点的信息对样品进行聚类。

假设样品来自一固定数目群体的各种比例的混合样本,而各群体(类)可以有不同的均值向量和协方差矩阵,这样同一类中各性状的相互关系的关系结构得到了考虑。

假设有e个环境,a个样品,来自c个群体,第i个样本的观察值X i1=(X i1,…X ie),X i1,…,X ie为该样本在e个环境的所有性状的观察值向量。

假设这些向量X1,X2,…,X a相互独立,并来自C个群体未知比例P m(m=1,…,c)的混合群体。

如果X i来自类m,则X ij的密度函数为N(μmj,Σm),(i=1,…,a;j=1,…,e;m=1,…,c)。

相关文档
最新文档