基因重组分析软件RDP4分析演示

1、要分析一个重组事件，首先需要一些基础软件的支持，其中最重要的是mega。

2、打开一个.meg格式的文件：左击鼠标open按钮。

3、点击页面顶端options按钮，进入General页面选择一系列参数：选择你的序列是环状还

是线性，检测所需要的方法，建议选择默认的选项（RDP, GENECONV and MAXCHI）你选择的方式越多，消耗时间越长。如果你分析的是小型数据（小于50个序列），你还可以选择CHIMAERA，BOOTSCAN 和SISCAN 。一般不使用LARD方法，除非在验证重组时间或检测小于20个序列的数据时。再看右边的选项，在你第一次分析数据时，应该选上disentangle overlapping events选项，如果分析时卡住了再取消分析，把这个选项删掉就可以了。其他选项选择默认就可以了

4、一旦所有选项都调试好之后，左击主界面上的X-over按钮开始进行重组分析。如果你认

为耗费的时间超出了你的预期，你可以点击stop按钮，如果你不想分析其中的某个序列，可以点击Sequence display界面中右侧序列的名字，左击一下名字变灰，为mask这个序列，即对这个序列不进行重组分析，但依然作为参考序列在做树中显示出来；左击两下名字变白，disable这个序列，即完全除去这个序列。这样的处理可以提高分析重组的能力，集中精力分析你需要的序列。

5、分析完毕后出现四个界面，顺时针方向依次为Sequence display，The recombination

information display.，Schematic sequence display以及Plot display。下面分四个部分具体讲解。

1.The Sequence Display：

左击序列中的部位可以显示不同颜色代表的含义

鼠标悬空在某个核苷酸上会显示出该核苷酸处于何序列的具体位置。右击鼠标可以保存不同形式你想要的序列。

Save entire alignment.：保存整个比对结果，可以保存成多种形式。

Save alignment with recombinant sequences removed：保存没有重组序列的比对结果。即在plot display 板块中为一个完整的长条的序列。

Save alignment with recombinant columns removed.：将去除所有与重组相关的序列，如果一个比对结果中与重组相关的序列太多，很可能结果是一个空白或接近于空白。

Save alignment with recombinant regions removed.：所有与重组相关的核苷酸将被取代为—或.

Save alignmnet with recombinant regions seperated.:重组序列将被分割成两部分，一部分与重组无关，一部分是重组部分。可以分别与其他序列进行比对。Split alignment into common mosaics.：具有同一重组镶嵌体的序列和其余的非重组序列被分裂为两个单独的比对结果。

Save only enabled sequences.：只有被enable的序列才会保存。这个选项有助于手动将同一组的序列保存成新的比对结果。

Save only disabled sequences.：只有mask和disable的序列被保存下来

如果你想单独分析某一组序列，右击鼠标选择select groups，点击你想选择的序列，变为蓝色即为选中，未选中的为黑色。

如果你想专门看某个序列，右键点击go to ，然后在schematic sequence display 中会显示这个序列。

5、The Recombination Information Display

这些信息包括用于检测的方法,重组事件的编号,可能的断点,序列的名字,可能的突变位点，与该重组毒株密切相关的,可能父母代的序列名字(主要和次要的父母)和次要父母代毒株比主要父母代毒株与重组序列的关系更密切的概率，以及P值的大小。如果出

现以下情况，该界面还会出现warning标示（红色）：

（1）在比对序列中只有一个可能为父母代毒株的序列

（2）有可能(约30%或更大的可能)误认为重组序列(即实际上父母代的序列中的某个才是真正的重组毒株)如果是这样会在后面显示出实际上可能为重组毒株的父母代毒株的名字。

（3）无法识别出一个或全部两个突变位点。

（4）一个或两个突变位点是错位的。

（5）重组信号微弱

（6）如果复合信号可能是一个分析错误的人工制品。

“confirmation table”部分表明了用不同方法检测出发生该重组事件的毒株数和关于目前检测到的重组事件的符合程度

Confirmation table 下面是一个总结性的柱状图，对于99%的用户来说前三条柱状图代表的是有用的信息。柱状图下面的分数大于60分代表这该毒株几乎确定为重组毒株。大于40小于60的分数代表软件可能犯了错误，但也可能没有。小于40表示该毒株很可能不是重组毒株。

6、Schematic sequence display

每一个长条都代表一个重组序列。不同的颜色可以代表不同的意思：

1.每一个最可能为重组事件供体的序列被赋予独一无二的颜色。

2.用于检测重组序列的方法。

3.他们相关的P值

4.它们与推测的父母代序列之间的关联性大小。

可以通过cycle through display options” button选项改变颜色。而这些颜色代表的意思可以通过左

击击灰色部分看到。

右击鼠标灰色部分可以将该图拷贝到剪贴板或保存成.emf文件。

该图表可以转换三种模式(1) “Show all events for sequence X” (sequence X 是你的鼠标距离最近的序列) (2) “Show only best events for all sequences,”and (3) “Show all events for all sequences.”就是有的重组事件可能用所有方法都可以检测到，而有的重组事件只有一到两种方法可以检测到。如果你选择（2）的话只有最优的重组事件会显示出来（即P 值最低）。你可以通过键盘上的pgDn和PgUp浏览重组事件。

在序列彩色条上右击鼠标会出现一系列的选项，你可以通过“接受或不接受该重组事件”

选项来人为修改你认为RDP出现的错误，也可以将父母代供体和重组毒株相互调换，但必须慎重，因为这个调换是不可恢复的，如果你要取消调换只能重新分析。而且，尽管RDP可能出现错误，但它至少是一个客观的判断方法，没有人的主观性。所以，除非你有充足的理由，否则不要随便调换。

在你浏览这些重组序列的时候，应该时刻accept你认为正确的重组序列，这样有利于你记录自己的进度，也有利于修改RDP的错误，因为一旦RDP在这里出现错误，那么它在后面出现错误的几率也会增大。所以，在accept之后就选择选项栏的Re-Identify recombinant sequences for all unaccepted events，或者点击下面的“Re-scan”按钮重新进行分析。

检测RDP的误差可以通过选择show all evidences选项来观察不同方法检测到的重组事件的breakpoints是否不同，如果不同的话就值得你人工去观察到底哪个是正确的。如果你认为两个重组事件来源于一个祖代毒株，可以选择通过Merge events选项将其合并为一个重组事件

7.The Plot Display

Key Press to abort a check

双击这个区域的任何位置都会在上方的sequence display panel显示出相应的序列。鼠标

移动到任何位置都会显示出X轴和Y轴的数值。

5.5 The Tree Displays

如果你按下“tree”按钮,一系列表示该重组毒株与其他毒株关系的树将会以两种不同的方式展示如果单击屏幕顶部在命令面板的“tree”按钮两棵树将会并排显示。而如果你按下recombination information display上方的“Tree”按钮则会在该区域显示一株进化树。

点击右上角的“cycle through trees”按钮即可以用该序列的不同部分进行做树分析。包括：（1）根据重组序列的不同部分分别作树（2）只有已确认的重组区域做树（即用minor parent 部分）（3）只用已确认的非重组区域做树（即major parent部分）（4）忽略重组的所有区域做树。

在同一个页面显示两棵树可以追踪一个序列在不同区域做树后的变化，左击树上的某个序列可以标记这个序列在树上的位置。在树的部位右击会出现一系列的选项，比如“清除颜色”“自动选择颜色”“自主选择颜色”等，可以把树上的序列分别弄上不同的颜色。你还可以选择不同方法做树，包括：neighbour joining, least squares, maximum likelihood, and Bayesian trees.

“Mark [sequence name] as also having evidence of this event” 和“Mark [sequence name] as not having evidence of this event.”选项可以使你在树上手动修改你认为RDP所犯的错误，就是如果你认为这个序列不属于这个重组事件你可以把它从该事件中剔除，或这个序列本应属于该重组事件，但RDP把他排除在外了，你可以认为把它加进去。

“Go to [sequence name]”选项可以指引你在schematic sequence display板块看到这个序列。

”Recheck plot with [sequence name] as recombinant/minor parent/major parent”选项可以使你看到如果你替换了重组序列/次要母本/主要母本（即树中的红色、蓝色和绿色序列）其中的一个序列后，进化树会变成什么样子。

The Matrix Display

点击主面板上的Matrix选项，就会显示出矩阵图像，有好多种矩阵的显示方法供你选择。

右击鼠标或者点击主面板上的下拉三角都可以选择。

如果你确定一个重组事件真的发生了，这时你就要仔细检查RDP有没有准确判断出重组发生的位点，和有没有夸大或过小分组的现象，你就要用其他RDP提供的附加应用进行验证。

8.2Bootscanning 8.3

注意事项：RDP4只是一种检测手段，也会出现很多的错误，不能完全依赖RDP4来判断重组。我们可以从以下几方面入手来减少RDP4发生错误的概率：

1、尽量多收集与你最感兴趣的序列同源性大于50%的序列，尽可能搜集全。

GNET操作手册

G-NET城市燃气管网水力分析软件操作手册中国市政工程华北设计研究院北京赛远科技发展有限公司

目录第一节概述第二节软件环境及安装 2-1 软件环境 2-2 软件安装 2-3 安装说明第三节软件处理流程及算法 3-1 处理流程 3-2 主要算法第四节软件操作方法 4-1 开始操作 4-2 软件运行操作方法 4-2-1 【专业绘图】功能模块操作方法 4-2-2 【数据准备】功能模块操作方法 4-2-3 【管网分析】功能模块操作方法 4-2-4 【辅助工具】功能模块操作方法第五节水力分析的计算依据 5-1 低压管网 5-2 中、高压管网第六节结束语

第一节概述：燃气管网分析软件基于Windows98/2000/Me/XP 操作系统，其中绘图则基于AutoCAD R14/R2000/R2002，具有良好的操作界面和方便的操作方法，适用于天然气、煤气、油煤气、气态液化石油气、液化石油气空气混合气及矿井气等燃气在高中压及低压等不同的压力级制下的环网的水力分析和计算。软件主要具有如下特点： ●充分利用Win32优越的内存管理功能，理论上计算管段数目只受计算机内存的限制。 ●管网分析计算与绘图一体化。 ●在自识别环路管网图的基础上，自动对环、管段及节点编号处理、自动设定管段流向。 ●符合修订规范要求、同时兼容原规范要求。 ●采用多种方式进行原始数据输入方式灵活,编辑方便。 ●分析结果以图形方式、文档方式及分析过程等多种方式输出。 ●采用先进的图形处理算法及迭代算法，在传统的节点方程法基础上采用变带宽矩阵存储系数矩阵，因为系数矩阵是一对称稀疏矩阵，运用变带宽技术可以节省大量的存储空间，使有限的内存可以计算的管段数有倍数级的增加。 ●COM组件模式。 ●易于操作，使用者短时间内即可熟练掌握。

国内外主流BI工具介绍和点评

国内外主流BI工具介绍和点评商业智能的应用在国外已广为普及，并且开始不断探索大数据和云技术。而国内，商业智能BI工具在这几年才开始慢慢被接受，企业开始有意识地建立一体化数据分析平台，为经营决策提供分析。从国内企业使用情况来看，BI工具的应用以国外产品为主，包括SAP BO、Oracle BIEE、Cognos、MSTR、Qlikview、Tableau等等，国内工具以FineBI、亿信华辰、永洪BI为主。这几类产品各有何优劣势呢？ ●国外 SAP BO:SAP公司收购的一款BI工具，产品运作模式是结合SAP的ERP系统，所以整合其他数据库或系统并不占优势，属于重型BI，使用要求较高，升级困难。 Oracle BIEE：无功无过，在BI产品不具特色，同SAP一样，与Oracle的产品线紧密绑在一起。貌似国外厂商都是捆绑型卖整体方案。 Cognos：传统BI工具中最被广泛使用的，已被IBM收购。拥有强大的数据库平台、在数据管理、数据整合以及中间件领域专业功底深厚。偏操作型，手工建模，一旦需求变化需要重新建模，学习要求较高。 MSTR：很低调的BI产品，多年来在BI市场中一直没站住脚，和excel有一定关系。二次开发环境好，但对服务器环境要求较高。 Qlikview:最大的竞争者是Tableau，同Tableau和国内众多BI一样，是属于新一代的轻量化BI产品，体现在建模、部署和使用上。只能运行在windows系统，C／S的产品架构。采用内存动态计算，数据量小时，速度很快；数据量大时，吃内存很厉害性能偏慢。 Tableau：自身定位是一款可视化工具，与Qlikview的定位差不多，可视化功能很强大，对计算机的硬件要求较高，部署较复杂。目前移动端只支持IOS系统。 ●国内 FineBI:帆软旗下的自助性BI产品，轻量化的BI工具，部署方便，走多维分析方向。后期采用jar包升级换代，维护方便，最具性价比。亿信华辰：只支持数据库中取数，文件数据需导入服务器。发展时间不长，整体还比较粗糙，需要继续磨练和完善。永洪BI:敏捷BI软件，产品稳定性较高。利用sql处理数据，不支持程序接口，实施交由第三方外包。

全基因组关联分析的原理和方法

全基因组关联分析(Genome-wide association study;GWAS)是应用基因组中数以百万计的单核苷酸多态性(single nucleotide ploymorphism ，SNP)为分子遗传标记，进行全基因组水平上的对照分析或相关性分析，通过比较发现影响复杂性状的基因变异的一种新策略。随着基因组学研究以及基因芯片技术的发展，人们已通过GWAS方法发现并鉴定了大量与复杂性状相关联的遗传变异。近年来，这种方法在农业动物重要经济性状主效基因的筛查和鉴定中得到了应用。全基因组关联方法首先在人类医学领域的研究中得到了极大的重视和应用，尤其是其在复杂疾病研究领域中的应用，使许多重要的复杂疾病的研究取得了突破性进展，因而，全基因组关联分析研究方法的设计原理得到重视。人类的疾病分为单基因疾病和复杂性疾病。单基因疾病是指由于单个基因的突变导致的疾病，通过家系连锁分析的定位克隆方法，人们已发现了囊性纤维化、亨廷顿病等大量单基因疾病的致病基因，这些单基因的突变改变了相应的编码蛋白氨基酸序列或者产量，从而产生了符合孟德尔遗传方式的疾病表型。复杂性疾病是指由于遗传和环境因素的共同作用引起的疾病。目前已经鉴定出的与人类复杂性疾病相关联的SNP位点有439 个。全基因组关联分析技术的重大革新及其应用，极大地推动了基因组医学的发展。(2005年, Science 杂志首次报道了年龄相关性视网膜黄斑变性GWAS结果,在医学界和遗传学界引起了极大的轰动, 此后一系列GWAS陆续展开。2006 年, 波士顿大学医学院联合哈佛大学等多个研究机构报道了基于佛明翰心脏研究样本关于肥胖的GWAS结果(Herbert 等. 2006);2007 年, Saxena 等多个研究组联合报道了与2 型糖尿病( T2D ) 关联的多个位点, Samani 等则发表了冠心病GWAS结果( Samani 等. 2007); 2008 年, Barrett 等通过GWAS发现了30 个与克罗恩病( Crohns ' disrease) 相关的易感位点; 2009 年, W e is s 等通过GWAS发现了与具有高度遗传性的神经发育疾病——自闭症关联的染色体区域。我国学者则通过对12 000 多名汉族系统性红斑狼疮患者以及健康对照者的GWAS发现了5 个红斑狼疮易感基因, 并确定了4 个新的易感位点( Han 等. 2009) 。截至2009 年10 月, 已经陆续报道了关于人类身高、体重、血压等主要性状, 以及视网膜黄斑、乳腺癌、前列腺癌、白血病、冠心病、肥胖症、糖尿病、精神分裂症、风湿性关节炎等几十种威胁人类健康的常见疾病的GWAS结果, 累计发表了近万篇论文, 确定了一系列疾病发病的致病基因、相关基因、易感区域和SNP变异。) 标记基因的选择： 1)Hap Map是展示人类常见遗传变异的一个图谱, 第1 阶段完成后提供了 4 个人类种族[ Yoruban ,Northern and Western European , and Asian ( Chinese and Japanese) ] 共269 个个体基因组, 超过100 万个SNP( 约1

数据分析系统—用户操作手册

数据分析系统操作手册目录一、前言 (2) 1.1、编写目的 (2) 1.2、读者对象 (2) 二、系统综述 (3) 2.1、系统架构 (3) 2.1.1系统浏览器兼容 (3) 三、功能说明 (4) 3.1、登录退出 (4) 3.1.1、登录 (4) 3.1.2、退出 (4) 3.1.3、用户信息 (5) 3.2、仪表盘 (5) 3.2.1、报表选择 (6) 3.2.2、布局方式 (7) 3.2.3、仪表盘管理 (8) 3.2.4、单个报表 (10) 3.3、应用中心 (13) 3.3.1、数据搜索 (13) 3.4、策略配置 (39)

3.4.1、数据采集 (39) 3.4.2、报表 (46) 3.4.3、数据类型 (53) 3.4.4、预设搜索 (58) 3.5、系统管理 (61) 3.5.1、代理注册设置 (61) 3.5.2、用户角色 (62) 3.5.3、系统用户 (65) 四、附件 (67) 一、前言 1.1、编写目的本文档主要介绍日志分析系统的具体操作方法。通过阅读本文档，用户可以熟练的操作本系统，包括对服务器的监控、系统的设置、各类设备日志源的配置及采集，熟练使用日志查询、日志搜索功能，并掌握告警功能并能通过告警功能对及日志进行定位及分析。 1.2、读者对象系统管理员：最终用户

项目负责人：即所有负责项目的管理人员测试人员：测试相关人员二、系统综述 2.1、系统架构系统主界面为所有功能点的入口点,通过主菜单可快速定位操作项。系统主要分为四大模块，分别为 1）：仪表盘 2）：应用中心 3）：策略配置 4）：系统管理 2.1.1系统浏览器兼容支持的浏览器 IE版本IE8至IE11等版本 Chrome 36及以上版本 Google chrome(谷歌浏览器) Firefox 30及以以上版本 Mozilla Firefox (火狐浏览器)

关于国内外软件系统的比较分析报告

国内外主要ERP系统的比较分析报告一．公司实力比较（一）软件厂家情况： 1、金蝶软件公司：金蝶软件公司是目前我公司的软件系统供应商，成立于1993年，目前为香港上市软件公司，为国内第二大管理软件商。公司从研发财务系统产品开始，进行ERP系统的业务发展，总部位于深圳，金蝶公司有K/3和EAS两条产品线，2007年的销售额约为6亿人民币，主要收入来源于针对中小企业的K/3财务与进销存系统软件，产品在某些细节方面功能不错，但由于系统构架不足，很难支持集团性、多组织集中管理的大规模应用。EAS产品是金蝶软件公司目前推出的集团性软件系统，但产品尚不完善，主要功能是集团财务，物流模块目前只推出标准功能，而且功能及流程在集团性企业的大规模应用尚待验证。 2、用友公司用友软件公司成立于1988年，目前为国内上市软件公司，为国内第一大管理软件商。公司与金蝶公司一样，也是从研发财务系统产品开始，进行ERP系统的业务发展，总部位于北京。用友公司有U8、NC和U9三条产品线，目前NC和U9两条产品线的市场定位重叠（针对集团用户），不同是技术路线不同。2007年用友公司的销售额约为10亿人民币，主要收入来源于针对中小企业的的U/8管理系统软件。二、国外厂家情况 3、SAP公司： SAP公司成立于1972年，是国际上著名的标准应用软件公司。SAP总部设在德国南部的沃尔道夫市，1988年成为德国股票上市公司。到1995年底，SAP

在世界40多个国家和地区设有代表处和独立子公司，具有近5000家用户，成为世界第五大软件供应商。1995年SAP集团在中国设立了子公司。目前是全球第二大管理软件商。SAP公司针对集团企业，有R/2、R/3两条产品线，R/2是用于集中式大型机环境的系统，R/3是用于分布式的客户机/服务器环境的系统。MY SAP套件则是SAP公司为了减化R/3系统复杂的实施应用，削减系统功能推出的R/E简版系统。在近年的行业发展，针对INTERNET应用和商业智能和CRM方面，SAP 公司明显落后于ORACLE公司的发展。 4、ORACLE公司： ORACLE公司目前为全球第一大ERP软件公司。该公司所建议的JDE系统最早由前身公司是JDE公司，成立于1977年，一直专注于ERP系统的研发设计、咨询、服务，并在90年代初已进入中国，并在很多行业有较好应用。在2005 年被ORACLE公司收购之前，该公司一直是ERP行业全球排名第三或第四名的厂商。ORACLE公司目前北京、上海、北京、广州、成都有ERP系统解决方案中心，支持中国各省分公司的ERP系统的方案咨询、ERP支持等业务。2008年的销售收入为240亿美元（其中含有数据库销售收入）。ORACLE JDE系统在医药行业有众多的用户，目前全球企业500强中，医药行业主要客户都是ORACLE JDE的用户，包括：葛兰索史克、默沙东、惠氏、中美史克、诺和诺德、同仁堂等国内外大医药企业。二、软件系统比较（一）国内系统 1、金蝶软件公司的EAS系统： EAS系统是在2003年收购原ERP厂商开思公司的TEAMS产品的基础上进行研发的，采用JA V A开发工具，以大中型企业和集团性企业为目标客户，系统规划支持多公司、多帐套、多语言，多业务单位的应用。2004年正式推出财务

ESA矢量分析软件操作手册

ESA-E4402B 矢量分析软件操作手册一、计算机、硬件的I/O连接及矢量分析软件安装本软件主要是利用ESA收集到的信号资源通过数字信息的方式与电脑之间进行传输，然后利用电脑的强大计算能力将收集的信号数字信息进行矢量分析及相关操作。首先要安装I/O软件，放入相应光盘，点击“安装软件”即可自动进入安装程序，安装完毕后，桌面会出现“Agilent Connection Expert”，点击后即进入I/O接口软件界面：点击“USB/GPIB（GPIB0）”选项，即出现：表示硬件还没有连接上计算机，这是需要将ESA和计算机USB口的连接线拿出，在ESA处于关机状态时（连接线请勿热拔插），将ESA和计算机进行连接，连接线连接完成后，启动ESA，然后点击 “”,即出现更新窗口，当更新完成后，图标前的小红叉即会变成绿色小钩，表示连接完成！下面介绍本矢量分析软件的安装：首先将相应的光盘放进光驱，出现安装界面后，点击“安装Agilent 89600 VSA”进入正式安装。安装完成后会在桌面出现“Vector Signal Analyzer”“Spectrum Analyzer”两个图标。点击第一个即

可进入操作软件界面：二、功能按键详解软件操作分为11大项：FILE 、EDIT 、CONTROL 、SOURCE 、INPUT 、MEAS-SETUP 、DISPLAY 、TRACE 、MARKERS 、UTILITIES 、HELP。 ①FILE其界面如下： Recall 调用 Preset 重新设定 Save保存数据，界面如下：

Recall：Preset： Save：其中：三项菜单的前四项分别为：（调用/重设/保存）设置、（调用/重设/保存）菜单工具栏、（调用/重设/保存）颜色、字体等外观显示、（调用/重设/保存）光谱图的颜色显示。 State Definitions （State Defs…）：规定精确度 Recall Recording调出保存的信号图像 Preset All将所有设置均重置，恢复原始设置。 Save Recording 保存信号图像。 Copy Trace 为拷贝正处于活动状态（ACTIVE）的某一信号轨迹 Remove Register 清除数据寄存器的登陆、注册 Print 、Print Setup 、Print Options 为常用打印菜单，打印正处于活动状态ACTIVE轨迹 Exit 关闭矢量分析软件 ②EDIT其界面如下： Undo 取消最后一个已经应用的动作（后退） Copy Trace Data 将当前的轨迹数据写入剪切版 Copy Text 将当前文字框里的内容写入剪切版 Copy Markers 将当前标记点的数据写入剪切版 ③CONTROL 其界面如下：

国内外主流ERP软件对比分析报告

国内外主流ERP软件对比分析报告 1.ERP概念及背景简介 ERP是指整合企业内部资源的企业经营管理系统，使企业业务数据统一化、全部在线处理。从技术层面看，它是利用信息技术成果，对企业内部的各类资源包括人、物、财、信息等进行规划、统筹与整合，从而减少环节，提高生产率，增强企业竞争力。从管理层面看，它又是一个较完整的集成化管理信息系统，包括分销、制造、会计、质量控制、售后服务、人力资源、运输等管理系统。从电子商务运作系统看，ERP是基础工程，没有ERP，供应链管理就失去了支持，整个电子商务的品质就要打折扣。因此，ERP作为崭新的现代管理手段，它的核心管理思想就是实现对整个供应链进行有效的管理。 ERP（enterprise resources planning）即企业资源计划，是在1990年由美国加特纳公司（Gartner Group Inc.）首先提出的。 ERP是基于计算机技术的发展，从哲理和实践两个方面，论述各类制造业企业在信息时代管理革命的发展趋势。在上个世纪三十年代以前，人们是很少去考虑计划这个问题时，后来由于经常出现一个矛盾现象，就是一方面为了确保生产不至于缺料断货，人们常常多备库存，这样会导致企业成本增加，而另一方面，人们又想提高资金的利用率，加快资金的周转，这样，客观上就要求减少库存的积压。ERP就是为了解决这对矛盾所诞生出来的。 2.国内外主要ERP软件

随着国内信息化建设的飞速发展,越来越多的企业希望通过应用ERP系统,将企业的人、财、物、产、供、销及相应的物流、信息流、资金流、管理流、增值流等紧密地集成起来,实现资源优化和共享。国内企业ERP系统需求走高同时，引来了大量的国外软件厂商在中国设立分公司，也引起了国内软件企业的关注。如国际著名的ERP软件的供应厂商和产品有Oracal公司开发的 E-Busine -ss Suite产品，SAP公司开发的R/3产品，Epicor公司开发的 ERP 10产品，微软公司开发的Axapta ERP产品，Infor公司开发的Infor ERP产品。同时在国内也涌现出一批优秀的ERP软件，包括用友的U8+和金蝶的EAS。以下是本报告对比分析的主要对象，也是国内外知名的软件厂商和ERP软件。公司名称软件名称简称 Epicor ERP 10 ERP 10 微软Axapta ERP AX Infor Infor ERP Infor ERP 用友 Your/8 U8+ 表1 国内外主流软件公司一览表 3.软件公司背景及ERP未来发展方向对比分析 3.1软件公司背景对比分析一．软件公司创立时间

软件系统操作手册

软件系统操作手册 Pleasure Group Office【T985AB-B866SYT-B182C-BS682T-STT18】

1引言编写目的韦氏盈创仓库管理系统是一个公司工作中不可缺少的一部分，他对于公司的人员以及财务的管理者和被管理者都非常重要。所以仓库管理系统应该为管理者和被管理者提供充足的信息和快捷的数据处理手段，但长期以来，人们使用传统的人工方式或性能较低的仓库管理系统来管理公司日常事务，操作流程比较繁琐，错误率比较高。一个成功的管理系统应提供快速的信息检索功能，增加和修改功能。参考资料《软件需求规格说明书》《概要设计说明书》《详细设计说明书》术语和缩略词 . 人工智能 API (Application Programming Interface) 应用(程序)编程接口Software Quality Assurance软件质量保证 UI Testing界面测试

2软件概述软件功能（1）进、出库管理。对进、出库信息进行记录。（2）查询功能。仓库管理对查询要求高，通过主菜单记录当前操作用户的用户编号，保证了对进、出库信息录入负责人的确认。（3）部门资料管理与库存报表生成。资料管理包括了人员信息管理，以及各项业务单据的资料管理。报表主要分类为：日报表，月报表，销售报表，入库报表等等。（4）应用计算机管理后，由于计算机能存贮大量的数据，而且数据只要一次存入，便可多次重复使用，所以管理数据达到完整，统一，原始记录能保证及时，准确。（5）应用计算机管理后，许多重复性的工作，都可由计算机去执行，从而使管理人员从事务性工作解脱出来，真正变为从事一些信息的分析，判断，决策等创造性的工作。

全基因组关联分析(GWAS)解决方案

全基因组关联分析(GWAS)解决方案 ※ 概述全基因组关联研究（Genome-wide association study，GWAS）是用来检测全基因组范围的遗传变异与可观测的性状之间的遗传关联的一种策略。2005年，Science杂志报道了第一篇GWAS研究——年龄相关性黄斑变性，之后陆续出现了有关冠心病、肥胖、2型糖尿病、甘油三酯、精神分裂症等的研究报道。截至2010年底，单是在人类上就有1212篇GWAS文章被发表，涉及210个性状。GWAS主要基于共变法的思想，该方法是人类进行科学思维和实践的最重要工具之一；统计学研究也表明，GWAS很长时期内都将处于蓬勃发展期（如下图所示）。基因型数据和表型数据的获得，随着诸多新技术的发展变得日益海量、廉价、快捷、准确和全面：如 Affymetrix和Illumina公司的SNP基因分型芯片已经可以达到2M的标记密度；便携式电子器械将产生海量的表型数据；新一代测序技术的迅猛发展，将催生更高通量、更多类别的基因型，以及不同类别的高通量表型。基于此，我们推出GWAS的完整解决方案，协助您一起探索生物奥秘。 ※ 实验技术流程 ※ 基于芯片的GWAS Affymetrix公司针对人类全基因组SNP检测推出多个版本检测芯片，2007年5月份，Affymetrix公司发布了人全基因组SNP 6.0芯片，包含90多万个用于单核苷酸多态性（SNP）检测探针和更多数量的用于拷贝数变化（CNV）检测的非多态性探针。因此这种芯片可检测超过180万个位点基因组序列变异，即可用于全基因组 SNP分析，又可用于CNV分析，真正实现了一种芯片两种用途，方便研究者挖掘基因组序列变异信息。 Illumina激光共聚焦微珠芯片平台为全世界的科研用户提供了最为先进的SNP（单核苷酸多态性）研究平台。Illumina的SNP芯片有两类，一类是基于infinium技术的全基因组SNP检测芯片（Infinium? Whole Genome Genotyping），适用于全基因组SNP分型研究及基因拷贝数变化研究，一张芯片检测几十万标签SNP位点，提供大规模疾病基因扫描(Hap660,1M)。另一类是基于GoldenGate?特定SNP位点检测芯片，根据研究需要挑选SNP位点制作成芯片(48-1536位点)，是复杂疾病基因定位的最佳工具。罗氏NimbleGen根据人类基因组序列信息设计的2.1M超高密度CGH芯片，可以在1.1Kb分辨率下完成全基因组检测，可有效检测人基因组中低至约5kb大小的拷贝数变异。

软件操作手册

软件操作手册麦收软件操作手册第一章软件的登录 1.1 麦收软件的概述 1.2 登录麦收软件 1、首先双击打开桌面上名为“服务程序”的文件；如图：打开之后是如下界面把这个最小化就OK了！ 2、双击打开桌面上名为“麦收软件”的文件；如图：打开之后是如下界面这里是帐套选择，本软件是多帐套的，各个帐套之间是独立互不相干的；双击帐套名称打开软件；界面如下：此时的用户名为管理员用户“000”，其密码默认为“8888”。然后鼠标点击“登陆”，或者敲两下键盘上的回车键；登陆系统。第二章基础档案 2.1 主界面介绍系统大致分为3部分，左边为功能选择、右边空白为显示区、上边横排为快捷按钮。

2.2 基础档案点击“基础档案”，会显示出基础档案菜单中的选项 1、颜色：单击“颜色”如下图：点击“新增”，增加新的颜色，如图： “颜色代码”：如果条码可以扫描则要分析条码的编码规则，一般为：货号+色号+尺码。此时输入的“颜色代码”就为条码上的色号。如果不要求扫描，则可以根据自己的需求编码。 “颜色名称” 输入“颜色代码”对应的颜色名称。然后点保存，这样一个新的颜色就建好了。如果需要修改颜色，则双击对应的颜色，这时颜色的“颜色代码”不能修改。 2、尺码单击“尺码”，如下图：点击“新增”，增加新的颜色，如图： “颜色代码”：如果条码可以扫描则要分析条码的编码规则，一般为：货号+色号+尺码。此时输入的“颜色代码”就为条码上的色号。如果不要求扫描，则可以根据自己的需求编码。“颜色名称” 输入“颜色代码”对应的颜色名称。然后点保存，这样一个新的颜色就建好了。如果需要修改颜色，则双击对应的颜色，这时颜色的“颜色代码”不能修改。 2、尺码单击“尺码”，如下图：点击“新增”，增加新的尺码，如图： “尺码代码”

(完整版)国内外主要有限元分析软件比较

有限元分析是对于结构力学分析迅速发展起来的一种现代计算方法。它是50年代首先在连续体力学领域--飞机结构静、动态特性分析中应用的一种有效的数值分析方法，随后很快广泛的应用于求解热传导、电磁场、流体力学等连续性问题。有限元分析软件目前最流行的有：ANSYS、ADINA、ABAQUS、MSC四个比较知名比较大的公司。常见软件有限元分析软件目前最流行的有：ANSYS、ADINA、ABAQUS、MSC四个比较知名比较大的公司，其中ADINA、ABAQUS在非线性分析方面有较强的能力目前是业内最认可的两款有限元分析软件，ANSYS、MSC进入中国比较早所以在国内知名度高应用广泛。目前在多物理场耦合方面几大公司都可以做到结构、流体、热的耦合分析，但是除ADINA以外其它三个必须与别的软件搭配进行迭代分析，唯一能做到真正流固耦合的软件只有ADINA。软件对比 ANSYS是商业化比较早的一个软件，目前公司收购了很多其他软件在旗下。ABAQUS专注结构分析目前没有流体模块。MSC是比较老的一款软件目前更新速度比较慢。ADINA是在同一体系下开发有结构、流体、热分析的一款软件，功能强大但进入中国时间比较晚市场还没有完全铺开。结构分析能力排名：1、ABAQUS、ADINA、MSC、ANSYS 流体分析能力排名：1、ANSYS、ADINA、MSC、ABAQUS 耦合分析能力排名：1、ADINA、ANSYS、MSC、ABAQUS 性价比排名：最好的是ADINA，其次ABAQUS、再次ANSYS、最后MSC ABAQUS软件与ANSYS软件的对比分析 1．在世界范围内的知名度两种软件同为国际知名的有限元分析软件，在世界范围内具有各自广泛的用户群。ANSYS 软件在致力于线性分析的用户中具有很好的声誉，它在计算机资源的利用，用户界面开发等方面也做出了较大的贡献。ABAQUS软件则致力于更复杂和深入的工程问题，其强大的非线性分析功能在设计和研究的高端用户群中得到了广泛的认可。由于ANSYS产品进入中国市场早于ABAQUS，并且在五年前ANSYS的界面是当时最好的界面之一，所以在中国，ANSYS软件在用户数量和市场推广度方面要高于ABAQUS。但随着ABAQUS北京办事处的成立，ABAQUS软件的用户数目和市场占有率正在大幅度和稳步提高，并可望在今后的几年内赶上和超过ANSYS。 2．应用领域

全基因组关联分析

全基因组关联分析（Genome-wide association study,GWAS) 是一种对全基因组范围内的常见遗传变异: 单核苷酸多态性(Single nucleotide polymorphism , SNP) 进行总体关联分析的方法, 即在全基因组范围内选择遗传变异进行基因分型, 比较病例和对照间每个变异频率的异差, 计算变异与疾病的关联强度, 选出最相关的变异进行验证并最终确认与疾病相关。单核苷酸多态性（英语：Single Nucleotide Polymorphism，简称SNP，读作/snip/）指的是由单个核苷酸—A,T,C或G的改变而引起的DNA序列的改变，造成包括人类在内的物种之间染色体基因组的多样性。在后GWAS时代，利用已有的GWAS数据在多个人群间进行meta分析已经成为一种常用的分析手段，这不仅可以进一步扩大样本量，更重要的是提高了统计效能。GWAS meta分析已经成功应该用在多种复杂疾病的遗传学研究，发现一批新的易感基因。全基因组关联水平（P_meta < 5.0×10-8）罕见等位基因（MAF < 5％），基因型填补（imputation）：依据已分型位点的基因型对数据缺失位点或未分型位点进行基因型预测的方法。可用于精细定位（fine-mapping），填补已确认的关联位点附近的位点，以便评价相邻SNP位点的关联证据。加快复杂性疾病易感基因的定位。连锁与连锁不平衡（linkage disequilibrium,LD）: 连锁：如果同一条染色体上2个位点的位置比较近，则这2个位点上的等位基因倾向于一起传递给下一代。连锁不平衡：又称等位基因关联，是指同一条染色体上，两个等位基因间的非随机相关。即当位于同一条染色体上的两个等位基因同时存在的概率大于人群中因随机分布而同时出现的概率时，就称这两个位点处于LD状态。所谓的连锁不平衡是一种遗传标记的非随机性组合。比如，一个基因有两个位点，一个位点有两种基因型，那么子代应该有2的2次方，即4种基因型。但是发现子代的基因型往往会少于4种，这就是连锁不平衡现象。这是由于两个位点距离较近引起的两个位点上的等位基因经常同时出现在同一染色体上。

CAE软件介绍

CAE CAE(Computer Aided Engineering)是用计算机辅助求解复杂工程和产品结构强度、刚度、屈曲稳定性、动力响应、热传导、三维多体接触、弹塑性等力学性能的分析计算以及结构性能的优化设计等问题的一种近似数值分析方法。CAE从60年代初在工程上开始应用到今天，已经历了30多年的发展历史，其理论和算法都经历了从蓬勃发展到日趋成熟的过程，现已成为工程和产品结构分析中(如航空、航天、机械、土木结构等领域)必不可少的数值计算工具，同时也是分析连续力学各类问题的一种重要手段。随着计算机技术的普及和不断提高，CAE系统的功能和计算精度都有很大提高，各种基于产品数字建模的CAE系统应运而生，并已成为结构分析和结构优化的重要工具，同时也是计算机辅助4C系统(CAD/CAE/CAPP/CAM)的重要环节。CA E系统的核心思想是结构的离散化，即将实际结构离散为有限数目的规则单元组合体，实际结构的物理性能可以通过对离散体进行分析，得出满足工程精度的近似结果来替代对实际结构的分析，这样可以解决很多实际工程需要解决而理论分析又无法解决的复杂问题。其基本过程是将一个形状复杂的连续体的求解区域分解为有限的形状简单的子区域，即将一个连续体简化为由有限个单元组合的等效组合体；通过将连续体离散化，把求解连续体的场变量(应力、位移、压力和温度等)问题简化为求解有限的单元节点上的场变量值。此时得到的基本方程是一个代数方程组，而不是原来描述真实连续体场变量的微分方程组。求解后得到近似的数值解，其近似程度取决于所采用的单元类型、数量以及对单元的插值函数。根据经验，CAE各阶段所用的时间为：40%～45%用于模型的建立和数据输入，50%～55%用于分析结果的判读和评定，而真正的分析计算时间只占5%左右。针对这种情况，采用CAD技术来建立CAE的几何模型和物理模型，完成分析数据的输入，通常称此过程为CAE的前处理。同样，CAE的结果也需要用CAD技术生成形象的图形输出，如生成位移图、应力、温度、压力分布的等值线图，表示应力、温度、压力分布的彩色明暗图，以及随机械载荷和温度载荷变化生成位移、应力、温度、压力等分布的动态显示图。我们称这一过程为CAE 的后处理。针对不同的应用，也可用CAE仿真模拟零件、部件、装置(整机)乃至生产线、工厂的运动和运行状态。 CAE软件按研究对象分为：静态结构分析，动态分析；按研究问题分为线性问题，非线性问题；主要有：Hyperworks，主要做前处理（分单元加载荷加约束）和后处理（看输出结果和仿真） I-DEAS，同时也做CAD Ansys，很经典的CAE，国内应用最广，客户成熟度最高，尤其是在高校科研领域。

基于全基因组关联分析的基因(环境)交互作用统计学方法进展

万方数据

７０８图ｌＭＤＲ基本步骤示意图划分为不同的分类，也就是图中的单元格。单元格中左侧直方图表示病例，右侧直方图表示对照。第４步：在ｎ维的每个多因子分类（单元格）中，计算病例数和对照数的比值，若病例数与对照数之比达到或超过某个阈值（例如≥１），则标为高危，反之则为低危。这样就把ｎ维的结构降低到一维两水平。第５步：多因子分类的集合中包含了ＭＤＲ模型中各因子的组合。在所有的两因子组合中，选择错分最小的那个ＭＤＲ模型，该两位点模型在所有模型中将具有最小的预测误差。第６步：通过十重交叉验证评估模型的预测误差，一以及单元格分配时的相对误差。也就是说，模型拟合９／１０的数据（训练样本），其预测误差将通过剩下１／１０的数据（检验样本）来衡量。选择预测误差最小的模型作为最终的模型，取ｌＯ次检验的预测误差平均值，作为模型相对预测误差的无偏估计。由于数据分组的方式对交叉验证的结果影响较大，因此，十重交叉验证过程将重复进行１０次，对ｎ个因子可能的集合将重复进行１０×１０次的交叉验证。通过十重交叉验证，在一定程度上可以避免因数据转换的偶然性，使Ｉ类错误增大而产生假阳性结果的影响。预测误差是衡量ＭＤＲ模型在独立检验的亚组中预测危险状态的指标，通过十重交叉验证的亚组中每一个的预测误差的平均值来计算。根据交叉验证的预测误差的平均值，选择最佳的Ｔｌ因子模型，并根据不同的因子数重复以上过程。最终筛选出最有可能存在交互作用的基因。ＭＤＲ的优势在于不需要考虑疾病的遗传模型，它利用计算机运算速度快的优势，对多个基因进行随机组合，按照上述方法找出存在交互作用的基因位点。但当主效应存在时，用ＭＤＲ方法很难得到最终模型，且同样受遗传异质性的影响；它只是一种数据挖掘方法，不是严格意义上的统计方法，还无法判断它的Ｉ类错误和检验功效。ＭＤＲ分析软件包可在ｈｔｔｐ：／／ｗｗｗ．ｅｐｉｓｔａｓｉｓ．ｏｒｇ／ｍｄｒ．ｈｔｍｌ免费下载。４基于复合ＬＤ的交互作用分析法吴学森等Ⅲ’提出基于复合ＬＤ的交互作用的分析法。该方法以病例一对照试验设计为基础，基于ＬＤ计算方法，构建完全有别于以上方法的一种新型基因间交互作用的统计分析方法：（１）用两个位点（基因）单倍型的外显率（只。）与等位基因的边际外显率的乘积（Ｐａ?Ｐ。）的偏差（６．口＝ＰＡ。一只?Ｐ８），分别定义病例组和对照组两个位点交互作用的度量．进而综合两组交互作用度量构造检验交互作用的统计量；（２）对于基因一环境交互作用模型的构建，则将环境（分类型变量）变量视为“虚拟位点”（例如Ｅ＝ｌ表示环境暴露。Ｅ＝０表示即非暴露），则同样依据上述方法构建其模型。４．１基因型数据的联合概率分布及其表达对于基因之间、基因与环境之间的交互作用统计量的构建，无论是二阶或高阶情形，均至少涉及两个变量。在本研究中，均以病例一对照试验设计为基础，个体的基因数据一律用其基因型表示。无论是病例组还是对照组，均设两个位点的等位基因分别为Ａ，ａ；Ｂ，ｂ，则它们的联合基因型分布可表述为表３的形式：则．配子的ＬＤ系数为：６．。＝％一ＰＡＰ。；非配子的ＬＤ系数为：乳口＝九日一只－匕，其中，Ｐ．ｅ＝尸竺＋ＰＡＢ舳＋碟＋Ｐ竺；ＪＤ∥。＝Ｐ竺＋Ｐ竺＋Ｐ：：＋形：。但是，当计算病例组或对照组的６．。时，需要知道双杂合子的概率Ｐ苫、Ｐ：：。然而。当它们的相未知时，则无法确定其值，只能进行单倍型推断。由于单倍型推断总是存在误差，这给后面构造的检验交互作用的统计量带来很多不确　万方数据

(完整word版)Cobasc501分析仪用户操作手册

第一章系统概述罗氏Cobas 6000是全自动免疫测定与光度测定分析系统，可定性或定量测定检测项目，Cobas 6000包括两部分： cobas c 501生化分析模块：进行分光光度测定和离子选择电极测定cobas e 601免疫分析模块：进行电化学发光测定下面从控制单元、核心单元、cobas c 501生化分析模块等三部分介绍该系统（cobas e 601免疫分析模块不作介绍）。 A 显示器（连接cobas） B 键盘/鼠标（连接coba9 C 计算机（连接cobas） D 触摸式显示器（主机） E 键盘/鼠标（主机） F 计算机（主机） G 人体学PC支架 1、控制单元

2、核心单元 1）核心单元轨道 A 核心单元 B 急诊标本位 C 条形码阅读器 E模块轨道 F常规标本上机位 G标本退出位 D 标本架转盘 B A ---------- ■■札■泗 ■ ■ ■B-C B BIN

急诊标本位 A A标本架托盘B标本架C标本杯、微量杯

2）标本架及标本容器标本架类型标本架颜色标本架ID号软件中显示标本架上标签常规标本架灰色5001-8999001-3999001-3999 STAT标本架红色4001-4999E001-E999S001-S999定标标本架黑色2001-2999S001-S999C001-C999 QC标本架白色3001-3999C001-C999Q001-Q999保养标本架绿色B999B999W999 标本试管直径为13mm或16mm，长度为75mm或100mm ;标本杯可插入16 mm标本试管中用。 A 标本架上的标本杯 B 16mm x 75mm试管 C 16mm x 75mm试管上标本杯 D 16mm x 100mm试管 E 16mm x 100mm试管上的标本杯

Fast UniFrac ,PCoA 分析软件使用说明

Fast UniFrac is a new version of UniFrac that is specifically designed to handle very large datasets. Like UniFrac, Fast UniFrac provides a suite of tools for the com parison of m icrobial com m unities using phylogenetic inform ation. It takes as input a single phylogenetic tree that contains sequences derived from at least three different environm ental sam ples, a file m apping ids used in the tree to a set of unique sam ple ids (sam e form at as prior version 'environm ent file', and an (optional) category m apping file describing additional relationships between sam ples and subcategories for visualizations. For exam ple, in a given set of gut sam ples, you m ight define subcategories for different diets, different physical locations/dates, different species, and/or different treatm ents like antibiotics or high fat. For sam ple data click here. For citation, click here. Both the UniFrac distance m etric and the P test can be used to m ake com parisons. Both of these techniques bypass the need to choose operational taxonom ic units (OTUs) based on sequence divergence prior to analysis. Fast UniFrac allows you to: Determ ine if the sam ples in the input phylogenetic tree have significantly different m icrobial com m unities. Cluster sam ples to determ ine whether there are environm ental factors (such as tem perature, pH, or salinity) that group com m unities together. Determ ine whether system under study was sam pled sufficiently to support cluster nodes. Easily visualize the differences between sam ples graphically, with support for three dim ensional exploration of datasets and with m ultiple subcategory coloring. Please enter your em ail and password to continue. After you register you will be able to analyze up to 100000 unique sequences, up to 200sam ples, and perform significance test based on up to 1000 tree perm utations. If you wish to analyze m uch larger datasets than the defaults, please contact us and we will be happy to try to accom m odate you. Fast UniFrac tutorial Introduction This tutorial takes you through the steps of analyzing data in the Fast UniFrac web application. The purpose of this tutorial is to show you how to use the interface to find the im portant variables for describing phylogenetic variation am ong your sam ples: in this case, to test what types of physical or chem ical factors are m ost im portant for structuring bacterial diversity. The dataset used in this tutorial includes 50 of the 464 sam ples analyzed in Ley, RE, Lozupone, CA, Ham ady, M, Knight, R and JI Gordon. (2008). Worlds within worlds: evolution of the vertebrate gut m icrobiota. Nat. Rev. Microbiol. 6(10): 776-88 (Pubm ed). It includes sequences from 16S ribosom al RNA surveys of diverse freeliving bacterial assem blages and the guts of diverse m am m als and term ites. At the end of this tutorial, you should be fully equipped to test hypotheses about your own sequences. Also included in this tutorial are other exam ple files you m ay use to explore som e of the other features of Fast UniFrac. Example data files To use Fast UniFrac, you need three files: a tree file, a sam ple id m apping file, and a category m apping file. The tree file contains a phylogenetic tree, in Newick form at. The sam ple id m apping file contains a table showing how m any tim es each taxon (from the tree) occurred in each of your sam ples. The category m apping file contains additional m etadata about the sam ples, and is a table relating each sam ple to param eters you have m easured such as tem perature, pH, etc. In general, people usually prepare the two m apping files using Excel, although it is im portant to save them as plain text form at and not as Excel docum ents. You can either generate your own tree file, or use one of the reference trees. The PhyloChip reference tree m atches the probes on the PhyloChip and is useful for analyzing PhyloChip data; the Greengenes reference tree is from the Greengenes core set and is a phylogenetically diverse and representative set of bacteria. These trees are built using 16S rRNA, although you can use trees built from any m olecule, not just the 16S, or even trees constructed from m orphological or other data. The sam ple id m apping file m ust be generated m apping the sequence ids in the tree file with the sam ple ids used in your study. In other words, exactly the sam e taxon nam es m ust be used in your tree and in your sam ple id m apping file. The category m apping file m aps your sam ple ids to additional m etadata, such as subcategories, and sam ple descriptions. This file can be autogenerated but it is highly recom m ended that you generate one that is m eaningful for the variation you plan to exam ine in your studies. For exam ple, if you were studying the effects of diet on the gut com m unities of conventional and hum anized m ice, you m ight want one colum n indicating whether the sam ple was from a conventional or a hum anized m ouse, another colum n indicating whether the m ouse was on a chow diet or a high-fat diet, another colum n containing the com bination of these two colum ns (i.e. diet and hum anized/conventional), etc. In this section, several exam ple files are listed, not all of which are used in this tutorial. Greengenes coreset reference datasets This is the tree and the sequences m atching the Greengenes core set as of May 2009. These files are useful for m apping your sequences against known bacterial diversity. 1. Greengenes coreset tree (May 09) 2. Greengenes coreset fasta (May 09) NRM data (demo subset) These data are from the Ley et al. 2008 Nature Reviews Microbiology paper referenced above, and provide an exam ple of m apping heterogeneous reads to the Greengenes core set tree so that the com m unities can be com pared by UniFrac. The sam ple ID m apping file was generated by blasting the dataset from the paper against the Greengenes_coreset_fasta file linked above, and the category m apping file was constructed m anually to provide a range of fine- and coarse-grained representations of the environm ental data. 1. Ley et al exam ple sam ple ID m apping file 2. Ley et al exam ple category m apping file Example PhyloChip data Exam ple data from Sagaram et al. 2009 AEM paper (Pubm ed) for use with PhyloChip reference tree. 1. Sagaram et al PhyloChip sam ple ID m apping file 2. Sagaram et al PhyloChip category m apping file Crump et al data These sequences are from Crum p et al. 1999 "Phylogenetic analysis of particle-attached and free-living bacterial com m unities in the Colum bia river, its estuary, and the adjacent coastal ocean", AEM 65:3192 (Pubm ed). This dataset was used in the original online UniFrac tutorial (Pubm ed)so are provided again here with two im portant changes. We provide an exam ple category m apping file that contains additional m etadata about each of the sam ples.