(R语言微生物统计)堆叠图(Top_10门相对水平丰度图)

合集下载

R语言绘图多图叠加和图形分

R语言绘图多图叠加和图形分

R绘图课程:多图叠加与图形分页gaom在我们用R画图的时候常常碰到一种问题,就是我们简简单单一个对象的图无法达到我们想要的结果。

可能我们是一个对象但有多种展示,需要把多个图放在一起。

也可能我们要画的是多个对象,但每个对象的图其实都是并行的。

前面一种情况我理解为是多图叠加,即需要多张不同的图拼凑到一张图中。

后面的情况我理解为是图形分页,即把类似的图形有序的排列展示给大家看。

今天我们讨论的主题就是如何去解决上述的两种情况。

首先,我们针对第一种情况。

其实第一种情况我们还是要划分一下。

多图叠加,其中的叠是指我们的绘图中两张或多张不同的图整合到一种图中,共用一个坐标轴。

比如一张柱状图,一张曲线图合并到一张图中。

而其中的加则是指我们想合并的图之间无法共用坐标轴,我们只能在一张图中划分不同的区域加需要的多张图放置进去。

光说不练假把式,今天我们就找几个实例展示一下,让大家看下我们如果处理这种常见的问题。

library("ggplot2")#这次主要是用ggplot来处理data<(file ="C:/Users/gaom/Desktop/R语言绘图:多图叠加和图形分页/",header=F,s tringsAsFactors=F,sep ="\t")#因为文件中有数字也有字符,所以建议加上stringsAsF actors=F。

head(data)## V1 V2 V3 V4## 1 1 0. A## 2 2 A## 3 3 A## 4 4 A## 5 5 0. A## 6 6 0. Adim(data)## [1] 48 4第一列是染色体名,第二列和第三列分别是两种计算结果,具体意义暂时不予理会。

第四列是染色体的区域,100000表示1到100000,200000表示100001到200000。

我们大致知道数据结构即可。

下面我们开始画图p1<-ggplot(data)+geom_bar(aes(x=data$V1,y=data$V3,fill = data$V4,group = data $V4),,position ="dodge",stat ="identity",colour ="black")+scale_x_continuou s(breaks =1:12)#加上position="dodge"后会每条染色体分成四个柱子,加上colour = "black",则每个柱子的边框为黑色。

(R语言微生物统计)Alpha多样性指数分析

(R语言微生物统计)Alpha多样性指数分析

Alpha多样性指数R Markdown使用Alpha多样性指数分析整合包,直接查看OTU丰度表中个样本其物种丰富度(Richness)、Shannon指数、Simpson指数、均匀度等library(vegan)## Loading required package: permute## Loading required package: lattice## This is vegan 2.5-6otu <-read.delim('otu_table.txt', s =1, sep ='\t', stringsAs Factors =FALSE, s =FALSE)otu <-t(otu)#paste(otu)alpha <-function(x, tree =NULL, base =exp(1)) {est <-estimateR(x)Richness <-est[1, ]Chao1 <-est[2, ]ACE <-est[4, ]Shannon <-diversity(x, index ='shannon', base = base)Simpson <-diversity(x, index ='simpson') #Gini-Simpson 指数Pielou <-Shannon /log(Richness, base)goods_coverage <-1-rowSums(x ==1) /rowSums(x)result <-data.frame(Richness, Shannon, Simpson, Pielou, Chao1, ACE, goods_coverage)if (!is.null(tree)) {PD_whole_tree <-pd(x, tree, include.root =FALSE)[1]names(PD_whole_tree) <- 'PD_whole_tree'result <-cbind(result, PD_whole_tree)}result}alpha(otu)## Richness Shannon Simpson Pielou Chao1 ACE ## YC4_tags 361 0.9453696 0.2689189 0.1605348 527.9608 513.3269 ## YC10_tags 339 2.0299787 0.7219955 0.3484344 465.2500 455.2474 ## YC9_tags 419 3.3495053 0.7951597 0.5547494 519.0370 511.8299 ## YC7_tags 349 1.3442287 0.4701527 0.2295836 553.0000 488.7283 ## YC6_tags 362 3.2447958 0.9146631 0.5507454 481.0222 478.6492 ## YC5_tags 357 1.3924718 0.5036201 0.2369062 641.1667 612.5431 ## LC4_tags 818 3.9742019 0.9488191 0.5925576 949.8571 925.8248## LC5_tags 519 2.3356162 0.8055062 0.3735848 756.1268 746.7904 ## LC6_tags 384 1.6742251 0.6179335 0.2813520 651.3200 646.6022 ## LC7_tags 499 1.9678482 0.7033262 0.3167508 733.5316 775.7946 ## LC8_tags 534 3.4471530 0.9230543 0.5488751 664.5000 640.3181 ## LC9_tags 513 1.6151138 0.6060194 0.2588209 1063.0429 1108.6180 ## LS4_tags 890 4.7436170 0.9790477 0.6984925 999.8462 960.8281 ## LS5_tags 780 4.3884882 0.9675036 0.6590020 888.9429 878.2522 ## LS6_tags 721 3.9336592 0.9459732 0.5977625 848.3944 829.5897 ## LS7_tags 1123 4.6987156 0.9751358 0.6689745 1496.7830 1409.2351 ## LS8_tags 542 4.1855055 0.9680743 0.6648655 685.6842 640.0078 ## LS9_tags 456 3.7437717 0.9289139 0.6114783 744.5769 654.8414 ## YS4_tags 979 4.4006823 0.9698461 0.6390274 1207.2245 1143.9574 ## YS5_tags 421 3.2791789 0.9331226 0.5426739 559.7500 538.6407 ## YS6_tags 698 3.8535663 0.9478333 0.5884907 818.9870 804.5966 ## YS7_tags 602 3.1701528 0.8398501 0.4953165 701.3590 706.4068 ## YS9_tags 1762 5.2589942 0.9774693 0.7036192 1945.2069 1899.3629 ## YS10_tags 585 3.5526870 0.9414939 0.5575806 765.9623 726.8424 ## SE1_tags 2669 4.8186377 0.9511429 0.6107691 3381.5256 3331.1058 ## SE3_tags 3018 6.2457224 0.9922033 0.7795120 3519.1471 3463.4975 ## SE4_tags 2754 4.6301587 0.9274917 0.5845562 3292.8941 3271.6759 ## SE5_tags 2636 5.6340702 0.9803631 0.7152542 3147.2241 3107.5592 ## SE6_tags 2916 5.2270536 0.9390863 0.6551861 3558.4308 3492.7287 ## SE7_tags 2844 5.9429714 0.9831482 0.7472647 3177.9000 3136.1206 ## SE9_tags 2722 6.0706364 0.9895751 0.7675487 3052.8421 3005.5336 ## SE8_tags 2956 6.1468621 0.9846147 0.7691661 3409.3333 3331.4465 ## SpW1_tags 1334 4.6859034 0.9730860 0.6511874 1981.5946 2071.9821 ## SpW2_tags 1060 4.5668092 0.9722317 0.6555833 1697.5000 1601.3531 ## SpW3_tags 1222 4.6223684 0.9702210 0.6502827 1804.7987 1817.3657 ## SpW4_tags 1229 4.9939331 0.9854069 0.7019910 1761.8926 1750.2235 ## SpW5_tags 1166 4.7471027 0.9791477 0.6722671 1758.6172 1686.2714 ## SpW6_tags 1222 4.6915961 0.9775129 0.6600218 1889.5411 1817.2145 ## SpW7_tags 1199 4.5636402 0.9731284 0.6437415 1814.3147 1755.7134 ## SpW8_tags 1129 4.6255281 0.9761559 0.6580553 1705.4545 1621.7957 ## SpW9_tags 1176 4.7812914 0.9798102 0.6762909 1653.7466 1641.9183 ## goods_coverage## YC4_tags 0.9983198## YC10_tags 0.9987046## YC9_tags 0.9990509## YC7_tags 0.9984609## YC6_tags 0.9986660## YC5_tags 0.9980120## LC4_tags 0.9981659## LC5_tags 0.9976398## LC6_tags 0.9978965## LC7_tags 0.9975245## LC8_tags 0.9984994## LC9_tags 0.9964345## LS4_tags 0.9984609## LS5_tags 0.9984096## LS6_tags 0.9982685## LS7_tags 0.9963831## LS8_tags 0.9986532## LS9_tags 0.9984225## YS4_tags 0.9972810## YS5_tags 0.9985764## YS6_tags 0.9982428## YS7_tags 0.9983968## YS9_tags 0.9970370## YS10_tags 0.9982172## SE1_tags 0.9904299## SE3_tags 0.9922127## SE4_tags 0.9915088## SE5_tags 0.9923418## SE6_tags 0.9909930## SE7_tags 0.9938816## SE9_tags 0.9942409## SE8_tags 0.9930088## SpW1_tags 0.9937142## SpW2_tags 0.9951903## SpW3_tags 0.9944710## SpW4_tags 0.9948823## SpW5_tags 0.9949978## SpW6_tags 0.9943307## SpW7_tags 0.9946125## SpW8_tags 0.9952030## SpW9_tags 0.9952031根据表中数据,SE海岛样本中的微生物丰度是最高的,其中SE3_tag样本中otu 丰度达到3018,其次是SpW海岛。

【原创】r语言层次聚类案例附代码数据

【原创】r语言层次聚类案例附代码数据

####################################################################### ############ 聚类分析####################################################################### a=cbind(农业总产值 ,林业总产值, 牧业总产值, 渔业总产值, 农村居民家庭拥有生产性固定资产原值, 农村居民家庭经营耕地面积)# ⭞↚⭞Ѡ⭞䠅㚐㊱rownames(a)=mydata$地区detach(mydata)hc1=hclust(dist(scale(a)),"ward.D2")cbind(hc1$merge,hc1$height)### [,1] [,2] [,3]## [1,] -22 -24 0.1562347## [2,] -2 -29 0.4954046## [3,] -12 -20 0.6158525## [4,] -4 1 0.7459837## [5,] -5 -7 0.8431761## [6,] -27 4 0.8502919## [7,] -28 -30 0.9238256## [8,] 2 7 0.9982795## [9,] -1 -9 1.0586066## [10,] -14 3 1.0996796## [11,] -16 -23 1.1292437## [12,] -25 10 1.2758523## [13,] -13 -19 1.4055256## [14,] -3 11 1.4555952## [15,] -21 6 1.6495578## [16,] -10 -17 1.7462669## [17,] 9 15 1.7988319## [18,] -18 12 1.8498860## [19,] -6 -11 1.9536216## [20,] -8 5 2.1881307## [21,] -15 16 2.5009589## [22,] -31 20 2.7312571## [23,] 13 18 3.0129164## [24,] 8 17 3.0616119## [25,] 19 23 3.2580779## [26,] 14 21 4.3774794## [27,] -26 22 5.2122229## [28,] 25 26 6.0403304## [29,] 24 27 8.3310723## [30,] 28 29 11.4082257plot(hc1,hang=-2,ylab="欧氏距离",main="ward ")cutree(hc1,3)## 北京天津河北山西内蒙辽宁吉林黑龙江上海江苏## 1 1 2 1 3 2 3 3 1 2## 浙江安徽福建江西山东河南湖北湖南广东广西## 2 2 2 2 2 2 2 2 2 2## 海南重庆四川贵州云南西藏陕西甘肃青海宁夏## 1 1 2 1 2 3 1 1 1 1## 新疆## 3library(NbClust)# 加载包res<-NbClust(a, distance ="euclidean", min.nc=2, max.nc=8,method ="complete", index ="ch")res$All.index## 2 3 4 5 6 7 8## 22.4859 64.2952 95.0505 91.2070 112.2167 126.6607 125.0580res$Best.nc## Number_clusters Value_Index## 7.0000 126.6607res$Best.partition## 北京天津河北山西内蒙辽宁吉林黑龙江上海江苏## 1 2 2 3 4 5 5 4 6 1## 浙江安徽福建江西山东河南湖北湖南广东广西## 5 1 1 3 2 1 3 3 3 1## 海南重庆四川贵州云南西藏陕西甘肃青海宁夏## 1 1 1 1 2 7 1 2 5 5## 新疆## 4####################################################################### ############ 因子分析####################################################################### x=ascale(x,center=T,scale=T)## 农业总产值林业总产值牧业总产值渔业总产值## 北京 -1.22777296 -0.68966546 -1.0576108 -0.717868590## 天津 -1.20072019 -1.32628581 -1.1287831 -0.587405030## 河北 1.44015787 -0.40768816 1.2735925 -0.276307864## 山西 -0.60736290 -0.39313054 -0.8459665 -0.730089499## 内蒙 -0.31173176 -0.16449038 0.3536925 -0.682760278## 辽宁 0.02317599 0.21376291 1.0886323 0.905582647## 吉林 -0.31664133 -0.16033106 0.3705164 -0.661159286## 黑龙江 0.73000004 0.28496065 0.6928325 -0.543827843## 上海 -1.22304555 -1.24358878 -1.1769433 -0.598687930## 江苏 1.32304764 -0.14014613 0.5106958 2.558246143## 浙江 -0.25945707 0.37842297 -0.4799669 1.088655075## 安徽 0.32193142 1.20245730 0.3549653 0.277626262## 福建 -0.22816878 1.77681021 -0.5790521 1.668371030## 江西 -0.46544975 1.43990544 -0.1820088 0.139953438## 山东 2.22835882 -0.05133246 2.0610374 2.643122498## 河南 2.22683767 0.36264203 2.0166955 -0.521101240## 湖北 0.88705181 -0.13647615 0.6684891 0.925656025## 湖南 1.03609706 1.81987138 0.8945726 -0.002409428## 广东 0.65132842 1.36442604 0.3760463 1.697020485## 广西 0.19109441 1.64358969 0.2862654 0.136415807## 海南 -0.95958625 0.32594217 -0.9698633 -0.119446069## 重庆 -0.61246376 -0.82851329 -0.6191076 -0.632081027## 四川 1.13921636 0.49292656 2.0375425 -0.313747797## 贵州 -0.59146827 -0.69749477 -0.6664339 -0.677051827## 云南 -0.10569354 1.40222691 0.0524867 -0.583545796## 西藏 -1.33060989 -1.32909946 -1.1967954 -0.752065694## 陕西 0.01099770 -0.64550329 -0.4072439 -0.713500151## 甘肃 -0.48272891 -1.11489458 -0.9441448 -0.747831257## 青海 -1.27264229 -1.30451055 -1.0825979 -0.751154486## 宁夏 -1.16021392 -1.24089745 -1.1284759 -0.716850181## 新疆 0.14646191 -0.83389594 -0.5730687 -0.711758136## 农村居民家庭拥有生产性固定资产原值农村居民家庭经营耕地面积## 北京 -0.521919855 -0.69519658 ## 天津 -0.036498322 -0.33578982 ## 河北 0.004069841 -0.23262677 ## 山西 -0.824825602 -0.02962851 ## 内蒙 1.179852466 2.59936535## 辽宁 0.730243656 0.39633505## 吉林 0.724094855 1.89053536## 黑龙江 1.396721068 3.65096289## 上海 -1.404513394 -0.77506475 ## 江苏 -0.340308064 -0.44560856 ## 浙江 0.499884752 -0.68188522 ## 安徽 -0.279565363 -0.23262677 ## 福建 -0.618739413 -0.61865625 ## 江西 -0.805278639 -0.33911766 ## 山东 0.133404538 -0.31582278 ## 河南 -0.500048919 -0.32247846 ## 湖北 -0.721961668 -0.29252790 ## 湖南 -0.917381131 -0.45559208 ## 广东 -0.957062704 -0.68521306 ## 广西 -0.615649655 -0.40567447 ## 海南 -0.663204069 -0.58537785 ## 重庆 -0.570175555 -0.43229719 ## 四川 -0.420353046 -0.48221480 ## 贵州 -0.604823220 -0.46890344 ## 云南 0.118332502 -0.32913414 ## 西藏 3.590383141 -0.23262677 ## 陕西 -0.572497480 -0.35575687 ## 甘肃 0.165991341 0.04358397## 青海 0.415065901 -0.25259382 ## 宁夏 0.655330865 0.36638449## 新疆 1.761431173 1.05524743 ## attr(,"scaled:center")## 农业总产值林业总产值## 1514.206129 111.20612 9## 牧业总产值渔业总产值## 877.092581 280.83903 2## 农村居民家庭拥有生产性固定资产原值农村居民家庭经营耕地面积## 17865.076774 2.58903 2## attr(,"scaled:scale")## 农业总产值林业总产值## 1097.854553 81.74416 7## 牧业总产值渔业总产值## 683.552567 373.13101 0## 农村居民家庭拥有生产性固定资产原值农村居民家庭经营耕地面积## 9767.757883 3.00495 2cor(x)### 农业总产值林业总产值牧业总产值## 农业总产值 1.00000000 0.4304367 0.9148545 ## 林业总产值 0.43043666 1.0000000 0.4593615 ## 牧业总产值 0.91485445 0.4593615 1.0000000 ## 渔业总产值 0.51598365 0.4351225 0.4103977 ## 农村居民家庭拥有生产性固定资产原值 -0.16652881 -0.3495913 -0.1017802## 农村居民家庭经营耕地面积 0.04040478 -0.0961515 0.1426829## 渔业总产值## 农业总产值 0.5159836## 林业总产值 0.4351225## 牧业总产值 0.4103977## 渔业总产值 1.0000000## 农村居民家庭拥有生产性固定资产原值 -0.2131248## 农村居民家庭经营耕地面积 -0.2669966## 农村居民家庭拥有生产性固定资产原值## 农业总产值 -0.1665288 ## 林业总产值 -0.3495913 ## 牧业总产值 -0.1017802 ## 渔业总产值 -0.2131248 ## 农村居民家庭拥有生产性固定资产原值 1.0000000 ## 农村居民家庭经营耕地面积 0.5316341 ## 农村居民家庭经营耕地面积## 农业总产值 0.04040478## 林业总产值 -0.09615150## 牧业总产值 0.14268286## 渔业总产值 -0.26699659## 农村居民家庭拥有生产性固定资产原值 0.53163410## 农村居民家庭经营耕地面积 1.00000000FA=factanal(x,3,scores="regression")FA#### Call:## factanal(x = x, factors = 3, scores = "regression")#### Uniquenesses:## 农业总产值林业总产值## 0.134 0.64 9## 牧业总产值渔业总产值## 0.005 0.00 5## 农村居民家庭拥有生产性固定资产原值农村居民家庭经营耕地面积## 0.005 0.61 0#### Loadings:## Factor1 Factor2 Factor3## 农业总产值 0.902 0.231## 林业总产值 0.460 -0.274 0.253## 牧业总产值 0.989 0.100## 渔业总产值 0.335 -0.172 0.924## 农村居民家庭拥有生产性固定资产原值 -0.185 0.980## 农村居民家庭经营耕地面积 0.120 0.569 -0.227#### Factor1 Factor2 Factor3## SS loadings 2.164 1.396 1.032## Proportion Var 0.361 0.233 0.172## Cumulative Var 0.361 0.593 0.765#### The degrees of freedom for the model is 0 and the fit was 0.0338A=FA$loadings#D=diag(FA$uniquenesses)#cancha=cor(x)-A%*%t(A)-Dsum(cancha^2)## [1] 0.01188033FA$scores## Factor1 Factor2 Factor3## 北京 -0.9595745 -0.700059511 -0.55760316## 天津 -1.0947804 -0.236528598 -0.28377148## 河北 1.3398849 0.269241913 -0.72734450## 山西 -0.6949304 -0.952525400 -0.71168863## 内蒙 0.3022926 1.274620864 -0.61477840## 辽宁 0.9086974 0.898645857 0.80686141## 吉林 0.3617131 0.823049845 -0.69568729## 黑龙江 0.6377695 1.558056539 -0.53064438## 上海 -1.0020542 -1.600313046 -0.58279912## 江苏 0.2978404 -0.338175607 2.58332275## 浙江 -0.6586307 0.351125849 1.47562686## 安徽 0.3633716 -0.220261996 0.12915299## 福建 -0.7017677 -0.799773443 1.90201088## 江西 -0.1252221 -0.843258690 0.03964935## 山东 1.8098550 0.433178408 2.27098864## 河南 2.1841524 -0.072629248 -1.35570609## 湖北 0.6625677 -0.618906179 0.64211420## 湖南 1.0200226 -0.733225411 -0.50075826## 广东 0.3057090 -0.945233885 1.54225085## 广西 0.3420343 -0.562216144 -0.07785160## 海南 -0.9131785 -0.847172077 0.04381513## 重庆 -0.5087268 -0.661768675 -0.62025496## 四川 2.1397385 -0.003827953 -1.11031362## 贵州 -0.5463126 -0.703696201 -0.66210885## 云南 0.1044516 0.146947680 -0.63418799## 西藏 -1.5214222 3.342858193 0.36144124## 陕西 -0.2687306 -0.616728372 -0.78286620## 甘肃 -0.8904189 0.010720625 -0.48059064## 青海 -1.0791206 0.225711752 -0.37974261## 宁夏 -1.1481591 0.456190239 -0.27546552## 新疆 -0.6670714 1.665952673 -0.21307102FA=factanal(x,3,scores="regression")#FA#### Call:## factanal(x = x, factors = 3, scores = "regression")#### Uniquenesses:## 农业总产值林业总产值## 0.134 0.64 9## 牧业总产值渔业总产值## 0.005 0.00 5## 农村居民家庭拥有生产性固定资产原值农村居民家庭经营耕地面积## 0.005 0.61 0#### Loadings:## Factor1 Factor2 Factor3## 农业总产值 0.902 0.231## 林业总产值 0.460 -0.274 0.253## 牧业总产值 0.989 0.100## 渔业总产值 0.335 -0.172 0.924## 农村居民家庭拥有生产性固定资产原值 -0.185 0.980## 农村居民家庭经营耕地面积 0.120 0.569 -0.227#### Factor1 Factor2 Factor3## SS loadings 2.164 1.396 1.032## Proportion Var 0.361 0.233 0.172## Cumulative Var 0.361 0.593 0.765#### The degrees of freedom for the model is 0 and the fit was 0.0338 biplot(FA$scores,FA$loadings)######################################################################## ########## 主成分分析####################################################################### # mydata<-read.csv("cosume.csv",header=TRUE)x=aPCA=princomp(x)# 分分析summary(PCA)## Importance of components:## Comp.1 Comp.2 Comp.3 Comp.4## Standard deviation 9611.2440729 1.248877e+03 3.201426e+02 2.211289e+02## Proportion of Variance 0.9817713 1.657641e-02 1.089277e-03 5.1968 75e-04## Cumulative Proportion 0.9817713 9.983477e-01 9.994370e-01 9.9995 67e-01## Comp.5 Comp.6## Standard deviation 6.377898e+01 2.299907e+00## Proportion of Variance 4.323210e-05 5.621753e-08## Cumulative Proportion 9.999999e-01 1.000000e+00plot(PCA)screeplot(PCA,type="lines")# ⻄⭞ഴPCA$loadings##### Loadings:## Comp.1 Comp.2 Comp.3 Comp.4 Comp. 5## 农业总产值 0.847 0.529 ## 林业总产值 -0.994 ## 牧业总产值 0.510 0.340 -0.786 ## 渔业总产值 0.147 -0.939 -0.304 ## 农村居民家庭拥有生产性固定资产原值 1.000 ## 农村居民家庭经营耕地面积## Comp.6## 农业总产值## 林业总产值## 牧业总产值## 渔业总产值## 农村居民家庭拥有生产性固定资产原值## 农村居民家庭经营耕地面积 1.000#### Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6## SS loadings 1.000 1.000 1.000 1.000 1.000 1.000## Proportion Var 0.167 0.167 0.167 0.167 0.167 0.167## Cumulative Var 0.167 0.333 0.500 0.667 0.833 1.000diag(1/sqrt(diag(cor(x))))%*%eigen(cor(x))$vectors%*%diag(sqrt(eigen(co r(x))$values))# ৕⭞⭞䠅фѱᡆ分的⭞ީ⭞䱫## [,1] [,2] [,3] [,4] [,5]## [1,] 0.8748914 0.33002393 -0.05962134 -0.2919961 0.03333473## [2,] 0.7199843 -0.09695761 0.39747812 0.5280225 0.18691501## [3,] 0.8358325 0.42778470 0.06215717 -0.2657004 0.10009450## [4,] 0.7239860 -0.13749802 -0.54651176 0.3113087 -0.24595467## [5,] -0.4283184 0.72257821 -0.37626680 0.2240839 0.32017966## [6,] -0.1942551 0.86197649 0.26492953 0.1648656 -0.34904716## [,6]## [1,] 0.189001599## [2,] 0.022088666## [3,] -0.184133750## [4,] -0.029268951## [5,] 0.010900009## [6,] 0.007698218print(-loadings(PCA),cutoff=0.001)#### Loadings:## Comp.1 Comp.2 Comp.3 Comp.4 Comp. 5## 农业总产值 0.019 -0.847 0.041 -0.529 0.027 ## 林业总产值 0.003 -0.026 0.036 0.096 0.994 ## 牧业总产值 0.007 -0.510 -0.340 0.786 -0.077 ## 渔业总产值 0.008 -0.147 0.939 0.304 -0.068 ## 农村居民家庭拥有生产性固定资产原值 -1.000 -0.021 0.006 -0.002 0.002 ## 农村居民家庭经营耕地面积 -0.003 0.003 ## Comp.6## 农业总产值## 林业总产值 0.003## 牧业总产值 0.001## 渔业总产值 -0.002## 农村居民家庭拥有生产性固定资产原值## 农村居民家庭经营耕地面积 -1.000#### Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6## SS loadings 1.000 1.000 1.000 1.000 1.000 1.000## Proportion Var 0.167 0.167 0.167 0.167 0.167 0.167## Cumulative Var 0.167 0.333 0.500 0.667 0.833 1.000####################################################################### ##### 条形图####################################################################### country<-mydata$地区percent<-mydata$农业总产值d<-data.frame(country,percent)# png("d:\\test2.png",width=2048,height=2048)f<-function(name,value) {xsize=200plot(0, 0,xlab="",ylab="",axes=FALSE,xlim=c(-xsize,xsize),ylim=c(-xsize,xsize))for(i in 1:length(name)){info =name[i]percent =value[i]k =(1:(360*percent/100)*10)/10r=xsize*(length(name)-i+1)/length(name)#print(r)x=r*sin(k/180*pi)y=r*cos(k/180*pi)text(-18,r,info,pos=2,cex=0.7)text(-9,r,paste(percent,"%"),cex=0.7)lines(x,y,col="red")}}f(country,percent)####################################################################### ###### 柱状图####################################################################### library(RColorBrewer)pv<-percentid<-countrycol<-c(brewer.pal(9, "YlOrRd")[1:9],brewer.pal(9, "Blues")[1:9]) barplot(pv,col=col,horiz =TRUE,xlim=c(-8000.00,5000))title(main=list("农业总产值",cex=2),sub="",ylab="地区")text(y=seq(from=0.7,length.out=31,by=1.2),x=-450.00,labels=id)legend("topleft",legend=rev(id),pch=10,col=rev(col),ncol=2)。

细菌完成图

细菌完成图

可选策略
500-6kb
用于验证
华大与竞争对手的整体比较
测序覆盖度 组装指标 数据质量指标 覆盖度指标 solexa 454 sanger contig QC指标 验证 单位名称 特征
基因组覆盖度
完整全基因组 序列,无片段 结构性 基因区覆 单碱基 reads利 错拼和遗漏 验证通 盖度 错误率 用率 过率
50bp
<8M 美吉 8~15M >15M 100X 不承诺bp
350bp
1-3个月 用于搭框架 不承诺X&bp 用于补 洞 >5 未承诺 未承诺 未承诺 未承诺 未承诺 不包含 30
3-6个月
40-60个工作日
BGI <10M 200X 1 100% 100% >=99% >=99.95 >=99% % (包含2轮PCR) 12-20 或另用OM
用于验证
华大与竞争对手的整体比较
测序覆盖度 组装指标 数据质量指标 覆盖度指标 solexa 454 sanger contig QC指标 验证 单位名称 特征
基因组覆盖度
完整全基因组 序列,无片段 结构性 基因区覆 单碱基 reads利 错拼和遗漏 验证通 盖度 错误率 用率 过率
价格(万元)
—— 天芯 正常GC 80X 10-20X 1-2个月 <100 95% 98% —— <十万 分之一 —— —— 16-18
信息分析内容


在细菌精细图分析内容的基础上,充分考虑客户 提出的各种个性化分析需求。 工作日、价格均与细菌精细图一致。
技术方法
华大自己开发出来的针对细菌完成图的整套解决方 案: 1、M级组装——得到一条scaffold(一个骨架环)

技术贴R语言物种组成分析和绘图

技术贴R语言物种组成分析和绘图

技术贴R语言物种组成分析和绘图本文由阿童木根据实践经验而整理,希望对大家有帮助。

原创微文,欢迎转发转载。

导读宏基因组分析分为物种分析和功能分析两大块。

物种组成分析是物种分析中最基本最常见的分析方法。

利用R语言堆叠图,我们可以将一个项目中所有样品的物种组成展示出来。

下面介绍如何利用R语言进行物种组成分析和可视化。

过程分为以下几步:1)模拟丰度矩阵;2)模拟分组;3)标准化丰度;4)调整格式;5)ggplot2绘制堆叠图;6)ggplot2绘制堆叠面积图。

完成以上步骤将得到如下结果:# 1 模拟丰度矩阵set.seed(1995) #随机种子data=matrix(abs(round(rnorm(200, mean=1000, sd=500))), 20, 10) #随机正整数,20行,20列colnames(data)=paste("Species", 1:10, sep=".") #列名rownames(data)=paste("Sample", 1:20, sep=".") #行名#得到样品物种丰度矩阵,如下:# 2 模拟分组group=c("A", "A", "A", "A", "A", "A", "A", "A", "A", "A", "B", "B", "B", "B", "B", "B", "B", "B", "B", "B")sample_id=rownames(data)data_group=data.frame(sample_id, group)#得到分组文件,如下:# 3 标准化丰度data_norm=datafor(i in 1:20){sample_sum=apply(data, 1, sum)#统计每个样品的总细菌数量for(j in 1:10){data_norm[i,j]=data[i,j]/sample_sum[i]#将每个样品的总细菌数量控制为1}}# 4 调整格式library(reshape2)#加载用于处理数据格式的reshape2包Taxonomy=colnames(data)#从data矩阵中提取物种分类信息data_frame=data.frame(t(data_norm), Taxonomy)#新建数据框data_frame=melt(data_frame, id='Taxonomy')#根据Taxonomy和Sample将所有丰度竖着排列names(data_frame)[2]='sample_id'#重命名variable为sample_id,保持与data_group的样品变量名一致data_frame=merge(data_frame, data_group, by='sample_id')#根据样品变量名,给data_frame添加分组信息,如下:# 5 ggplot2绘制堆叠图library(ggplot2)stack_plot=ggplot(data_frame, aes(sample_id, fill=Taxonomy, value*100))+ #数据输入:样本、物种、丰度geom_col(position='stack') +# stack:堆叠图labs(x='Samples', y='Relative Abundance (%)')+#给xy轴取名scale_y_continuous(expand=c(0, 0))+#调整y轴属性theme(axis.text.x=element_text(angle=45, hjust=1))+# angle:调整横轴标签倾斜角度# hjust:上下移动横轴标签pdf('stack_plot.pdf')stack_plotdev.off()#保存结果,打开stack_plot.pdf,结果如下:# 6 ggplot2绘制堆叠面积图id=rep(1:20, each=10)data_frame=data.frame(data_frame, id)#给每个样品重新编号stack_area_plot=ggplot(data_frame, aes(id, fill=Taxonomy, value*100))+ geom_area() +#堆叠面积图labs(x='Samples', y='Relative Abundance (%)')+scale_x_continuous(breaks=1:20, labels=as.character(1:20), expand=c(0, 0))+ scale_y_continuous(expand=c(0, 0))+#调整x轴刻度和坐标轴属性theme(panel.grid=element_blank(), panel.background=element_rect(color='black', fill='transparent'))#调整背景pdf('stack_area_plot.pdf')stack_area_plotdev.off()#保存结果,打开stack_area_plot.pdf,结果如下:感谢阅读~你可能还喜欢1 技术贴 | 16S专题 | 简单介绍如何用自己的笔记本处理高通量16S数据2 16S测序全新分析流程QIIME2的介绍3 技术贴 | 宏转录组专题 | DDBJ数据库:宏转录组测序数据下载。

(R语言微生物统计)气泡矩阵图(Top_10-Otu相对丰度)

(R语言微生物统计)气泡矩阵图(Top_10-Otu相对丰度)

Top_10 Otu相对丰度R Markdown统计分析在各样本中相对丰度为前10的微生物种群并作出气泡矩阵图#读取数据phylum <-read.delim('Otu.txt', s =1, sep ='\t', stringsAsFac tors =FALSE, s =FALSE)#求各类群的门丰度总和,并排序phylum$sum <-rowSums(phylum)phylum <-phylum[order(phylum$sum, decreasing =TRUE), ]#挑选 top10 Otu类群phylum_top10 <-phylum[1:10, -ncol(phylum)]library(reshape2)#表格样式重排,借助 reshape2 包 melt() 实现phylum_top10$Otu <-factor(rownames(phylum_top10), levels =rev(rowname s(phylum_top10)))phylum_top10 <-melt(phylum_top10, id ='Otu')names(phylum_top10)[2] <- 'sample'#write.csv(phylum_top10, 'phylum_top10.csv', quote = FALSE)data_melt <-phylum_top10Including Plots绘制气泡矩阵图并保存本地为“Otu_Bubble Matrix.png”根据图例显示:Otu00002在YC岛的部分样本中相对丰度较高,出现占据绝对优势的情况。

Spw、SE岛的样品中Top10微生物种群的分布较为平均,没有明显的优势种群。

微生物群落组装过程 r语言

微生物群落组装过程 r语言

微生物群落组装过程 r语言微生物群落组装是指不同微生物个体在特定环境中相互作用并形成群落的过程。

R语言是一种功能强大的统计分析和可视化工具,可以用于微生物群落组装的研究。

以下是使用R语言进行微生物群落组装分析的一般步骤:1. 数据准备:将微生物群落数据整理成适合R语言处理的格式。

常见的数据格式包括OTU表(含有不同样本中各个OTU的丰度信息)和环境因子表(包含与微生物群落组成相关的环境因子数据)。

2. 数据预处理:根据需要对数据进行预处理,如去除低丰度的OTU、归一化样本间的差异等。

这可以使用R中的统计分析包进行操作,例如"vegan"、"phyloseq"等。

3. 多样性分析:使用R中的多样性分析包,如"vegan"和"phyloseq",计算微生物群落的Alpha多样性(单样本内的物种多样性)和Beta多样性(样本间的物种多样性)。

4. 群落结构分析:使用R中的群落结构分析包,如"vegan"和"ade4",可以进行聚类分析、主坐标分析(PCoA)等,以揭示样本间的群落结构差异。

5. 群落组装模型:使用R中的群落组装模型包,如"DESeq2"、"LEfSe"等,可以进行微生物群落组装的相关统计分析,并鉴定与环境因子显著相关的OTU或菌群。

6. 可视化:使用R中的可视化包,如"ggplot2"和"phyloseq",绘制各种统计图表,如柱状图、热图、PCoA图等,以展示微生物群落的组成和结构。

需要注意的是,微生物群落组装是一个复杂的过程,涉及到多个环境因子和微生物个体之间的相互作用。

正确的数据处理和分析方法对于结果的解释和解读至关重要。

因此,在使用R语言进行微生物群落组装研究时,建议参考相关文献和专业指导,确保分析方法的准确性和可靠性。

R语言多维数据层次聚类散点图矩阵、配对图、平行坐标图、树状图可视化城市宏观经济指标数据

R语言多维数据层次聚类散点图矩阵、配对图、平行坐标图、树状图可视化城市宏观经济指标数据

R语言多维数据层次聚类散点图矩阵、配对图、平行坐标图、树状图可视化城市宏观经济指标数据
原文链接:/?p=24511
本文通过一些指数对散点图矩阵和平行坐标显示中的面板进行排序,并根据其数值水平对面板进行着色。

显示相关矩阵
cor <- cor(ley)
leclr <- mat.colr(cor)
mtcolr根据相关性大小为相关性分配三种颜色。

高相关性为红色,中间三分之一为蓝色,底部三分之一为天蓝色。

plclrs(lolr,label=ronms(coor)
如果要更改配色方案:
leolo <- colr(cor, brak=FALE)
lecor <- tcor(cor, bes,
c.cr(4))
如果在绘图之前重新排列变量,则绘图更容易解释。

oge <- rdclust(lnlcor)
lgeolor1 <- nlclor\[lne.,lo.\]
plot(lnco1,dlbls=rwe(ngyr1))
显示带有彩色面板的配对图
所有高相关面板一起出现在一个块中的一个版本。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Top_10 Phylum abundance table
R Markdown
统计otu丰度表中各样本所含微生物所属的门;并挑选在各样本中丰度为前十的门进行统计分析,做出样本前10个门的相对水平丰度图进一步分析。

#读取数据
phylum <-read.delim('phylum_table.txt', s =1, sep ='\t', str ingsAsFactors =FALSE, s =FALSE)
#求各类群的门丰度总和,并排序
phylum$sum <-rowSums(phylum)
phylum <-phylum[order(phylum$sum, decreasing =TRUE), ]
#挑选 top10 门类群,并将 top10 外的类群合并为“Others”
phylum_top10 <-phylum[1:10, -ncol(phylum)]
phylum_top10['Others', ] <-100-colSums(phylum_top10)
library(reshape2)
#表格样式重排,借助 reshape2 包 melt() 实现
phylum_top10$Phylum <-factor(rownames(phylum_top10), levels =rev(rown ames(phylum_top10)))
phylum_top10 <-melt(phylum_top10, id ='Phylum')
names(phylum_top10)[2] <- 'sample'
Including Plots
根据丰度前10的门水平丰富图显示,变形菌门、厚壁菌门、梭菌属的微生物在所有样品中的丰度是占据前三的,其中蓝藻细菌、放线菌在来自SpW海岛的样品中其丰度要高于其余五个海岛样品中的丰度。

相关文档
最新文档