R语言上机实验

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

一、数据可视化

1.对于iris数据，用每类花（iris$Speciees）的样本数作为高度，制作条形图。

2.用每类花的Sepal.Length、Sepal.Width、Petal.Length、Petal.Width的平均值分别制作条形图，四图同显。

3.分别制作Sepal.Length、Sepal.Width、Petal.Length、Petal.Width的直方图（用密度值做代表，设置prob=T）,添加拟合的密度曲线，四图同显。

二、中国地图：

（Note：首先从网上下载GIS数据，解压到GIS_data目录。

/wp-content/uploads/2009/07/chinaprovinceborderdata _tar_gz.zip）

setwd('F:/GIS_data') ### 设置工作目录

install.packages('maptools');

library(maptools)

china<- readShapePoly('bou2_4p.shp') ### 获得各省的边界信息

plot(china)

>> names(map_data)

[1] "AREA" "PERIMETER" "BOU2_4M_" "BOU2_4M_ID" "ADCODE93"

[6] "ADCODE99" "NAME"

可以看出map_data中有7列，对应的字段名如上面显示。

>> map_data$AREA #925个区域单元的面积

>> map_data$PERIMETER #925个区域单元的周长

>> map_data$BOU2_4M_ #没有重复的数字，2~926，可作为区域单元ID

>> map_data$BOU2_4M_ID #有重复数字，特定情况下可作为区域单元ID

>> map_data$ADCODE93 #93版ADCODE地理编码

>> map_data$ADCODE93 #99版ADCODE地理编码

>> map_data$NAME #各区域单元所隶属的省级行政单元的名称

>> unique(map_data$NAME) #查看各区域的名称是什么文本

[1] 黑龙江省内蒙古自治区新疆维吾尔自治区吉林省

[5] 辽宁省甘肃省河北省北京市

[9] 山西省天津市陕西省宁夏回族自治区[13] 青海省山东省西藏自治区河南省

[17] 江苏省安徽省四川省湖北省

[21] 重庆市上海市浙江省湖南省

[25] 江西省云南省贵州省福建省

[29] 广西壮族自治区台湾省广东省香港特别行政区

[33] 海南省

33 Levels: 安徽省北京市福建省甘肃省广东省广西壮族自治区 ...重庆市

provname=c("北京市","天津市","河北省","山西省","内蒙古自治区", "辽宁省","吉林省","黑龙江省","上海市","江苏省", "浙江省","安徽省","福建省","江西省","山东省", "河南省","湖北省","湖南省","广东省","广西壮族自治区","海南省","重庆市","四川省","贵州省", "云南省","西藏自治区","陕西省","甘肃省","青海省","宁夏回族自治区","新疆维吾尔自治区","台湾省", "香港特别行政区") ###省份向量

pop=c(1633,1115,6943,3393,2405,4298,2730,3824,1858,7625,5060,6118,3581 ,4368,9367,9360,5699,6355,9449,4768,845,2816,8127,3762,4514,284,3748,26 17,552,610,2095,2296,693) ###各省人口向量

根据各省人口数量给地图着色。

三、使用R语言的包Rwordseg和jiebaR 、wordcloud、tm对《2018年政府工作报告》画词云图。

2018年政府工作报告：

/18/0305/11/DC4MLN6100259A8F.html

test<-readLines('doc.txt')

seg<-worker()seg<=text

seg2<-worker("tag")

seg3<-worker(type="keywords",topn=3)

seg3<=text

for(i in text){a<-seg3<=i;print(a)}

text1<-gsub('[a-zA-Z]','',text) #去除所有英文字母

text2<-gsub("[的|和|了|来|与|到|由|等|从|以|一|为|在|上|各|去|对|侧|多|并|千|万|年|更|向|这是]","",text1)

seg<-worker()

seg<=text2

freq<-freq(segment(text2,seg))

index <- order(-freq[,2])

order2<-freq[index,]

install.packages("wordcloud2")

library(wordcloud2)

wordcloud2(order2,size = 1,minRotation = -pi/3, maxRotation = pi/3,rotateRatio = 0.8,fontFamily = "微软雅黑", color = "random-light")

实验报告电子版发送邮箱：******************

实验报告名称：班级-学号-姓名-实验二