(完整版)Titanic数据集分析

(完整版)Titanic数据集分析
(完整版)Titanic数据集分析

泰坦尼克数据集探索

1.简介:

从泰塔尼克数据集中,根据每个乘客的信息,建立模型并进行预测。

整篇文章分为三步:

1.特征选择

2.缺失数据处理

3.预测

1.1导入软件包并检查数据

> library('ggplot2') # 可视化

> library('ggthemes') # 可视化

> library('scales') # 可视化

> library('dplyr') # 数据处理

> library('mice') # 填充缺失数据

> library('randomForest') # 分类算法

> #数据的导入

> setwd('D:/Titanic')#设置默认功过路径

> train <- read.csv('train.csv',stringsAsFactors= FALSE)#训

练集

> test <- read.csv('test.csv',stringsAsFactors= FALSE)#测试集

#进行数据拼接,一同进行特征选择和缺失数据处理

> full <- bind_rows(train, test) # bind training & test data > # check data

> str(full)

我们观察到一共有1309条数据,每一条数据有12个相关变量。

2.特征工程

头衔

># 从名称中挖掘

> # 从乘客名字中提取头衔

> #R中的grep、grepl、sub、gsub、regexpr、gregexpr等函数都使用正则表达式的规则进行匹配。默认是egrep的规则,sub函数只实现第一个位置的替换,gsub函数实现全局的替换。

> full$Title <- gsub('(.*, )|(\\..*)', '', full$Name)

>

> # 查看按照性别划分的头衔数量

> table(full$Sex, full$Title)

我们发现头衔的类别太多,并且好多出现的频次是很低的,我们可以将这些类别进行合并

> rare_title <- c('Dona', 'Lady', 'the Countess','Capt', 'Col', 'Don',

+ 'Dr', 'Major', 'Rev', 'Sir', 'Jonkheer')# 合并低频头衔为一类

> # 重命名称呼

> full$Title[full$Title == 'Mlle'] <- 'Miss'

> full$Title[full$Title == 'Ms'] <- 'Miss'

> full$Title[full$Title == 'Mme'] <- 'Mrs'

> full$Title[full$Title %in% rare_title] <- 'Rare Title'

>

> # 再次查看按照性别划分的头衔数量

> table(full$Sex, full$Title)

可以看到头衔的个数得到了大量的缩减

> #sapply()函数:根据传入参数规则重新构建一个合理的数据类型返回

> full$Surname <- sapply(full$Name,

+ function(x) strsplit(x, split = '[,.]')[[1]][1])

家庭人数

既然我们已经根据乘客的名字划分成一些新的变量,我们可以把它进一步做一些新的家庭变量。首先我们要做一个基于兄弟姐妹/配

偶数量(s)和儿童/父母数量的家庭规模变量。

> # Create a family size variable including the passenger themselves

> full$Fsize <- full$SibSp + full$Parch + 1

>

> # Create a family variable

> full$Family <- paste(full$Surname, full$Fsize, sep='_')

> #为了直观显示,我们可以用ggplot2 画出家庭成员数量和生存家庭数情况的图形

> ggplot(full[1:891,], aes(x = Fsize, fill = factor(Survived))) +

+ geom_bar(stat='count', position='dodge') +

+ scale_x_continuous(breaks=c(1:11)) +

+ labs(x = 'Family Size') +

+ theme_few()

> full$FsizeD[full$Fsize == 1] <- 'singleton'

> full$FsizeD[full$Fsize < 5 & full$Fsize > 1] <- 'small' > full$FsizeD[full$Fsize > 4] <- 'large'

> # Show family size by survival using a mosaic plot > mosaicplot(table(full$FsizeD, full$Survived), main='Family Size

Survival',

shade=TRUE)

<-4-4:-2-2:00:2

2:4>4

尝试创建一些新的特征

> # This variable appears to have a lot of missing values

> full$Cabin[1:28]

> # Create a Deck variable. Get passenger deck A - F:

> full$Deck<-factor(sapply(full$Cabin, function(x) strsplit(x, NULL)[[1]][1]))

还有更多可能的变量在这里完成,比如在乘客客舱变量passenger cabin 也存在一些有价值的信息如客舱层数 deck,但是这个变量的缺失值太多,无法做出新的有效的变量,暂时放弃这个变量的挖掘。

3. 缺失数据的处理

观察文件中的数据,我们会发现有些乘客的信息参数并不完整,由于所给的数据集并不大,我们不能通过删除一行或者一列来处理缺失值,因而对于我们关注的一些字段参数,我们需要根据统计学的描述数据(平均值、中位数等等)来合理给出缺失值。我们可以通过函数查看缺失数据的变量在第几条数据出现缺失和总共缺失的个数。

我们将根据我们想象可能相关的现有数据,推测他们的登机价值:乘客等级和票价。我们看到他们分别支付了80美元和$ NA,他们的班级是1和NA。那么他们从哪里开始呢?

> # Use ggplot2 to visualize embarkment, passenger class, & median fare

> ggplot(embark_fare, aes(x = Embarked, y = Fare, fill = factor(Pclass))) +

+ geom_boxplot() +

+ geom_hline(aes(yintercept=80),

+ colour='red', linetype='dashed', lwd=2) +

+ scale_y_continuous(labels=dollar_format()) +

+ theme_few()

可以看到出发的一级乘客的中位票价与我们的登机手续费乘

客支付的80美元相当。

我们接近在这里和那里确定了几个缺失值的位置。 1044行上的乘客的票价是缺失值。

> # Since their fare was $80 for 1st class, they most likely embarked from 'C'

> full$Embarked[c(62, 830)] <- 'C'

> # Show row 1044

> full[1044, ]

这是从南安普敦('S')出发的三级乘客。让所有其他人分享他们的班级和登机牌(n = 494)可视化票价。

> ggplot(full[full$Pclass == '3' & full$Embarked == 'S', ], + aes(x = Fare)) +

+ geom_density(fill = '#99d6ff', alpha=0.4) +

+ geom_vline(aes(xintercept=median(Fare, na.rm=T)),

+ colour='red', linetype='dashed', lwd=1) +

+ scale_x_continuous(labels=dollar_format()) +

+ theme_few()

从这个可视化的角度来看,将NA票价值替换为上课时间为8.05美元的中位数似乎是相当合理的。

> # Replace missing fare value with median fare for class/embarkment

> full$Fare[1044] <- median(full[full$Pclass == '3' & full$Embarked == 'S', ]$Fare, na.rm = TRUE)

插补

我们可以使用rpart(递归分区回归)来预测缺少的年龄,但是我将使用MICE来完成这个任务,只是为了不同的东西。您可以在这里阅读更多关于使用链接方程的多重插补(PDF)。由于我们还没有完成,我将首先对因子变量进行因子分解,然后使用mice插补。

> # Show number of missing Age values

> sum(is.na(full$Age))

> # Make variables factors into factors

> factor_vars <- c('PassengerId','Pclass','Sex','Embarked', + 'Title','Surname','Family','FsizeD')

>

> full[factor_vars] <- lapply(full[factor_vars], function(x) as.factor(x))

>

> # Set a random seed

> set.seed(129)

>

> # Perform mice imputation, excluding certain less-than-useful variables:

> mice_mod <- mice(full[, !names(full) %in% c('PassengerId','Name','Ticket','Cabin','Family','Surname', 'Survived')], method='rf')

> # Save the complete output

> mice_output <- complete(mice_mod)

为保证结果没有失真,我们将比较我们得到的结果与原始的乘客年龄分布。

> # Plot age distributions

> par(mfrow=c(1,2))

> hist(full$Age, freq=F, main='Age: Original Data',

+ col='darkgreen', ylim=c(0,0.04))

> hist(mice_output$Age, freq=F, main='Age: MICE Output', + col='lightgreen', ylim=c(0,0.04))

> # Show new number of missing Age values

> sum(is.na(full$Age))

第二次特征工程

现在我们知道每个人的年龄,我们可以创造几个新的年龄变量:儿童和母亲。一个孩子只会是18岁以下的人,母亲是1)女性

2)18岁以上

3)有超过0个孩子

4)没有头衔 'Miss'

> # First we'll look at the relationship between age & survival > ggplot(full[1:891,], aes(Age, fill = factor(Survived))) + + geom_histogram() +

+ # I include Sex since we know (a priori) it's a significant predictor

+ facet_grid(.~Sex) +

+ theme_few()

> # Create the column child, and indicate whether child or adult > full$Child[full$Age < 18] <- 'Child'

> full$Child[full$Age >= 18] <- 'Adult'

>

> # Show counts

> table(full$Child, full$Survived)

> # Adding Mother variable

> full$Mother <- 'Not Mother'

> full$Mother[full$Sex == 'female' & full$Parch > 0 & full$Age > 18 & full$Title != 'Miss'] <- 'Mother'

>

> # Show counts

> table(full$Mother, full$Survived)

> # Finish by factorizing our two new factor variables

> full$Child <- factor(full$Child)

> full$Mother <- factor(full$Mother)

> md.pattern(full)

预测

最后,我们准备根据我们精心策划和处理缺失值的变量,预测在泰坦尼克号的乘客中谁能幸存下来。为此,我们将依靠随机森林分类算法; 毕竟,我们花了所有的时间来进行数据处理。

拆分测试与训练

> # Split the data back into a train set and a test set

> train <- full[1:891,]

> test <- full[892:1309,]

建模

> # Set a random seed

> set.seed(754)

>

> # Build the model (note: not all possible variables are used) > rf_model <- randomForest(factor(Survived) ~ Pclass + Sex + Age + SibSp + Parch +

+ Fare + Embarked + Title +

+ FsizeD + Child + Mother,

+ data = train) > # Show model error

> plot(rf_model, ylim=c(0,0.36))

> legend('topright', colnames(rf_model$err.rate), col=1:3, fill=1:3)

黑线显示总体错误率低于20%。红线和绿线分别显示“死亡”和“幸存”的错误率。我们可以看到,现在我们比预测死亡更成功,

而不是生存。

变量重要性

> # Get importance

> importance <- importance(rf_model)

> varImportance <- data.frame(Variables = https://www.360docs.net/doc/574210860.html,s(importance),

+ Importance = round(importance[ ,'MeanDecreaseGini'],2))

>

> # Create a rank variable based on importance

> rankImportance <- varImportance %>%

+ mutate(Rank = paste0('#',dense_rank(desc(Importance)))) >

> # Use ggplot2 to visualize the relative importance of variables

> ggplot(rankImportance, aes(x = reorder(Variables, Importance),

+ y = Importance, fill = Importance)) +

+ geom_bar(stat='identity') +

+ geom_text(aes(x = Variables, y = 0.5, label = Rank),

+ hjust=0, vjust=0.55, size = 4, colour = 'red') +

+ labs(x = 'Variables') +

+ coord_flip() +

+ theme_few()

我们发现,头衔称号和船票价格及性别年龄对生存率的影响比较大,我们刚刚认为的小孩、老人和是否为母亲这几个特征应该有很大的生存几率,但是结果并不是这样,现实还是比较残酷!

泰坦尼克号英文版简介(优选.)

最新文件---------------- 仅供参考--------------------已改成-----------word文本 --------------------- 方便更改 赠人玫瑰,手留余香。 Titanic directed by James Cameron presents a love story. On April 10,1912,know as the “miracle on the industrial history”,the Titanic voyage from th e United Kingdom to the United States.A rich girl called Rose got onto the ship with her mother and her fiancé Carl,Rose was asked to marry Carl because of her family,but Rose,from the bottom of her heart,was unwilling to marry such a aloof,arrogance and selfish businessman,she felt so hopeless that she decided to make suicide by jumping off the deck,but,just then,Jack appeared,Jack was a poor artist,he even got his ticket by winning a pocker game with his friend.Of cause,Rose was rescued by Jack,and after that,the two young often talk to each other,and soon they fall in love with each other,but,Rose’mother was very angry and againsted them strongly,one night,the two young stood on the top of the ship ,enjoying the freedom and the beautiful sea view,that was really beautiful,but soon,the ship hit an iceburg and the big wonderful ship would sunk totally within only a few hours,Rose told this news to her mother and Carl,but in the other side,Carl ordered someone to lock Jack in a small

探险故事-泰坦尼克号船长“鬼屋”惊魂之谜

探险故事-泰坦尼克号船长“鬼屋”惊魂之谜 据英国《每日邮报》2012年4月报道,英国一对夫妇希望在泰坦尼克号沉没100周年纪念日来临之际,能够将泰坦尼克号船长爱德华?约翰?史密斯的房屋卖掉,因为他们实在不堪忍受“船长鬼魂”的折磨。在出租这栋住宅的10年中,这里发生了许多“见鬼”的灵异事件。5年前,这栋房屋的厨房甚至突然被水淹,就像泰坦尼克号当年沉船时的景象。层出不穷的怪异事件,吸引了大批科学家对此超自然现象展开调查,他们能将“鬼屋”惊魂之谜解开吗? 船长魅影现古宅 泰坦尼克号的船长爱德华?约翰?史密斯出生于英国斯塔福德郡的特伦特河畔斯 托克市。他的父亲是一个窑匠。1841年,史密斯就出生在一套两室一厅的公寓里,直到他13岁才前往利物浦开始他的航海生涯。尽管父母去世后一直空着,他还时不时趁出海归来时回去住上几天。 史密斯先在吉普森公司所拥有的“韦伯参议员号”上当学徒,后来成为了白星航运公司的海军准将。由于英国的上流社会通常会要求他当他们搭乘的客轮的船长,史密斯被称为“百万富翁的船长”。而在英国的上流社会,珞士伯爵夫人与史密斯来往甚密,交情很好。 1912年4月15日,史密斯随他指挥的泰坦尼克号一起沉没于北大西洋海底。这是一场旷世罕见的劫难,在航海史上酿成一起死亡、失踪达1500多人的特大悲剧。 当时,史密斯船长果断下令:“妇女儿童优先上救生艇。”因此,同行的珞士伯爵夫人获救。为了报答史密斯船长的“救命之恩”,伯爵夫人要求她的后人,每年的4月15日都必须到史密斯船长曾居住过的英国斯塔福德郡的这栋公寓举行祭祀活动,以祷告那些在海难中失去生命的亡灵。当然,也是寄托对史密斯船长的一份哀思。 时间一晃到了2002年7月,史密斯船长的古宅几经转手之后,被自由作家尼尔和妻子路易斯?博纳以花3.5万英镑(约合35万元人民币)的价格买下了。尼尔夫妇正想找一栋安静的公寓进行创作,于是不再愿意接受珞士伯爵夫人后人的祭祀

spss的数据分析案例精选文档

s p s s的数据分析案例 精选文档 TTMS system office room 【TTMS16H-TTMS2A-TTMS8Q8-

关于某公司474名职工综合状况的统计分析报告一、数据介绍: 本次分析的数据为某公司474名职工状况统计表,其中共包含十一变量,分别是:id(职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度),jobcat(职务等级),salbegin (起始工资),salary(现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、以了解该公司职工上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分 析能够了解变量的取值状况,对把握数据的分布特征非常有用。 此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu(受教育水平程度)、不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。 Statistics 首先,对该公司的男女性别分布进行频数分析,结果如下:

上表说明,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为%和%,该公司职工男女数量差距不大,男性略多于女性。 其次对原有数据中的受教育程度进行频数分析,结果如下表: Educational Level (years)

16 59 17 11 18 9 19 27 20 2 .4 .4 21 1 .2 .2 Tot al 474 上 表及其直方图说明,被调查的474名职工中,受过12年教育的职工是该组频数最高的,为190人,占总人数的%,其次为15年,共有116人,占中人数的%。且接受过高于20年的教育的人数只有1人,比例很低。 2、 描述统计分析。再通过简单的频数统计分析了解了职工在性别和受教育水平上的总体分布状况后,我们还需要对数据中的其他变量特征有更为精确的认识,这就需要通过计算基本描述统计的方法来实现。下面就对各个变量进行描述统计分析,得到它们的

浅谈电影《的泰坦尼克号》的美学意义

浅谈电影《泰坦尼克号》的美学意义 被誉为二十世纪电影艺术“终结者”的《泰坦尼克号》,在人们心中无疑是一个神话般的存在,不管是影片中再现的浓烈的海难氛围,还是表现的富有传奇色彩的浪漫爱情预言,都给观众强烈的感官刺激,最终衍化为观众心中强烈的美感,可以说,《泰坦尼克号》是卡梅隆大师送给全球观众的一场视觉盛宴。 一、社会美中内容与形式之美的有机结合 社会美是现实生活中美的存在形式之一,主要包括人物、事件、场景等等,所谓“事件”、“场景”也是以人物活动为中心。社会美是人的自由创造的体现,倡导的是积极肯定的生活形象。围绕社会美的实质,我们就需要结合影片中的人物加以分析。在《泰坦尼克号》这部影片中,社会美的一个方面——形式美在故事一开始就抓住了观众的眼球:泰坦尼克号上的男士都是穿着优雅、干净的礼服,女士都穿着坠地长裙,紧身的胸衣,还带着蝴蝶结、领带、帽子等,无不透露出电影人物的外表特点:气质高雅、身份尊贵、有着良好的教养。 这些二十年代欧洲古典服饰,给大众化休闲服饰流行的二十世纪末的观众带来强烈的美感。除去人物服饰,影片中的主人公是青春靓丽的俊男美女,男主角莱昂纳多&iddot;迪卡普尼奥年轻英俊、充满朝气,女主角凯特·温丝莱特容貌美丽、气质优雅都令观众为之深深迷恋,“明星的体貌、气质、性格,无不与观众心目中早已潜在希求的美好形象异质同构”[1]。 除去人物所带给观众的形式上的美感,人物的性格、精神风貌、品质等等内在特质也给观众带来独特的内容美。人的美不能只以外表来看,是和人的本质紧密联系在一起的,人的珍贵特性在于自由创造,在创造的过程中体现出人的聪明、质朴、勇敢、诚实等,因此人的美不等于长相漂亮,说某人长相漂亮只是从形式方面来看的,一个人的美应该是和人的内在品质紧密联系的。[2]影片中的男主角是一名流浪艺术家,虽然穷困,但是活泼聪明而乐观向上,对待爱情也坚贞不渝,为了自己心爱的人,可以舍弃一切哪怕是生命。女主角是一名贵族小姐,有美丽的容貌和良好的教养,但却是一个具有反叛思想的贵族小姐,她勇敢、坚强而执着地看待自己这段跨越阶级局限的爱情。影片中的主人公内心美好的特质为主人公赢得了更多观众的喜爱,在观众看来,他们就好像美丽的化身,一举一动,一颦一笑都散发无尽的魅力。重视影片中社会美中内容与形式的统一,是当时乃至今天观众的审美要求。 二、爱情与死亡冲撞之下的悲剧之美 《泰坦尼克号》这部影片的结局是在爱情和死亡冲撞融合之后的升华。一直以来,死亡与爱情都是人类表现的两大主题,也是艺术创作反复演绎的永恒主题。[3]《泰坦尼克号》所讲述的灾难是一个真实的历史事件,导演卡梅隆在这个真实的历史悲剧中融入了自己的感受, “使虚构的爱情故事与那艘梦幻之船的死亡之通过一个极其浪漫的爱情故事来展示历史真实。 旅巧妙而有机地联系在一起,从而使爱情获得了合理的根据与真实性内涵。”[4]这艘号称永不沉没之船的“TITANIC”豪华巨轮,从它载着欢乐的人们开 始航行的那一刻起,也就一步步地走向死亡。灾难为浪漫爱情悲剧结局提供了契机,同时也升华了男女主人公的爱情,爱情获得了永恒。从这个角度来看,影片冲突了传统灾难片的模式,演绎出感人至深的不朽的爱情传奇。 美学中对悲剧这样表述:“悲剧是崇高的集中形态,是一种崇高的美。”[5]影片中,在生存或是死亡面前,人性的本真得以充分暴露,深沉复杂的人性内涵得以充分显现,影片的结尾部分在批判人类劣根性的同时,更表现了人类美好的本性及崇高的牺牲精神。从男主角那句著名的“You jump,I jump!(你跳,我也跳!)”,到水满船舱时依然躺在床上相互依偎着的老夫妇,以及誓死捍卫“只许妇女儿童下船逃生”这一道德律令的水手……这一些小小的细节,触及了观众内心最柔软的部分,令观众在为灾难哀叹的同时也看到了人性的魅力。 悲剧能够给人一种特殊的审美感情,就是在审美愉悦中产生一种痛苦之感,并使心灵受

泰坦尼克号经典片段音乐分析

泰坦尼克号经典片段音乐分析 杨煜 B061003019 泰坦尼克号音乐由詹姆斯·霍纳创作,皇家苏格兰国家交响乐团演奏。这段经典的片段中的配乐就是电影的主题曲,稍稍改变了女声的主旋律已达到和电影主题遥相呼应。当女主角出现在男主角背后时,音乐由钢琴较慢的分解和弦开始缓缓进入,富有流动性的开始。之后由Flute演奏旋律很自然的带入了女声。女声采用诗班唱法,钢琴和竖琴交织在一起伴奏。之后慢慢推向高潮,管弦乐队由弦乐组开始进入。女声诗班慢慢减弱,乐队合奏。最后在女声诗班交替到Flute时缓缓淡出。 这段音乐情绪美好,而又带点淡淡的忧伤。旋律上全曲始终贯穿着主题动机,歌唱性的旋律气息悠长,以极进为主,大跳之后极进的长气息的下行使得旋律更为优美。节奏上四平节奏律动结合二分长音,大符点的节奏使得气息悠长舒缓。织体上开始的第一段采用了钢琴和竖琴伴奏,以柱式和弦和分解和弦为主的伴奏织体。后段管弦乐队进入,主要是弦乐组进入伴奏,整个乐队演奏和声长音,第一小提穿插着演奏主旋律。在最开始处先由钢琴较为缓慢的分解和弦,和弦变化不多,分解速度也不快,在竖琴进入之后分解速度逐渐加快,和弦变化增多,加大了声部的丰满度。在调式调性上以主调和弦为主经过了多次转调有最开始的主调E大调上传到了平行小调c小调上,然后又转到f小调,最后回归主调E大调上。使乐曲整体优美婉转。 这段经典片段在音乐和镜头的衔接上非常完美,女主角出现在船头甲板上,说话的同是音乐声响起,舒缓而清淡。当女主角走向男主角时主旋律由Flute进入,在女主角把手递给男主角的一瞬间女声诗班刚好进入。女主角站在栏杆上慢慢张开双手时,音乐正好在慢慢的推动高潮。当女主角睁开眼睛看向大海时音乐进入小高潮。在远景的全景镜头出现后大乐队开始进入完全的进入高潮。之后慢慢舒缓,女声诗班慢慢淡出,在男女主角接吻时大乐队整体进入高潮。之后很快的随着画面切换慢慢淡出音乐。在全曲中大海海浪的音效一直贯穿其中。不仅起到环境带入的作用,还是乐曲的低频部分,使乐曲的整体音响表现的丰满,柔和。在全曲刚刚进入的时候只有钢琴伴奏,而大海和风的音效却使单独的钢琴伴奏全频段的丰满了起来。使后面管弦乐队的进入变得自然,当大海的音效被大提琴和贝司替代时平滑自然,一切都很顺理成章的进行了过来。 整体音乐音效和画面的完美契合,使得画面和男女主角的情感表现的唯美无比。这种音乐性中强烈的剧情暗示使得这个经典片段变得无可挑剔,画面和音乐的完美契合也是这部电影成功的主要原因之一。

The Titanic英文介绍完整简洁版

The Titanic 泰坦尼克号 When the ship the Titanic was designed for the White Star Shipping Co mpany, everyone was very excited. It was going to be the biggest, the heaviest, most luxurious passenger ship ever! Even its name makes yo u think of great size and strength. ‘Titanic’ means very very stron g and powerful. On 10 April 1912, the Titanic set off on its first voyage across the Atlantic to America. As the Titanic sailed west, warnings of icebergs were sent to the ship, but didn’t reach the bridge. So the Titanic was travelling at almost top speed when it hit an iceberg. It sank tw o hours and forty minutes later. There were 2,223 people on board and 1,517died. On 6 May, 2006, the last survivor to have memories of the Titanic’s sinking, Lillian Gertrud Asplund, died at her home in Mas sachusetts, United States. Asplund, who was just five years old at th e time, lost her father and three brothers in the tragedy. One of the most famous stories is of the band. On 15 April, the Titan ic’s eight-member band, led by Wallace Hartley, had tried to keep pa ssengers calm and upbeat. The band continued playing music even when it became clear that the ship was going to sink. None of the band mem bers survived the sinking. Hartley was considered a hero, and his fun eral in England was attended by thousands. The sinking of the Titanic has been the subject of many books, films and even songs. The 1997 movie Titanic brought the story back again a nd the song in the movie My Heart Will Go On is still very popular to day. Exercises: 1. Choose the correct words to put into the sentence. design sail sink subject His mather is good at ________ beautiful clothes. A football won’t _________. Tom’s childhood memories were one of the ______ of his first film. The ship is _______ to London. 2. Answer the following questions. 1) What does Titanic mean? 2) How many people survived the tragedy? 3) Why was Hartley considered a hero?

spss的数据分析案例

关于某公司474名职工综合状况的统计分析报告 一、数据介绍: 本次分析的数据为某公司474名职工状况统计表,其中共包含十一变量,分别是:id(职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度),jobcat(职务等级),salbegin(起始工资),salary(现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、以了解该公司职工上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分析能够 了解变量的取值状况,对把握数据的分布特征非常有用。此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu(受教育水平程度)、不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。 Statistics 首先,对该公司的男女性别分布进行频数分析,结果如下:

上表说明,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为45.6%和54.4%,该公司职工男女数量差距不大,男性略多于女性。 其次对原有数据中的受教育程度进行频数分析,结果如下表: Educational Level (years)

14 6 1.3 1.3 52.5 15 116 24.5 24.5 77.0 16 59 12.4 12.4 89.5 17 11 2.3 2.3 91.8 18 9 1.9 1.9 93.7 19 27 5.7 5.7 99.4 20 2 .4 .4 99.8 21 1 .2 .2 100.0 Tot 474 100.0 100.0 al 上表及其 直方图说明,被调查的474名职工中,受过12年教育的职工是该组频数最高的,为190人,占总人数的40.1%,其次为15年,共有116人,占中人数的24.5%。且接受过高于20年的教育的人数只有1人,比例很低。 2、描述统计分析。再通过简单的频数统计分析了解了职工在性别和受教

泰坦尼克号沉没原因分析

泰坦尼克号沉没的原因分析 一、泰坦尼克号 泰坦尼克号(RMS Titanic,又称铁达尼号)是一艘奥林匹克级邮轮,于1912年4月处女航时撞上冰山后沉没。泰坦尼克号由位于爱尔兰岛贝尔法斯特的哈兰德与沃尔夫造船厂兴建,是当时最大的客运轮船。在她的处女航中,泰坦尼克号从英国南安普敦出发,途经法国瑟堡-奥克特维尔以及爱尔兰昆士敦,计划中的目的地为美国纽约。1912年4月14日,船上时间夜里11时40分,泰坦尼克号撞上冰山;4月15日凌晨2时20分,船裂成两半后沉入大西洋。泰坦尼克号海难为和平时期死伤人数最惨重的海难之一。船上1500多人丧生。2012年10月16日,沉船遗物将以1.89亿美元出售 二、沉船事故描述 1912年4月10日,泰坦尼克号从英国南安普敦出发,途径法国瑟堡-奥克特维尔以及爱尔兰昆士敦,计划中的目的地为美国的纽约,开始了这艘“梦幻客轮”的处女航。4月14日晚11点40分,泰坦尼克号在北大西洋撞上冰山,两小时四十分钟后,4月15日凌晨2点20分沉没,由于只有16艘救生艇,1503人葬生海底,造成了当时在和平时期最严重的一次航海事故,也是迄今为止最广为人知的一次海难。 三、主要原因分析 1、制造方的失误

船体本身钢板材料缺陷,当时使用的钢材用现代眼光看是不合格的,遇到较冷气温容易软化。造船工程师只考虑到要增加钢的强度.而没有想到要增加其韧性。把残骸的金属碎片与如今的造船钢材作一对比试验,发现在“泰坦尼克号”沉没地点的水温中,如今的造船钢材在受到撞击时可弯成V形,而残骸上的钢材则因韧性不够而很快断裂。由此发现了钢材的冷脆性,即在-40℃~0℃的温度下,钢材的力学行为由韧性变成脆性,从而导致灾难性的脆性断裂。而用现代技术炼的钢只有在-70℃~-60℃的温度下才会变脆。不过不能责怪当时的工程师,因为当时谁也不知道,为了增加钢的强度而往炼钢原料中增加大量硫化物会大大增加钢的脆性,以致酿成了“泰坦尼克号”沉没的悲剧。 钢板结合使用的铆钉,部分使用铆钉机,而船体下方机器不易接合的地方,使用了人工铆接,考虑到人的力量较小,采用特殊的锻造铆钉,该钉子参入了一些矿渣,使得强度大幅下降。导致在泰坦尼克号船体右侧撞上冰山的时候,船头铆钉松动,防水隔板部分裂开,前5间底舱出现无数细小但狭长的裂缝,海水源源不断的涌入。 2、船上工作人员的失误 船行驶在北大西洋上,之前一直有通报提醒前方有冰山。船驶入冰山区,船长命令船只以22.3节的船速全速航行(极限航速24节)。接到附近很多船只发来的冰情通报,船长命令瞭望员仔细观察。这一年因为是冷冬,冰山比往年向南漂得更远。但是,泰坦尼克号的船员未能找到望远镜(因为当时船上唯一的一副双筒望远镜被二副锁在了

《泰坦尼克号》英文影评

After seeing the film TITANICT,what impressed me most is that the film is really well written and I love the way it is told in flashback. It begins with a group of present-day treasure hunters exploring the wreckage of the Titanic (which results in some brilliant underwater footage). However They find nothing but an old safe that's completely empty save for a drawing of a woman. An elderly woman suddenly phones them and says she's the woman in the picture which makes them surprising. She then tells the divers and her granddaughter the main plot of the film. One thing that I really like as well about the flashback format is the editing. Each time the film always shifts between the past or present via a match cut, such as a video of the wreckage of the Titanic in the present day changing into the Titanic before it left in 1912 or a close-up shot of young Rose's eye to the eye of the elderly Rose in the present. The characters are all really well developed. I love how the film manages to blend some of the real historical figures (I.E. the crew of the Titanic) with fictional characters (I.E. Rose, Jack) and yet it is still incredibly believable, as if this really was a true story. The story is largely focused on the relationship between Rose and Jack, but the film constantly manages to develop other characters. Even the present-day characters are really well developed. The story is very well written, and I love the way how it changes in tone throughout. The film starts off exciting, with many people excited, yet still manages to portray Rose in a somewhat sympathetic role. A large portion of it is the romance between Jack and Rose, but the film manages to have some dramatic scenes, with a large sub-plot of the story being the conflict between Rose and the rest of her upper-class family. The film even manages to include a bit of humour here and there, but doesn't take it too far. However everything changes near the end, when we have the iceberg, and all of a sudden the film becomes very dark and tragic. The climax is very impressive. It takes place once the Titanic hits the iceberg. At this point, the film manages to successfully shift focus between different people. It manages to focus on the protagonists, but also manages to focus on the chaos and tension as the ship sinks and the crew struggle to keep order and get the passengers off safely. It brilliantly manages to capture the tragedy and horror of the disaster. Overall this movie is a cinematic masterpiece and one that you definitely should see if you haven't already.

SPSS软件进行主成分分析的应用例子

SPSS软件进行主成分分析的应用例子 2002年16家上市公司4项指标的数据[5]见表2,定量综合赢利能力分析如下: 第一,将EXCEL中的原始数据导入到SPSS软件中; 【1】“分析”|“描述统计”|“描述”。 【2】弹出“描述统计”对话框,首先将准备标准化的变量移入变量组中,此时,最重要的一步就是勾选“将标准化得分另存为变量”,最后点击确定。 【3】返回SPSS的“数据视图”,此时就可以看到新增了标准化后数据的字段。

数据标准化主要功能就是消除变量间的量纲关系,从而使数据具有可比性,可以举个简单的例子,一个百分制的变量与一个5分值的变量在一起怎么比较?只有通过数据标准化,都把它们标准到同一个标准时才具有可比性,一般标准化采用的是Z标准化,即均值为0,方差为1,当然也有其他标准化,比如0--1标准化等等,可根据自己的研究目的进行选择,这里介绍怎么进行数据的Z标准化。 所的结论: 标准化后的所有指标数据。 注意: SPSS 在调用Factor Analyze 过程进行分析时, SPSS 会自动对原始数据进行标准化处理, 所以在得到计算结果后的变量都是指经过标准化处理后的变量, 但SPSS 并不直接给出标准化后的数据, 如需要得到标准化数据, 则需调用Descriptives 过程进行计算。 factor过程对数据进行因子分析(指标之间的相关性判定略)。 【1】“分析”|“降维”|“因子分析”选项卡,将要进行分析的变量选入“变量”列表;

【2】设置“描述”,勾选“原始分析结果”和“KMO与Bartlett球形度检验”复选框; 【3】设置“抽取”,勾选“碎石图”复选框; 【4】设置“旋转”,勾选“最大方差法”复选框; 【5】设置“得分”,勾选“保存为变量”和“因子得分系数”复选框; 【6】查看分析结果。 所做工作: a.查看KMO和Bartlett 的检验 KMO值接近1.KMO值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析; Bartlett 球度度检验的Sig值越小于显著水平0.05,越说明变量之间存在相关关系。 所的结论: 符合因子分析的条件,可以进行因子分析,并进一步完成主成分分析。 注意: 1.KMO(Kaiser-Meyer-Olkin) KMO统计量是取值在0和1之间。当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,KMO值接近1.KMO值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析;当所有变量间的简单相关系数平方和接近0时,KMO值接近0.KMO值越接近于0,意味着变量间的相关性越弱,原有变量越不适合作因子分析。 Kaiser给出了常用的kmo度量标准: 0.9以上表示非常适合;0.8表示适合;0.7表示一般; 0.6表示不太适合;0.5以下表示极不适合。 2.Bartlett 球度检验: 巴特利特球度检验的统计量是根据相关系数矩阵的行列式得到的,如果该值较大,且其对应的相伴概率值小于用户心中的显著性水平,那么应该拒绝零假设,认为相关系数矩阵不可能是单位阵,即原始变量之间存在相关性,适合于做主成份分析;相反,如果该统计量比较小,且其相对应的相伴概率大于显著性水平,则不能拒绝零假设,认为相关系数矩阵可能是单位阵,不宜于做因子分析。 Bartlett 球度检验的原假设为相关系数矩阵为单位矩阵,Sig值为0.001小于显著水平0.05,因此拒绝原假设,说明变量之间存在相关关系,适合做因子分析。 所做工作: b. 全部解释方差或者解释的总方差(Total Variance Explained)

黄金大劫案影评

不能侍奉的亲情不能拥抱的爱情---《黄金大劫案》浅评 与其说是影评,更不如说是近一段时间自己的心情。 昨天下午收到影院的短信,黄金大劫案提前6小时首映。于是我看的第一个首映场电影就这么机缘巧合的成为了它,这部本来我不算多期待的电影。不期待不是因为不喜欢疯狂系列,而是因为这个电影名字让我提不起兴趣,以及预告片里伪满洲国的历史大背景让人不禁疑虑,宁浩的黑色幽默多是讽刺现实,而这样一个脱离现实不接地气的年代设定,这个一度给我们带来惊喜的青年导演到底要表达什么呢?既是转型之作,表明了不愿在成功的巅峰赖着不走,继续用疯狂买人眼球,但是会转成什么型呢?当年《让子弹飞》的横空出世,一度掀起国产电影对怪诞叙事风格的热捧,而这部年代格调多有相似的电影,不会是其影响下的产物吧? 就是带着这么多种种无聊的猜想担忧,我进了首映场的放映厅。人很多,没有好位置了。看来提前首映的好处是明显的,这种意外惊喜增加了观首映的乐趣,同时降低了零点不睡觉带来的痛苦。就是在前一天,同一个放映厅,我和老公一起看的《超级战舰》。再上个星期,看的《泰坦尼克号》。国产电影对抗两艘好莱坞大船,很有点意思。其实电影好,无所谓档期,好莱坞又怎样,大制作看多了未免油腻腻,想来点小清新,何况是开天辟地的民国小清新。 一不小心又说多了题外话。言规正传,这部电影确实带给我不小的惊喜。走出电影院的时候面对询问影片好坏的工作人员,我一个劲儿的点头。《超级战舰》固然好看,场面、音效,但是走出电影院也没什么可讨论的,过了一天也没什么太可回味。但是黄金不同,走出来我有点意犹未尽,一路到家和老公的话题都不离左右。一部好的电影,要想写影评,看一遍是肯定不够的。所以我现在写的,必然不是一篇好的影评。只是为了有感而发,备忘而已。 其实更让我认同的片名,是它的英文译名《Guns And Roses》,枪炮玫瑰,其实黄金劫不劫,完全无关主题。因此有些人诟病的黄金劫的太轻松甚至完全没有计谋,其实也不成问题,要是真的大费篇章机关算尽劫黄金,反而会让影片不伦不类,削弱整体风

泰坦尼克号读后感(英语作文)

After watching the three-hour classical movie ,I feel so impressed, though I had watched it before. Now some ideas about love arise in my mind. As far as I can see, I can not define what love is, and even do not have a clear idea about it. Does love means duty ,romantic , sex , or even the mix of the above? As to duty , I think Rose have the duty to marriage Hockley. After all they had been engaged and her mother need her to earn money for her family . And in the case of romantic, I think Hockley can bring as much as Jack to Rose. Maybe someone will say Jack has a nice personality trait. But it only shows in the emergency, if they were not that bad luck they might live a happy life. While, Rose, I think, is not very nice. When she had trouble, he did not tell her mother or fiancé ,. After being saved by a stranger, she even had affair with him. It could not be accepted even in our modern sight. Strangely, I do not have these ideas when watching the film , my mind was filled up with the ideas that they must have a happy ending. So what is love on earth? After thinking for a while, I have the following ideas: Film is beautiful because of the exaggeration, but the exaggeration may have a negative on our thought about something. In the case of Titanic, the role and their character may not be similar with the real life. So the ideas coming from the film are not that reliable ,they may be a little extreme. In a word, film is only film , there is nothing that is perfect. We are so common ,having so vulgar ideas about love . That is why we need the film, but we can not treat is as absolute truth.

SPSS大数据案例分析实施报告

SPSS数据案例分析 目录 _Toc438655006 一.手机APP 广告点击意愿的模型构建 (2) 1.1构建研究模型 (2) 1.2研究变量及定义 (2) 1.3研究假设 (2) 1.4变量操作化定义 (2) 1.5问卷设计 (2) 二.实证研究 (2) 2.1基础数据分析 (2) 2.2频数分布及相关统计量 (2) 2.3相关分析 (2) 2.4回归分析 (2) 2.5假设检验 (2)

一.手机APP 广告点击意愿的模型构建 1.1构建研究模型 我们知道效用期望、努力期望、社会影响对行为意愿会产生一定的影响,在模型中的性别、年龄、经验与自愿性等四个控制变量,通常都是作为控制变量来观察他们对采用因素与使用意向之间的关系的影响。因此,目前手机APP 广告的使用人群年龄相对比较年轻,而且年龄特征分布高度集中,年龄在30 岁以下的人群占到70%以上,因此本研究考虑性别了这一变量,同时根据手机APP 广告用户的特性,加入了手机流量作为控制变量,去观察它们对外部变量与点击意愿之间的关系是否有显著影响。 在本研究中,主要把调节变量和控制变量作为两个不同的研究变量,对于调节变量感知风险来说,它是直接影响了感知风险与手机APP 广告点击意愿二者的关系;而控制变量性别、手机流量这些变量是对广告效用期望、APP 效用期望和社会影响与点击意愿直接的关系是否有显著影响。最后,本文根据手机APP 广告的特点对UTAUT 模型进行扩展,构建了手机APP 广告点击意愿的影响因素研究模型。

1.3研究假设 (1) 广告效用期望、APP 效用期望、社会影响与手机APP 点击意向的关系 H1:用户的广告效用期望与点击手机APP 广告意愿正相关。 H2:用户的APP 效用期望与点击手机APP 广告意愿正相关 H3:社会影响与手机APP 广告点击意愿正相关 (2)感知风险与点击手机APP 广告意愿的关系 H4:感知风险与手机APP 广告点击意愿负相关 H5:性别,手机流量对手机APP 广告点击意愿没有显著影响

泰坦尼克号之人物分析

好的一部电影就如同一杯咖啡,需要我们慢慢的品尝,细细的饮。 JACK——以画画为生的底层人。然而,他机智勇敢,不为阶级所累。为了自己的爱情,敢于与高阶级的人斗争。在沉海过程中,他运用高超的应变能力使他和ROSE走过了一个个生死关口。直至最后,JACK 让仅有的木板儿给了ROSE,而自己却一直浸泡于水中,直至冻死。这种为爱而死的伟大精神让我们不得不震撼! ROSE—一个大家闺秀。她厌倦了上层社会的尔虞我诈,厌倦了上层社会的无聊而千篇一律的生活。她向往着真正的自由与快乐。JACK 的出现,为ROSE带来了一个个惊喜。为了自己正真的自由与幸福,他不惜与各种势力作斗争。面对JACK被诬陷,ROSE选择相信。他不顾滔滔大水,毅然返回去救JACK。经过重重困难,他们终于接近了救生艇。ROSE马上就要得救了,然而就在这一刻,她通过绳索上来与JACK共进退。“你跳,我也跳”多么人人震撼呀,为了自己的所爱,放弃了一次次生的机会。 卡尔—ROSE的未婚夫。一个地地道道的上层人,一个标标准准的资本主义家。他为了达到自己的目的,心狠手辣、不择手段。他为了让ROSE回心转意,不惜陷害JACK;为了让JACK远离ROSE,不惜背后使阴招。同时,他更是一个视财如命的人,在生死存亡时刻,他依然惦念他的钻石。最后卡尔死于29年经济危机中,上天让他一无

所有,这无疑是对他最好的惩罚。 ROSE之母——一个岌岌可危的上层人。丈夫已逝,却留下许多债务。ROSE之母如今是依靠早年的名声,维持着这个已经入不敷出的空架子。这样的她却依然瞧不起暴发户。她为了继续是上层人,不惜牺牲自己女儿的幸福。可知她是一个既傲慢又自私的人。在救生艇中等待救援时,她明明知道,女儿就在前面,却不救援。 暴发户——虽然已处于上层阶级,但她依然保持着善良、淳朴等美德。她了解民间疾苦,多次帮助JACK。她支持真爱,真心的希望ROSE 与JACK在一起。在救生艇中等待救援时,她为大家不去救人而愤恨。 船长——拥有多年的航海经验,即将退休。他知道在海上不应快速前进,然而面对上级的压力,不得不加速行驶,最终造成泰坦尼克号沉海悲剧。他为了赎罪,与他的船一同沉入大海。这不得不说这是资本家不断扩大自己利益而造成的悲剧。 吹乐队——在人们求生的忙乱中,这几个人依然能够镇定的面对死亡,让我们不得不震撼。

相关文档
最新文档