北京大学统计学经典课件第四章——变量间的关系
合集下载
变量之间的关系课件

家庭背景:影响个人性格、价值观、 社交能力等
社会文化:影响个人行为、观念、 生活方式等
心理学中的变量关系
心理测量:通过 测量变量来评估 个体的心理状态 和行为
心理实验:通过 控制变量来研究 心理现象和规律
心理治疗:通过 改变变量来调整 个体的心理和行 为
心理教育:通过 变量关系来提高 个体的心理素质 和适应能力
生物学中的变量关系
遗传学:基因型 与表现型的关系
生态学:物种与 环境的关系
生理学:激素水 平与生理功能的 关系
生物化学:酶活 性与底物浓度的 关系
社会学中的变量关系
社会经济地位:影响个人收入、教 育水平、职业选择等
社会网络:影响个人信息获取、资 源获取、机会获取等
添加标题
添加标题
添加标题
添加标题
模型选择:根据实际应用场景选择 合适的模型
添加标题
添加标题
添加标题
添加标题
模型优化:根据评估结果对模型进 行改进和优化
模型更新:根据新的数据和需求对 模型进行更新和维护
模型应用与推广
模型应用:在数据分析、预测、决 策等领域的应用
推广效果:提高模型的知名度和影 响力,吸引更多的用户和研究者
添加标题
添加标题
变量之间的关系课件大 纲
PPT,a click to unlimited possibilities
汇报人:PPT
目录
01 添 加 目 录 项 标 题 03 变 量 关 系 的 表 示 方
法
05 变 量 关 系 的 实 际 应 用
02 变 量 关 系 的 基 本 概 念
04 变 量 关 系 的 分 析 方 法
散点图可以应用于各种领域, 如经济学、社会学、生物学 等。
变量之间的关系 PPT课件 北师大版

他们得到如下数据:
支撑物 10 20 30 40 50 60 70 80 90 100 高度(厘 米) h
小车下 滑的时 4.233.002.452.131.891.711.591.5 1.411.35
间(秒
0
)t
根据上表1回.2答3 下0.5列5问0.题32:0.240.180.120.090.09 0.06
3.研究表明,当钾肥和磷肥的施用量一定时,土 豆的产量与氮肥的施用量有如下关系:
氮肥施 0 用量/ 千克/ 公顷
34 67 101 135 202 259 336 404 471
土豆产 15.18 21.36 25.72 32.29 量/吨 /公顷
34.03 39.45 43.15 43.46 40.83 30.75
(3)h每增加10厘米,t的变化情况相同吗? 不相同。 h每增加10厘米, t的变 化越来越小。
他们得到如下数据:
支撑物 10 20 30 40 50 60 70 80 90 100 高度(厘 米) h
小车下 滑的时 4.233.002.452.131.891.711.591.5 1.411.35
他们得到如下数据:
支撑物 10 20 30 40 50 60 70 80 90 100 高度(厘 米) h
小车下 滑的时 4.233.002.452.131.891.711.591.5 1.411.35
间(秒
0
)t
根据上表1回.2答3 下0.5列5问0.题32:0.240.180.120.090.09 0.06 2)如果用h表示支撑物高度,t表示小车下滑时间, 随着h逐渐变大,t的变化趋势是什么? 随着h逐渐变大,t的变化越来越小。
2.人口与环境是我们应该关心的问题,阅读下列 材料完成相应的任务.
高考数学总复习 103变量间的相关关系课件 北师大版

i=1
i=1
[解析] -x =0+10+205+50+70=30. -y =66.7+76.0+85.50+112.3+128.0=93.6,
5 xiyi-5-x -y
i=1
b=
≈0.8809,
5 xi2-5-x 2
i=1
a=-y -b-x =93.6-0.8809×30≈67.173 ∴回归直线方程为 y=0.8809x+67.173.
• [解析] (1)散点图如下:
• (2)从图中可以发现数据点大致分布在一条 直线的附近,因此施化肥量和水稻产量近 似成线性相关关系,当施化肥量由小到大 变化时,水稻产量由小变大,但水稻产量 只是在一定范围内随着化肥施用量的增加 而增长.
利用散点图判断两个变量的相关关系
[例 1] 5 个学生的数学和物理成绩如下表:
• (参考数值:3×2.5+4×3+5×4+6×4.5= 66.5)
• [解析] (1)由题设所给数据,可得散点图如 下图.
4
(2)由表中数据,计算得:xi2=86,
i=1
x =3+4+4 5+6=4.5, y =2.5+3+4 4+4.5=3.5,
4
已知xiyi=66.5,
i=1
所以,由最小二乘法确定的回归直线方程的系数为:
知识梳理 1.散点图 (1)将变量所对应的点描出来,就组成了变量之间的一个图, 这种图为变量之间的 散点图 . (2)从散点图上可以看出,如果变量之间存在着某种关系,这 些点会有一个集中的大致趋势,这种趋势可用一条光滑的曲线来 近似,这种近似的过程称为曲线拟合.
若两个变量 x 和 y ቤተ መጻሕፍቲ ባይዱ散点图中,所有点看上去都在一条直 线附近波动,则称变量间是 线性相关 的.若所有点看上去都 在某条曲线(不是一条直线)附近波动,则称此相关为非___线__性__相__关 的.如果所有的点在散点图中没有显示任何关系,则称变量间 是不相关的.
变量间的关系 北京大学【统计学】课件,王喜之

变 量 间 的 关 系
例1广告投入和销售之间的关系(数据ads.sav)
70
60
50
40
30
20
SA LE
10
0
0
2
4
6
8
10
12
14
AD
这是什么关系?
• 这两个变量是否有关系?显然,它们有关系; 这从散点图就很容易看出。基本上销售额是 随着广告投入的递增而递增。
• 如果有关系,它们的关系是否显著?这也可 以从散点图得到。当广告投入在6万元以下, 销售额增长很快;但大于这个投入时,销售 额增长就不明显了。因此,这两个变量的关 系是由强变弱。
都增加来判断总体模式. • Spearman 秩相关系数,它和Pearson相关系数定
义有些类似,只不过在定义中把点的坐标换成各
自样本的秩.
• 它们各自都有以不相关为零假设的检验,即p-值 小则相关.但各自的相关含义不尽相同.
入
入
入
5
8 10
女 25
15
7
2
7
9
大致可看出女性赞成的多, 低收入赞成的多
定性和定量变量间的混和关系
假想关于高等学校的数据的一些指标包括:在校生人数(S), 研究生比例(G), 教师人数(F), 职工人数(ST),SCI和SSCI文 章数目(P), SCI和SSCI文章引用数目(Q), 科研项目数(PR), 科研经费(B),总经费及招生范围(N)等
80
70
60
50
39 25
40
30
N=
11
27
12
1
2
3
家庭收入
30
20
10
例1广告投入和销售之间的关系(数据ads.sav)
70
60
50
40
30
20
SA LE
10
0
0
2
4
6
8
10
12
14
AD
这是什么关系?
• 这两个变量是否有关系?显然,它们有关系; 这从散点图就很容易看出。基本上销售额是 随着广告投入的递增而递增。
• 如果有关系,它们的关系是否显著?这也可 以从散点图得到。当广告投入在6万元以下, 销售额增长很快;但大于这个投入时,销售 额增长就不明显了。因此,这两个变量的关 系是由强变弱。
都增加来判断总体模式. • Spearman 秩相关系数,它和Pearson相关系数定
义有些类似,只不过在定义中把点的坐标换成各
自样本的秩.
• 它们各自都有以不相关为零假设的检验,即p-值 小则相关.但各自的相关含义不尽相同.
入
入
入
5
8 10
女 25
15
7
2
7
9
大致可看出女性赞成的多, 低收入赞成的多
定性和定量变量间的混和关系
假想关于高等学校的数据的一些指标包括:在校生人数(S), 研究生比例(G), 教师人数(F), 职工人数(ST),SCI和SSCI文 章数目(P), SCI和SSCI文章引用数目(Q), 科研项目数(PR), 科研经费(B),总经费及招生范围(N)等
80
70
60
50
39 25
40
30
N=
11
27
12
1
2
3
家庭收入
30
20
10
北师大版 变量之间的相关关系优秀课件1

名次 1 13 28 3 9 2 19 20 4 16
数学
物理
成绩 76 74 73 73 72 71 70 67 66 62 60 55
名次 31 32 33 34 35 36 37 38 39 40 41 42
成绩 24 24 48 31 41 58 71 33 54 50 31 41
名次 41 42 24 38 30 14 7 37 18 21 39 31
变量之间的两种关系对比:
区别 联系 例子
函数关系
确定性-可 研究两变量 匀速运动中 以精确表示 之间的关系 时间与路程 的关系 非确定性- 研究两变量 物理与数学 带有随机性 之间的关系 成绩
相关关系
问题4:
相关关系的例子在现实生活中非常广泛, 你能举出几个吗?
人的身高和年龄是一对相关关系。 期中考试数学成绩与复习时间的投入量的关系。
变量之间的相关关系
问题1:
我们常说:“如果你的数学成绩好, 那么你的物理成绩也不会差。”这种 说法有没有根据,你对这话认可吗?
数学
物理
成绩 100 98 97 96 94 92 91 91 90 90
名次 1 2 3 4 5 6 7 8 9 10
成绩 91 58 43 83 68 84 51 50 83 56
学习时间
其它因素
相关关系是一种非确定性关系
问题3:
两个变量之间除了相关关系之外, 还有函数关系,例如在匀速直线运 动中时间与路程这两个变量的关 系。这两种关系有什么异同?
在匀速直线运动中时间与路程这两个 变量是一种函数关系,他们之间是完 全确定的。数学和物理成绩这两个变 量之间的关系是不确定的,带有随机 性。
1.如果所有的样本点都落在某一函数曲线上,这两个变量有 什么关系? ——具有函数关系. 2.如果所有的样本点都落在某一函数曲线附近,那么这两个 变量之间有关系吗?关系确定吗?是什么关系? ——有关系,不确定,有相关关系。 3. 如果所有的样本点都落在某一直线附近,变量之间就有线 性相关关系 4.如果散点图的点几乎没有什么规则,则这两个变量之间 关系又如何? ——没有相关关系
初中数学北师大七年级下册第四章变量之间的关系变量的关系复习PPT

(1) 请完成下表 :
汽车行驶时间 t(小时) 0 油箱的剩余油量 Q (升) 60
12 54 48
46 36 24
汽车行驶的时间 t(小时) 0
1
油箱的剩余油量 Q (升) 60 54
(2)若汽车行驶中油箱剩余油量为12升, 则汽车行驶了_____8____小时
(3)贮满60升汽油的汽车, 最多行驶______1_0___小时
比一比:
1、下列各情景分别可以用哪一幅图来近似的刻画
(1)汽车紧急刹车(速度与时间的关系)
( D)
(2)人的身高变化(身高与年龄的关系)
(B)
(3)跳高运动员跳跃横杆(高度与时间的关系) ( C )
(4)一面冉冉上升的红旗(高度与时间的关系) ( A )
(A)
(B)
(C)
(D)
感谢各位同学的 合作,谢谢!
S(千米)
215
170 130
7:00 8:30 9:30 10:00
17:00
t(时) 19:30
看图你能回答这些问题吗?
(1)小强到达南充是什么时候?他们用了多少时间?
S(千米)
上午10︰00左右,
用了3个小时
215
170
(2)去南充的途中 , 130 可能由于前方路堵,汽
车减速慢行,你知道汽
215÷2.5=86千米/时。
17:00
t(时) 19:30
下图是反映变量之间的关系图,请你想象一下适合 它的实际情景,并指出横轴和纵轴分别表示什么?
试一试:
小明的父母出去散步,从家走(匀速)了20分钟到了一 个离家900米的报亭,母亲因有事即按原速、原路返回。 父亲看了10分钟报纸后,用了15分钟返回家。下图中哪 一个是表示父亲离家的时间与距离之间的关系的图象? 哪一个表示母亲离家的时间与距离之间关系的图象?
新北师大版数学七年级下册第四章《变量之间的关系》复习课件

(3)请你列出果子落下的高度h(米)与
初时中数间学课件t(秒)之间的式 .
.
3.某种油箱容量为60升的汽车,加满汽油后, 汽车行驶时油箱的油量Q(升)随汽车行驶时间 t(时)变化的关系式如下:Q=60-6t (1) 请完成下表
汽车行驶时间 0
1
2.5
4
t/小时
油箱的油量Q/ 60
(升2)汽车行驶5小时后,油箱中油量是 升?
初中数学课件
例题4:一辆汽车以每小时50千米的速度 行驶了t小时,行驶的路程为s千米. (1)这个情境中,有哪些变量?其中自变
量是什么?因变量是什么? (2)你能用哪种方式表示路程与时间之
间的关系?具体做一做 。
(3)该汽车行驶2.5小时的路程是多少千 米?
(4)一段公路全长350千米,这辆汽车 行驶完全程需要多少小时?
初中数学课件
例5.分析下面反映变量之间关系的 图像,想象一个适合它的实际情境.
((14))可可以以把把x和x和y分y分别别代代表表时时间间和和距高离度,,那那 ((么2么3))这可这可个以个以图把图把可x就x和和以可yy描分以分述别描别为代述代:表为表小时:时华间一间骑和架和车速飞蓄从度机水学,从量校那一, 回定么那家的这么,飞个这一行图个段高可图时度以可间慢描以后慢述描,下为述停降:为下一一:来个辆一修高汽个车度车水,,,池然然减先后后速放 又在行水开这驶,始一一一往高段段家度时时走飞间间,行后后直了,,到一匀停回段速止家时行,;间驶随后了后,一,快段又到时接机间着, 初中数场学然放课件时后水,逐直开渐到始减放降速完落,. ,到最了后目降的落地在停机下场来..
初中数学课件
2.果子成熟从树上落到地面,它落下 的高度与经过的时间有如下的关系:
北师大版七下:用图象表示的变量间关系课件

在这个表中反应了 2 个变量之间的关系, 每件商品的降价 是自变量, 日销量 是因 变量。
2.关系式法 某出租车每时耗油5千克,若t小时耗 油q千克,则自变量是t ,因变量 是 q,q与t的关系式是q=5t 。
3.图象法 下图表示了某港口某日从0时到6时水深变化 的情况。
水深(米)
8 7 6 5 4 3 2 1
的速度比慢者的速度每秒快 B
( )。
12
A. 2.5m
B. 2m
t(s)
0
8
C. 1.5m
D. 1m
布置作业:
三、请你收集生活中(报纸、杂志等)的 变量关系的图象。
s
s
s
s
O
tO
tOtOtFra bibliotekAB
C
D
练习提高:
5.水滴进的玻璃容器如下图所示(水滴 的速度是相同的),那么水的高度h是 如何随着时间t变化的,请选择匹配的 示意图与容器。
(A) (B) (C) (D) 。
课堂小结:今天的收获是什么?
1. 通过速度随时间变化的情境,经历从图 象中分析变量之间关系的过程,加深了对 图象表示的理解。 2. 不仅读懂了文字语言,而且还读懂图形 语言。 3. 最关键是搞清楚自变量、因变量,并且 明白了它们的变化关系。
90 60 30
0 4 8 12 16 20 24 时间(分)
(1)汽车从出发到最后停止共经过 了 24分钟 的时间。它的最高时速 是 90千米/小时 。 (2)汽车在 2至6分和18至22分 的时
间段里保持匀速行驶。时速分别是 和 30千米/小时 。 90千米/小时
(3)出发后8分到10分之间可能产生什么 样的情况? (4)用自己的语言大致描述这辆汽车的行 驶情况。
2.关系式法 某出租车每时耗油5千克,若t小时耗 油q千克,则自变量是t ,因变量 是 q,q与t的关系式是q=5t 。
3.图象法 下图表示了某港口某日从0时到6时水深变化 的情况。
水深(米)
8 7 6 5 4 3 2 1
的速度比慢者的速度每秒快 B
( )。
12
A. 2.5m
B. 2m
t(s)
0
8
C. 1.5m
D. 1m
布置作业:
三、请你收集生活中(报纸、杂志等)的 变量关系的图象。
s
s
s
s
O
tO
tOtOtFra bibliotekAB
C
D
练习提高:
5.水滴进的玻璃容器如下图所示(水滴 的速度是相同的),那么水的高度h是 如何随着时间t变化的,请选择匹配的 示意图与容器。
(A) (B) (C) (D) 。
课堂小结:今天的收获是什么?
1. 通过速度随时间变化的情境,经历从图 象中分析变量之间关系的过程,加深了对 图象表示的理解。 2. 不仅读懂了文字语言,而且还读懂图形 语言。 3. 最关键是搞清楚自变量、因变量,并且 明白了它们的变化关系。
90 60 30
0 4 8 12 16 20 24 时间(分)
(1)汽车从出发到最后停止共经过 了 24分钟 的时间。它的最高时速 是 90千米/小时 。 (2)汽车在 2至6分和18至22分 的时
间段里保持匀速行驶。时速分别是 和 30千米/小时 。 90千米/小时
(3)出发后8分到10分之间可能产生什么 样的情况? (4)用自己的语言大致描述这辆汽车的行 驶情况。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关和回归分析
相关和回归分析
• 顾客对商品和服务的反映对于商家是至关重 要的,但是仅仅有满意顾客的比例是不够的, 商家希望了解什么是影响顾客观点的因素以 及这些因素是如何起作用的。 • 一般来说,统计可以根据目前所拥有的信息 (数据)建立人们所关心的变量和其他有关 变量的关系(称为模型)。 • 假如用Y表示感兴趣的变量,用X表示其他可 能有关的变量(可能是若干变量组成的向量 )。则所需要的是建立一个函数关系Y=f(X) 。这里Y称为因变量或响应变量,而X称为自 变量或解释变量或协变量。 • 建立这种关系的过程就叫做回归。
定性变量间的关系
(关于某项政策调查所得结果:table7.sav)
观点:赞成
低收 入
男 女
观点:不赞成
低收 入 中等收 入 高收 入
中等收 入
高收 入
20 25
10 15
5 7
5 2
8 7
10 9
大致可以看出女性赞成的多, 低收入赞成的多
定性和定量变量间的混和关系
假想关于高等学校的数据的一些指标包括:在校生人数(S), 研究生比例(G), 教师人数(F), 职工人数(ST),SCI和SSCI文 章数目(P), SCI和SSCI文章引用数目(Q), 科研项目数(PR), 科研经费(B),总经费及招生范围(N)等
定量变量的线性回归分析
• 对例1中的两个变量的数据进行线性回归,就是 要找到一条直线来最好地代表散点图中的那些点。
y 0 1 x
S1 60 70 80 90
100
y 26.44 0.65 x
40 50 60 70 J3 80 90 100
40
50
检验问题等
• 对于系数1=0的检验 • 对于拟合的F检验 2(决定系数)及修正的R2. •R
2
(c)
2
(d)
1
y
0
y
-2 -1 0 x 1 2
-1
-2
0
-3
2
4
6
8
-2
-1
0 x
1
2
3
几种相关的度量
• Pearson相关系数,又叫相关系数或线性相关系数。 它一般用字母r表示. • Kendall t 相关系数(Kendall’s t)这里的度量原理 是把所有的样本点配对,看每一对中的x和y是否 都增加来判断总体模式. • Spearman 秩相关系数,它和Pearson相关系数定 义有些类似,只不过在定义中把点的坐标换成各 自样本的秩. • 它们各自都有以不相关为零假设的检验,即p-值 小则相关.但各自的相关含义不尽相同. • 现在再来看例1的数据(highschool.sav).关于初三 和高一成绩的相关系数的结果是Pearson相关系 数,Kendall t 和Spearman 秩相关系数分别为 0.795, 0.595和0.758。
变 量 间 的 关 系
直到现在我们所涉及的仅仅是 对一些互相没有关系的变量的 描述。但是现实世界的问题都 是相互联系的。不讨论变量之 间的关系,就无从谈起任何有 深度的应用;而没有应用,前 面讲过的那些基本概念就仅仅 是摆设而已。
变量间的关系
• 人们每时每刻都在关心事物之间的关系。 • 比如,职业种类和收入之间的关系、政府 投入和经济增长之间的关系、广告投入和 经济效益之间的关系、治疗手段和治愈率 之间的关系等等。 • 这些都是二元的关系。 • 还有更加复杂的诸多变量之间的相互关系, • 比如企业的固定资产、流动资产、预算分 配、管理模式、生产率、债务和利润等诸 因素的关系是不能用简单的一些二元关系 所描述的。
SPSS Syntax: UNIANOVA s1 BY income WITH j3 /METHOD = SSTYPE(3) /INTERCEPT = INCLUDE /CRITERIA = ALPHA(.05) /DESIGN = income j3 .
注意 • 这里进行的线性回归,仅仅是回归 的一种,也是历史最悠久的一种。 • 但是,任何模型都是某种近似; • 线性回归当然也不另外。 • 它被长期广泛深入地研究主要是因 为数学上相对简单。 • 它已经成为其他回归的一个基础。 • 总应该用批判的眼光看这些模型。
还有定性变量 • 该数据中,除了初三和高一的成绩 之外,还有一个定性变量 • 它是学生在高一时的家庭收入状况; 它有三个水平:低、中、高,分别 在数据中用1、2、3表示。
还有定性变量
下面是对三种收入对高一成绩和高一与初 三成绩差的盒形图
110 100
30
20
一 绩 初 成 之 高 成 与 三 绩 差
90 80 70 60
10
0
-10
50 40 30
N= 11 27 12 39 25
一 绩 高 成
-20
-30
N= 11 27 12
1
2
3
1
2
3
家庭 收入
家庭 收入
例2 这是200个不同年龄和性别的人对某项服务产品的认 可的数据(logi.sav). 年龄是连续变量,性别是有男和女 (分别用1和0表示)两个水平的定性变量,而(定性)变量 “观点”则为包含认可(用1表示)和不认可(用0表示)两个 水平的定性变量。
0 1 1
= 0 1 x 2 , 代表家庭收入的哑元=2 时,
= 0 1 x 3 , 代表家庭收入的哑元=3 时。
自变量中有定性变量的回归
• 现在只要估计0, 1,和1, 2, 3即可。 • 哑元的各个参数1, 2, 3本身只有相对意义,无法三个 都估计,只能够在有约束条件下才能够得到估计。 • 约束条件可以有很多选择,一种默认的条件是把一个参 数设为0,比如3=0,这样和它有相对意义的1 和2 就 可以估计出来了。 • 对于例1,对0, 1, 1, 2, 3的估计分别为28.708, 0.688, -11.066, -4.679, 0。这时的拟合直线有三条,对三种家 庭收入各有一条:
这是什么关系?
这是什么关系?
• 这个关系是否带有普遍性?也就是说,仅仅 这一个样本有这样的关系,还是对于其他企 业也有类似的规律。这里的数据还不足以回 答这个问题。可能需要考虑更多的变量和收 集更多的数据。一般来说,人们希望能够从 一些特殊的样本,得到普遍的结论,以利于 预测。 • 这个关系是不是因果关系?在本问题中,看 来有因果关系。这类似于一种试验;而试验 时是容易找到因果关系的。但是,一般来说, 变量之间有关系但绝不意味着存在因果关系。
从这个数据很难马上看到任何关系。但是从这个 数据可以得到许多有用的关系和结论。比如,可 以得到任何一个变量和其余变量之间的定量关系 或者多个变量之间的定量关系(因而可以建立模 型,进行预测和各种推断);也可以利用其中一 些变量把各个高等学校分类;还可以把众多的变 量用少数几个变量代替以利于分析和理解;此外 这个数据可以作为高校排名的根据之一。所有这 些都是未来章节的内容。
0 1x
Logistic模型拟合结果
• 依靠计算机,很容易得到0和1的估计 分别为0.520和-0.069。拟合的模型为
p ln 0.520 0.069x 1 p
p 0.2 0.0 0.1 0.3
20
30
40 age
50
60
70
Logistic模型拟合结果
50名同学初三和高一成绩的散点图
100
90
80
70
60
一 绩 高 成
50
40 40 50
从这张图可以看出什么呢?
60 70 80 90 100 110
初三 成绩
问题是 • 怎么判断这两个变量是否相关? • 如何相关? • 相关的度量是什么? • 进一步的问题是能否以初三成绩为 自变量,高一成绩为因变量来建立 一个回归模型以描述这样的关系, 或用于预测。
Logistic 回归
• 例2是关于200个不同年龄,性别的人对某项 服务产品的观点(二元定性变量)的数据 (logi.sav). • 这里观点是因变量, 只有两个值;所以可以把 它看作成功概率为p的Bernoulli试验的结果. • 但是和单纯的Bernoulli试验不同,这里的概 率p为年龄和性别的函数. • 可以假定下面的(logistic回归)模型
再加上性别变量进行拟合,得到的0, 1和0, 1的 估计(同样事先确定为1=0)分别为1.722, -0.072, 1.778, 0.可以看出年龄影响对男女混和时(0.069) 差不多,而女性相对于男性认可的可能性大(01=1.778)。
y 28.708 0.688 x 11.066, (低收入家庭), y 28.708 0.688 x 4. 679, (中等收入家庭), y 28.708 0.688 x, (高收入家庭)。
SPSSS实现(hischool.sav)
• Analize-General linear model-Univariate, • 在Options中选择Parameter Estimates, • 再 在 主 对 话 框 中 把 因 变 量 ( s1 ) 选 入 Dependent Variable,把定量自变量(j3)选 入Covariate,把定量因变量(income)选 入Factor中。 • 然后再点击Model,在Specify Model中选 Custom, • 再把两个有关的自变量选入右边,再在下 面Building Term中选Main effect。 • Continue-OK,就得到结果了。输出的结 果有回归系数和一些检验结果。
p ln 0 1 x i , 这里i 0,1 代表女性和男性 1 p
Logistic 回归
• 为了循序渐近,先拟合没有性别作为 自变量(只有年龄x)的模型