类别变项的统计方法
社会统计学 第9章 详析模式与统计控制

冲突的原因”,因为或许还有其他的因素与这两个变量都相关,如家庭的经
济水平. (1)
(2)
(3)
以R表示X与Y的原相关,以R1、R2分别表示两个分表中X与Y相关,则上述的三
种结果可表示为: 统计结果
研究结论
R1=R2=0
虚假关系
R1=R2=R
真实关系
R1≠0,R2≠0,但R1<R,R2<R
部分真实关系
4、怎样控制W,使之不变? 社会学研究采用统计控制法来控制变项,分表法就是其中一种控制方法。 所谓分表法,就是依据前置变量W的值,将样本个案分组,然后每组中分析X
与Y的关系。 每个分表的作用就是在W不变的情况下分析X与Y的关系,这就是统计控制的基
本道理。在原表中W是变项,在分表中却受到控制而变为常数。
5、控制系消失:X与Y因果关系虚假;
(2)X与Y关系维持原状: X与Y因果关系可能真实
(3)X与Y虽仍有关系,但相关程度减弱: X与Y因果关系部分真实,部分由W 所致。
例如,研究住户的拥挤程度对夫妻间冲突的影响.我们不能简单地依据交互分
类的统计结果(G系数和Z检验)就下结论说“住户的拥挤程度是导致夫妻间
4、在条件分析中,只要样本颇大,也可以同时引进两个或以上的条件变项。 再者,如是随即样本,可作统计推论。
5、在因果分析与阐明分析中,可能出现本节所讨论的各种条件分析情况,此 时就表示所控制的第三类变项产生互动效果,因此需要改为互动分析,以 求加深了解X与Y的相关性质。
第四节 净相关系数
1、净相关分析:以一个系数值来表示在控制第三类变项(W或T)以后,X与Y 的相关。例如:以R代表原相关的强弱,Rp代表净关系的大小,则: (1)在因果分析中,Rp=0表虚假关系,Rp=R表关系可能真实,Rp≠0但Rp<R时 是部分真实关系; (2)在阐明分析中,Rp=0表完全阐明,Rp=R表不能阐明,Rp≠0但Rp<R时是部分
高校学生艾滋病认知情况调查分析——以南宁师范大学为例

【摘 要】本文基于南宁师范大学关于高校学生艾滋病认知情况的调查及统计,分析性别、年龄、是否接受过防艾教育与答题正确率存在的关联性,针对性别不同和年级不同学生在艾滋病相关问题的认知上存在显著差异,以及是否接受过防艾教育对艾滋病相关问题的回答正确性有显著差异的结论,提出开展性别差别化防艾教育和年级差异化防艾教育、深化高校防艾教育等建议。
【关键词】高校 艾滋病 认知情况 调查 卡方检验【中图分类号】G 【文献标识码】A【文章编号】0450-9889(2020)27-0014-03高校是教育的最高殿堂,是重要的教育推手,培养出无数专业的优秀学子,对人类社会的进步与生活水平的提升起着重要的作用。
然而,高校却较少关注学生的性教育,更遑论性知识与性行为相关疾病的预防教育。
周颖等学者调研了大学生对艾滋病的认知及预防情况,结果显示,大学校园成为艾滋病高发区,但各高校对此的干预程度比较低,由于缺乏对艾滋病的专业了解,有些艾滋病患者耽误了最佳治疗时间。
对此,高校在学生思想政治教育和共青团工作中应增加对学生的性教育内容,为学生的健康发展提供帮助。
南宁师范大学艾知筑梦团队为推动高校预防艾滋病健康教育(以下简称防艾教育)与落实艾滋病“降两率”的目标,对高校学生艾滋病认知情况进行调研。
一、调研设计本研究采用整群随机抽样的方法,在南宁师范大学2016—2019级本科生和研究生中进行艾滋病认知情况的问卷调查。
通过问卷星在网上搜集高校学生基本信息,并依照学者已有研究材料设计知识题与态度题,以匿名填写的方式检核高校学生对艾滋病基本知识的认知程度与对艾滋病患者的主观态度。
问卷题项参照晏涵文的研究材料而设计,知识题有58题,用以检测艾滋病传染相关知识,答题设计提供“正确”“错误”“不知道”三个选项。
设“不知道”选项,是为了避免受访者在对艾滋病知识不清楚的情况下用二择一猜选,造成正确率计算的偏误。
采用SPSS 18.0对问卷题项进行统计分析。
社会统计学公式总结及要点

3.一个变项,1个样本 :
①(n≥100):
②(n≤30): , df=b-1
4.1个变项,2个样本 1 2
n=n1+n2>100 →
五、归类总结之五:有关消减误差比例
1.
有消减误差比例意义,且对称
、G、Q拉系数、rs2、r2、rxy.12、、Ry.122= Ry.x1x22
2.有无自由度的表达
G、r、F、x2结果解释加上“其显著度水平达到或没有达到……水平”
3.有关r净相关系数
(两个定距变项)
r=rxy.1——引入第三个变项时对X、Y变项产生共同影响。
rx(y-1)——引入第三个变项时,只对Y产生影响,无消减误差意义。
ry(x-1)——引入第三个变项时,只对X产生影响,无消减误差意义。
Q= Q3- Q1
有单个数(n为偶数时会出现偏离)、区间之分。
(有几种Q,就有几种S计算法)
当为区间表格时(n/4)
①计算向上累加数cf;②Q1位置= ,Q3位置= ;
③Q1=L1+ W1,Q3= L3+ W3;④Q= Q3- Q1P57
5.标准差
①单个数:S= ,②区间:S= P60
对S的解释:如以均值来估计各个个案的数值,所犯的错误 平均是S。用均值作估计变项数值时所犯错误的大小。
社会统计学公式汇总及要点2011.09.09-09.10
(仅供参考,如不能显示公式,请安装Microsoft公式3.0)
一、归类总结之一
测量层次
特质
数学特质
单变项:X
定类变项
只分类
Mo、V
比例、比率、对比值、
第六章统计分析方法(1)

第三节 推断统计
推断统计指用概率形式来决断数据之间是否存在某种关系及用 样本统计值来推测总体特征的一种重要的统计方法。 一、概率 概率也称“机率”、“或然率”。表示随机事件发生可能大小 的量。 二、正态分布 正态分布是一种应用广泛的常见分布。例如同一年龄组学生的 身高、智商、成绩等均服从或近似服从正态分布。
7225 6400 7056 7396 6084 5625 6889 8100 7921 7744
70440
7744 7569 7225 7056 6561 5776 7225 8836 8464 8464
74920
7480 6960 7140 7224 6318 5700 7055 8460 8188 8096
第六章 统计分析方法
第一节
一、总体与样本 总体:统计研究对象的全体 如,某项统计分析的任务是要了解全区一年级学生的视力情况, 那么,全区所有一年级学生的视力就构成了一个总体。 总 体 无限总体 :总体包含的数目是无限的。 有限总体 :总体包含的数目是有限的。
若干基本统计术语
个体:组成总体的基本单位。 比如,某区一年级学生视力总体的每一个学生的视力都是一个个 体。 样品:从总体中抽出一部分个体进行研究,被抽到的个体。 样品容量(n或N):样品的个数。 样本容量大于30的样本称为大样本,样本容量小于30的样本称 为小样本。 二、变量 变量(variable):是指研究对象的个体之间在性质和数量上可以 变化并可以测量的条件、现象或特征。 比如年级的高低、成绩的多少、态度的好坏等。
例如:10名5岁幼儿在语言X和常识Y上的得分如表所示,求两 者的相关程度。
序号 语言X 常识Y X2 Y2 语言x常识(XY)
1 2 3 4 5 6 7 8 9 10
统计学和统计法基础知识:统计方法试题(题库版)

统计学和统计法基础知识:统计方法试题(题库版)1、单选有意识地选择三个有代表性的农村点调查农民收入情况,这种调查方式属于()。
A.典型调查B.重点调查C.抽样调查D.普查正确答案:A参考解析:典型调查是一种非全面(江南博哥)的专门调查,它是根据调查的目的与要求,在对被调查对象进行全面分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查。
有意识地选择三个有代表性的农村点调查农民收入情况的调查方式属于典型调查。
2、单选某种产品的单位成本Y(元/件)对产量X(千件)的回归方程为Y=100-0.2X,其中“-0.2”的意义是()。
A.产量每增加1千件,单位成本下降0.2元B.产量每增加1千件,单位成本平均下降0.2元C.产量每增加1千件,单位成本下降20%D.产量每增加1千件,单位成本下降0.2%正确答案:B参考解析:一元线性回归方程为y=b0+b1x,b0是直线的截距,表示当解释变量为零时y的平均值。
回归系数b1是直线的斜率,表示解释变量x每增加一个单位,被解释变量将相应地平均变化b1个单位。
3、单选?当总体为未知的非正态分布时,当样本容量n足够大(通常要求n≥30)时,样本均值的期望值为()A.总体均值B.总体均值的1/nC.总体均值的D.总体均值的正确答案:A4、判断题变量“性别”和变量“受教育程度”属于数值型变量。
()正确答案:错参考解析:“性别”只是说明事物类别的名称,属于分类变量;“受教育程度”是说明事物有序类别的名称,属于顺序变量。
5、多选测定现象之间有无线性关系的方法有()。
A.绘制相关表B.绘制散点图C.计算估计标准误差D.计算相关系数E.A现象进行定性分析正确答案:A, B, D, E参考解析:相关表、散点图和定性分析都可对现象之间有无线性关系作出大致的分析,相关系数用具体的数字来描述现象之间的线性相关性,相比之更为精确。
6、多选统计分析数据的方法大体可分为()A.经济统计B.理论统计C.描述统计D.应用统计E.推断统计正确答案:C, E7、单选?在数量指标综合指数中,Σq1p0-Σq0p0表示()。
处理分类变量资料中几种常见统计方法的分析

2 12 配对计数资料 的 2× 表统计方法选择 : .. 2 表 2I 1 中涉及 的是 用两 种方法 对同一批标 本进行 检测 ,
此种 设 计属 配 对设 计 , 分析 方法 不 同于 普通 的 2 其 × 2表资 料 , 可有三 种选 择 。
表 2 用 两 种方 法 植查 同批 样 品结 果
112 有序分类 : .. 各类别之 间有程度的差异, 亦称 等 级资料 【 如表 5表 6表 7 、 、 ) 12 方法 处理 该类 资料 的统 汁方法 很多 , 分析 . 其 步骤大致有 : ①明确每 次拟分析 的分类变量的个数 ... 此时 ( 二项 或多项 ) ②分 类 变 量 的 属性 ( 无序 变 量 或 2 12 1 两种检验方法阳性检出结果的比较 : 是 由于本组 b c 3 , + = l小于 有序变量) ③两分组变量 间是否存在一致性。④ 可选用配对计数 公式 , 根据资料类型正确选择处理方法。
式 反映 。
2钮. 尸> 0 0 5
故不能说 明两种疗法的缓解率不同
收稿 日 : 0 — 2 2 期 2 1 1—5 0 作者梅介: 亲清( 1 一) 女 江瑞安人 , 5 , 新 讲师
2 123 关联程度与方向:
: 一
: 兰
a- c ) 十c ( 儿 +d ( 4 J h十d j
2 分析与 讨论
4 , 0例 则应选 用校 正公 式 :
业 = -I 9 . 2 0
.
2 1 = 项分 类资料 统计 方法 的选择
可认 为两 种 阳性 检 出 率存 在差 别 , 光抗体 法 荧
2 11 普通 2 2 × 表分类资料统 计方法 的选择 : 表 1] 1中资料属二项分类 , 由于单纯化疗组缓解项其理
statistica 全套教程包括数据挖掘
BASIC STATISTICS AND TABLES ............................................ 错误!未定义书签。
Basic Statistics and Tables--Descriptive Statistics......................... 错误!未定义书签。
Basic Statistics and Tables--Correlation Matrices............................. 错误!未定义书签。
Basic Statistics and Tables--t-Test, Independent, by Groups......... 错误!未定义书签。
Basic Statistics and Tables--t-Test for Independent Samples, by Variables . 错误!未定义书签。
Basic Statistics and Tables--t-Test, Dependent samples................... 错误!未定义书签。
Basic Statistics and Tables--t-Test, Single Sample........................... 错误!未定义书签。
Basic Statistics and Tables--Frequency Tables..................................... 错误!未定义书签。
Basic Statistics and Tables--Breakdown and One-Way ANOVA............... 错误!未定义书签。
Basic Statistics and Tables--Crosstabulation Tables......................... 错误!未定义书签。
常用多变量统计分析方法简介
X3
X4
-0.27059
0.6382
-0.33948
0.39774
bj b j
l jj lYY
bj
l jj /(n 1) lYY /(n 1)
bj
Sj SY
28
偏回归系数
偏回归系 数标准误
标准偏回归系数
29
(三)计算相应指标,对模型的拟合效果进行评价
各自变量的参数估计
对偏回归系数 的假设检验
26
3、标准偏回归系数 多元线性回归方程中,各自变量的单位不同,其偏回 归系数之间是无法直接比较的。需要对偏回归系数标 准化,以消除量纲的影响。 标准化的偏回归系数称为标准偏回归系数(standard partial regression coefficient) 。标准偏回归系数 bi' 与
F3 4.968 , F4 6.883
23
②偏回归系数的假设检验— t 检验
t 检验法与方差分析法完全等价, bi 公式为: t , n m 1 SEbi 式中 bi 是偏回归系数的估计值, SE (bi ) 是 bi 的标准误。
SE (bi ) C ii MS 剩余 ,其中 Cii 是系数矩阵 A 的逆矩阵中对角线上的元素。
12
例16.1
27名糖尿病患者的血
清总胆固醇(x1)、 甘油三酯(x2)、空
腹胰岛素(x3)、糖
化血红蛋白(x4)、 空腹血糖(y)的测量
值列于表中,试建立
血糖与其它几项指标 关系的多元线性回归
方程。
13
各变量的离均差矩阵
14
求解后得 b1 0.1424, b2 0.3515, b3 0.2706, b4 0.6382
类别变量的结构方程模型及其应用_王欢
· 522·
中国卫生统计 2012 年 8 月第 29 卷第 4 期
类别变量的结构方程模型及其应用
王 欢
1
*
韩
海
1
蔡绍晖
1
梁
巧
1
吴肖蒙
1
王波栋
1
张志敏
1
柳士顺
2△
【提 要】 目的 探讨类别变量的结构方程在实际问题中的应用 。 方法 运用 LISREL 软件中的类别变量分析技 术, 对 452 个关于生活方式与健康的调查样本进行了结构方程模型分析 。结果 量表中反映生活方式的 8 个条目一致地 此因子与抑郁和焦虑呈现显著负相关关系, 表明生活方式越健康产生精神障碍的几率就 聚合为生活方式这一潜在因子, 越低。结论 观测变量的类型是结构方程建模必须予以重视的关键要素之一 。 【关键词】 结构方程模型 类别变量 生活方式 抑郁 焦虑
与建立在连续变量基础之上的结构方程模型不 同, 类别变量的结构方程模型 ( structural equation model with categorical observed variables) 中均值、 方差和协 。 方差变得没有意义 如果仍然运用以积差相关系数矩 阵为基础的分析方法, 就会导致不正确的结果和无效的 结论, 因此, 对类别变量的结构方程模型的分析需要完全 不同的统计技术来完成。 类别变量结构方程模型的分析方法 结构方程模型又称为协方差结构分析 ( covariance structure analysis ) , 其基本思想就是用样本的方差协 方差矩阵 ( 以下简称协方差矩阵 ) 去拟合根据研究假 协方差矩阵是结构方 设推导出的协方差矩阵。 可见, 程模型的分析基础。类别变量结构方程模型是基于多 项相关系数的协方差矩阵。模型的参数估计方法使用
8假设的检定:两个变项之相关
第三节 单因方差分析与F检定
分析一个定类变项(X)与一个定距变项(Y)的关系可用相关比率测量法 求出相关的程度
随机样本如何推断总体?——常用的是单因方差分子中的F检定,其目的是 要推算在各组总体中的均值是否相等,它是参数检定法的一种。
F检定:
1、适用条件:(1)随机样本;
(2)有一个变项是定距变项;
有相当一部分级序相关测量法,如dy系数和肯德尔的tau系数的计算公式 都是以S=Ns-Nd作为分子,因此它们都可以通过S的检定来推论总体的情 况。
总体中两定序变量相关性测量法 Kendall’s tau-b 系数: 取值范围在-1~+1之间,正负符号代表相关方向。绝对值越接近1,变量的
相关性越强。通常用于方形列联表。 Kendall’s tau-c系数: 取值范围在-1~+1之间,绝对值越接近1,变量的相关性越强。通常用于任
第五节 非参数检定:U检定与H检定
1、参数检定法与非参数检定法
参数检定法:Z、t、F 等。皆要求总体具备某些特殊条件,如正态分布、相 同方差等。
非参数检定法:2检定、U 检定法等。对总体无特别要求,所以又称为分布 自由检定法。
2、2检定法最适用检定两个定类变量的关系,有时也用于检定一个定类变量 与一个定序变量的关系,但牺牲了定序变量的一些性质。较适合的办法是 当检定一个二分变量与定序变量的相关关系时用U检定法,当检定三个或三 个以上的组在级序上的差异时,用H检定法。
以上但中相关测量法的系数值愈大,表示两个变项的相关程度愈强。 这三种系数值都没有消减误差比例的意义
如果是2Xk或kX2表, 系数值才由0~1;
C系数值最小为0,但上限视表的大小而定,表愈大,上限愈接近1; V系数值由0~1,不受表的影响。故最适用于社会学研究。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
McNemar test
實驗後
是
否
是
A
實驗前
否
C
B
A+B
D
C+D
A+C
B+D
N
2 (B C)2
BC
修正後: 2 (| B C | 1)2
BC
範例 4:
某研究者想瞭解80名護理新進人員職前 教育,對肺結核患者是否需採取『耐酸 性桿菌隔離』的認知,採用在授課前後 兩次測量其資料如下:
範例 4:
授
是
課
前
否
合計
授課後
是
否
11
2
47
20
58
22
合計 13 67 80
計算結果:
2 (B C)2 41.33
BC
修正後: 2
(|
B C | 1)2 BC
39.51
If =0.01 2 (1) 6.63
2 41.33 6.63 or 2 39.51 6.63
所以就是拒絕虛無假設,意即職前教育改變了 新進人員的隔離技術觀念
使用 McNemar test 要注意是否為兩相 依樣本(即相同的人,在不同時間做測 量或配對資料)。
McNemar test
適用條件:
1.類別變項----類別變項 2.兩相依樣本 3.僅適用於2*2的表格 4.樣本是從母群體中隨機抽樣
McNemar test
假設檢定: H0:實驗前後,選擇『是』的百分比沒有改變 H1:實驗前後,選擇『是』的百分比會有改變
檢定程序: 檢定實驗前後,選擇『是』的百分比是否沒 有改變?