祝建华(竹家庄)统计学笔记整理
统计与知识点归纳总结

统计与知识点归纳总结一、引言统计学是一门研究数据收集、分析和解释的科学。
它在各个领域均有着广泛的应用,包括商业、科学、医学、政府等。
统计学的发展为人们提供了更全面、准确的信息分析方法,进而有助于人们做出更好的决策。
在这篇文章中,我们将从统计的基本概念、常见的统计方法、统计学的应用等方面进行总结和归纳。
二、统计的基本概念1. 数据与变量在统计学中,数据是指任何可以观测或测量的信息,可以是数字、文字、图像等形式。
而变量是数据的一个特性,可以根据其性质分为定性变量和定量变量。
定性变量是指描述性质或类别的变量,如性别、婚姻状况等;定量变量是指能通过数值来描述的变量,如身高、体重等。
2. 数据的描述统计学通常使用一些统计量来描述数据的特征,常见的统计量包括均值、中位数、众数、标准差、方差等。
这些统计量可以帮助人们更直观地了解数据的分布特征。
3. 概率概率是统计学中一个重要的概念,它描述了事件发生的可能性。
在统计学中,通过计算概率可以对事件的发生进行预测,是很多统计方法的基础。
三、常见的统计方法1. 描述统计描述统计是统计学中最基本的方法之一,它主要用于对数据的特征进行描述和总结,包括数据的中心趋势、数据的离散程度等。
常见的描述统计方法包括均值、中位数、众数、频数分布等。
2. 推断统计推断统计是通过对样本数据进行分析,来对总体进行推断的一种统计方法。
常见的推断统计方法包括假设检验、置信区间估计等。
这些方法能够帮助人们更准确地进行总体特征的推断。
3. 回归分析回归分析是一种用于描述和预测变量之间关系的统计方法。
它能够通过建立数学模型来描述自变量和因变量之间的关系,并用于预测未来的值。
常见的回归分析方法包括线性回归、多元回归等。
4. 方差分析方差分析是一种用于比较多个群体均值是否相等的方法。
通过方差分析可以确定不同因素对于观测变量的影响情况,是实验设计中的重要统计方法。
四、统计学的应用统计学在各个领域都有着广泛的应用,下面我们将对其中一些领域进行介绍:1. 商业在商业领域,统计学被广泛应用于市场调研、销售预测、用户行为分析等方面。
统计学整理重点笔记

工人数
平均工资(元)
工资额(万元)
f0
f1
x0
x1
x0f0
x1f1
x0f1
(甲)
(1)
(2)
(3)
(4)
(5)
(6)
(7)
技工
300
400
2800
3000
84
120
112
徒工
200
600
1600
1800
32
108
96
共计
500
1000
116
228
208
答案:
区间预计案例
耐用时数
组中值(x)
元件数(f)
当前用重复抽样办法,规定在95.45%概率保证下,平均收入极
限误差不超过20元,恩格尔系数极限误差不超过4%,求样本必要单位数。
答案如右图
105
8
840
800
110—120
115
2
115
100
共计
—
15
1050
1000
答案:
日产量
(公斤)
工人数(人)f
组中值 (公斤)x
xf
20—30
10
25
250
30—40
70
35
2450
40—50
90
45
4050
50—60
30
55
1650
共计
200
—
8400
答案:
某地区国内生产总值资料 单位:亿元
18530.7
xf
900如下
875
1
875
900——950
统计学知识点总结

统计学知识点总结好嘞,以下是为您总结的统计学知识点,希望能对您有所帮助!咱们先来说说啥是统计学。
统计学呀,简单来说,就是一门研究如何收集、整理、分析和解释数据的学问。
它就像是一个神奇的工具,能帮我们从一堆看似杂乱无章的数据中找出有用的信息和规律。
比如说,咱们去超市买东西,收银员会记录每种商品的销售数量和金额,这其实就是在收集数据。
然后超市经理会把这些数据整理起来,看看哪些商品卖得好,哪些卖得不好,这就是整理数据。
接着,他们会分析为什么某些商品受欢迎,是因为价格便宜,还是质量好,这就是分析数据。
最后,根据分析的结果,决定要多进哪些货,少进哪些货,这就是解释数据的作用啦。
咱们从小学开始,其实就已经在不知不觉中接触到统计学的一些小知识啦。
比如说,老师会让咱们数一数班级里有多少男生,多少女生,这就是在收集简单的数据。
到了初中,统计学的知识就更深入一些啦。
咱们会学习如何画统计图,像什么条形统计图、折线统计图、扇形统计图等等。
比如说,要统计一个班级同学的身高情况,咱们就可以用条形统计图,一眼就能看出哪个身高段的同学最多。
要是想看看一个同学的成绩变化趋势,折线统计图就派上用场啦,能清楚地看到成绩是上升还是下降。
高中的时候,统计学就更复杂也更有趣啦!咱们会学习到一些重要的概念,比如平均数、中位数、众数。
就拿平均数来说吧,有一次我们班组织了一场数学测验,大家的成绩出来后,老师就给我们计算了平均数。
结果发现,全班的平均成绩是 85 分。
这能让我们大概了解全班同学的总体水平。
中位数也很有意思。
还是说那次数学测验,把大家的成绩从小到大排列,正中间的那个数就是中位数。
如果有偶数个成绩,那就取中间两个数的平均值。
比如说,成绩从小到大排列是 60、70、80、90、100、110,那中位数就是 85 分。
众数呢,就是一组数据中出现次数最多的那个数。
比如成绩分别是80、85、85、90、95、95,那众数就是 85 分。
除了这些,高中还会学到方差和标准差。
统计知识点归纳总结手写

统计知识点归纳总结手写一、基本概念1.1 总体与样本总体是指研究对象的全体,而样本是从总体中抽取出来的一部分。
通过对样本的研究,可以推断出总体的特征,从而进行统计推断。
1.2 参数与统计量参数是用来描述总体特征的数值,比如总体均值、方差等;而统计量是用来描述样本特征的数值,比如样本均值、样本方差等。
通过对统计量的计算和分析,可以推断出参数的估计值。
1.3 随机变量与概率分布随机变量是指在一定概率分布下可以取任意值的变量,而概率分布则描述了随机变量的取值规律。
常见的概率分布包括正态分布、二项分布、泊松分布等。
二、描述统计2.1 数据的表示与描述描述统计是对数据进行整理、汇总和展示的过程,包括均值、中位数、众数、标准差等统计指标。
常见的数据表示方式包括表格、图表和描述性统计量。
2.2 统计图表统计图表是一种直观的数据表示方式,包括条形图、饼图、折线图、散点图等。
通过图表的展示,可以更直观地看出数据的分布和趋势。
2.3 相关系数与回归分析相关系数用于描述两个变量之间的线性关系强度,常见的相关系数包括皮尔逊相关系数、斯皮尔曼相关系数等;而回归分析则用于研究自变量和因变量之间的关系,并建立相应的回归模型。
三、概率论3.1 概率的基本概念概率是描述事件发生可能性的数值,常用的概率计算方法包括古典概率、几何概率和条件概率等。
3.2 随机变量与概率分布在概率论中,随机变量和概率分布的概念同样也是十分重要的,需要对不同类型的概率分布进行理解和应用。
3.3 大数定律与中心极限定理大数定律和中心极限定理是概率论中的两个重要定理,它们分别描述了大样本下样本均值的稳定性和样本均值分布的收敛性。
四、统计推断4.1 参数估计参数估计是利用样本统计量对总体参数进行估计的过程,常用的参数估计方法包括点估计和区间估计。
4.2 假设检验假设检验用于检验总体参数的统计假设是否成立,包括设定原假设和备择假设、选择检验统计量、确定显著性水平等步骤。
统计必背知识点总结

统计必背知识点总结1. 总体和样本统计学的研究对象一般分为总体和样本。
总体是指所有感兴趣的个体的集合,而样本是从总体中抽取出来的一部分个体。
通过对样本进行研究分析,可以对总体做出一些推断和预测。
2. 描述统计描述统计是对数据进行总结和展示的方法。
其中包括均值(平均值)、中位数、众数、标准差、方差等。
这些统计量可以帮助我们了解数据的分布、集中趋势和离散程度。
3. 概率概率是统计学的重要概念之一,它可以帮助我们理解随机现象的规律。
概率描述的是某种事情发生的可能性,它可以用来进行风险评估和决策分析。
4. 随机变量和概率分布随机变量是对随机现象的数值表征,它可以是离散的(比如掷骰子的结果)也可以是连续的(比如身高、体重)。
概率分布描述了随机变量的取值和对应的概率,常见的概率分布包括正态分布、均匀分布、指数分布等。
5. 统计推断统计推断是从样本数据中对总体参数进行推断的过程。
包括点估计和区间估计。
点估计是用样本数据来估计总体参数的具体数值,区间估计则是通过置信区间来估计总体参数。
6. 假设检验假设检验是统计推断的一种方法,它用来检验一个关于总体参数的假设是否成立。
常见的假设检验包括单样本均值检验、双样本均值检验、方差检验等。
7. 回归分析回归分析是一种用来研究变量之间关系的统计方法。
包括简单线性回归、多元线性回归、逻辑回归等。
回归分析可以帮助我们理解变量之间的因果关系,并进行预测和控制。
8. 方差分析方差分析是一种用来比较不同群体之间平均值差异的统计方法。
它可以用来分析实验数据,比较不同处理组之间的效应是否显著。
以上就是统计学的一些基本知识点总结,掌握这些知识可以帮助我们更好地理解数据背后的规律和趋势,做出更加明智的决策。
希望对你有所帮助。
统计初步知识点总结

统计初步知识点总结一、统计学的基本概念1. 统计学的定义统计学是一门研究数据收集、处理、分析、解释和推断的学科。
它通过收集大量的数据,并利用数理统计方法对数据进行分析,从而得出有关总体特征的结论。
2. 统计学的发展与应用统计学起源于古代的人口普查和财产统计,随着科学技术的进步,统计学逐渐发展成为一门独立的学科。
它在经济学、医学、社会学、政治学等领域都有着广泛的应用,成为这些领域中不可或缺的工具。
3. 统计学的基本概念(1) 总体和样本:总体是指研究对象的全体,样本是从总体中抽取出来的一部分。
通过对样本的研究,可以对总体做出推断。
(2) 参数和统计量:参数是总体特征的数值度量,统计量是样本特征的数值度量。
通过统计量对参数进行估计。
(3) 变量和数据:变量是统计研究的对象,数据是对变量进行观测和测量的结果。
(4) 随机变量和概率分布:随机变量是随机现象的数学模型,概率分布描述了随机变量的取值规律。
二、统计方法1. 数据的收集数据的收集是统计学研究的基础,它包括实地调查、实验观察、问卷调查、文献资料收集等方式。
合理、科学的数据收集是统计研究的前提和基础,对于数据的真实性和可靠性至关重要。
2. 数据的描述数据的描述包括数据的整理、汇总和展示,通过频数分布表、统计图表等方式对数据进行直观展示,从而揭示数据的分布特征和规律。
3. 统计推断统计推断是利用样本数据对总体特征进行推断的过程,包括参数估计和假设检验两个方面。
(1) 参数估计:通过样本数据对总体参数进行估计,得到对总体的估计值和置信区间估计。
(2) 假设检验:根据样本数据对总体参数提出假设,并通过统计方法对假设进行检验,判断原假设是否成立。
4. 相关性分析和回归分析相关性分析是研究变量之间相关关系的方法,通过相关系数来度量两个变量之间的相关程度。
而回归分析则是研究变量之间的因果关系,并用回归方程来描述变量之间的函数关系。
5. 方差分析和协方差分析方差分析是比较多组样本均值之间差异的一种统计方法,协方差分析则是研究两个或多个变量之间的协方差关系。
统计学类专业复习重点梳理与分析

统计学类专业复习重点梳理与分析统计学是一门具有广泛应用领域的学科,涵盖了许多重要的知识点和技能。
为了帮助同学们更好地进行复习,本文将系统地梳理和分析统计学类专业的复习重点。
通过对不同主题和内容的梳理和分析,希望能帮助同学们更好地理解和掌握统计学的核心知识。
一、描述统计学描述统计学是统计学的基础,包括对数据的收集、整理、汇总和可视化等技巧。
其中,收集数据的方法包括随机抽样、问卷调查等;整理数据的方法包括数据清洗、处理异常值等;汇总数据的方法包括计算平均数、中位数、众数等;可视化数据的方法包括绘制直方图、散点图、箱线图等。
同学们在复习时,应注意理解和掌握这些技巧的具体操作方法,并能够根据实际情况进行数据的处理和分析。
二、概率论与数理统计概率论与数理统计是统计学的核心内容,包括了概率的基本概念、随机变量及其分布、多个随机变量之间的关系等。
在复习时,同学们应重点关注以下几个方面的内容:1. 概率计算:理解和掌握概率的基本计算方法,包括加法原理、乘法原理、条件概率等。
2. 随机变量:了解随机变量的概念和性质,掌握常见离散型和连续型随机变量的分布特征,如二项分布、正态分布等。
3. 多个随机变量:理解和掌握多个随机变量之间的关系,包括相互独立、相关性等概念,以及相关系数、协方差等的计算方法。
4. 统计推断:了解统计推断的基本思想和方法,包括参数估计、假设检验等。
掌握常见的估计方法,如最大似然估计、置信区间等。
三、统计计算与建模统计计算和建模是统计学的实践部分,包括了使用计算机软件进行数据分析和建立统计模型等。
在复习时,同学们应注重以下几个方面的内容:1. 统计软件:熟悉并掌握常用的统计软件,如R、SPSS等。
了解软件的基本操作方法,包括数据导入、变量命名、运算和图形绘制等。
2. 数据分析:了解常用的数据分析方法,如方差分析、回归分析等。
理解和掌握不同方法的应用场景和具体计算步骤。
3. 统计建模:理解统计建模的基本原理和步骤,包括变量选择、模型拟合和模型评估等。
统计学初步知识点归纳总结

统计学初步知识点归纳总结一、概率1.1 概率的定义概率是描述事件发生可能性的数值,通常表示为介于0和1之间的一个数。
概率越大,表示事件发生的可能性越大;概率越小,表示事件发生的可能性越小。
1.2 概率的计算概率的计算可以通过经典概率、几何概率和统计概率等方法来实现。
其中,经典概率是指基于事件出现的可能性来计算概率;几何概率是指基于事件的空间形状和大小来计算概率;统计概率是指基于样本观察得出的事件发生频率来估计概率。
二、随机变量和概率分布2.1 随机变量随机变量是指在一次实验中可能取得一系列数值的变量,其取值是由随机性决定的。
随机变量可以分为离散随机变量和连续随机变量两种类型。
2.2 概率分布概率分布是描述随机变量在取值范围内各个取值的概率的分布规律。
常见的概率分布包括离散型概率分布(如二项分布、泊松分布)和连续型概率分布(如正态分布、指数分布)等。
三、统计量3.1 样本均值和总体均值样本均值是指从一个样本中计算得到的平均值,用来估计总体的平均值。
总体均值是指对整个总体的平均值进行估计。
3.2 方差和标准差方差是一组数据与其均值之间的离差的平方和的平均值,用来衡量数据的离散程度。
标准差是方差的平方根,用来度量数据的波动程度。
3.3 相关系数相关系数是用来衡量两个变量之间关联程度的指标,取值范围为-1到1。
当相关系数接近1时,表示两个变量呈正相关关系;当相关系数接近-1时,表示两个变量呈负相关关系;当相关系数接近0时,表示两个变量之间没有线性相关关系。
四、抽样与估计4.1 简单随机抽样简单随机抽样是指从总体中以相同的概率随机选择样本的方法,从而确保样本的代表性和可比性。
4.2 抽样分布抽样分布是指在随机抽样下统计量的分布。
当样本量足够大时,抽样分布可以近似服从正态分布。
4.3 参数估计参数估计是指利用抽样数据估计总体参数的方法。
常见的参数估计方法包括点估计和区间估计。
五、假设检验5.1 假设检验的基本步骤假设检验是指通过统计推断的方法,对总体参数提出假设并进行检验的过程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
12月12日为何回归方程的常数是负值?L君@ 2009-11-18:老师,您好,我在做毕业论文。
问题简化后说就是:有两个不同组别的多元线性回归方程进行比较y1=a1+b1X1+c1X2+d1X3y2=a2+b2X1+c2X2+d2X31,2为两个不同的大区域(每个大区域都有40个小区域作为观测值);y为污染总量,X1, X2, X3为三种类型的污染源面积(工厂,工地,居民区),b, c, d 为三种污染源的单位面积污染量(在模型里都为正数)。
现在需要比较1,2两地的污染状况,三种类型污染源的污染贡献量等。
我得到的两个回归方程,b、c、d都为正数,但是常数项a1为正,a2为负。
这样对单位污染量的比较有影响吗?可以这么分析吗?在这个分析中,可不可以给出非标准回归系数的回归方程,然后用标准回归系数(常数项为0)解释贡献量?但是单位面积污染量要继续用于后续计算的话,是用标准还是非标准的回归系数呢?但是,如果y1=30+2X1+3X2+4X3、y2=-300+20X1+30X2+40X3,在两个区域,2区域的单位面积的效益就明比1大,但是在3类污染源面积相同的情况下,y总值是一样的?这个就不太好解释了。
其实就算是都为正,但是相差较大的话,也不能比较区域1,2的单位面积效益大小?怎么解决这个问题呢?还有,这个模型的R平方,还有sig等检验系数有的不合格。
之后我改用偏最小二乘法,用SPSS和SIMCA-P计算结果都和多元线性回归得到的方程一样。
那是不是随便用哪个结果都行呢?庄主@ 2009-12-06:你提到了好几个问题,其中第一题:两个样本的所有自变量和因变量(污染值或面积)取值都应该是非负值、或许都是正值(960万平方公里之内哪里还有0污染的净土?),但是两个对应回归方程的常数项a1为正、a2为负。
你问:这对样本之间“单位污染量”的比较有影响吗?我这学期教的同学中也有问过:“变量全部为正值、为什么回归方程常数为负值?我觉得后者问题更有普遍意义,所以本贴主要谈这个问题,你的其余问题放在最后简单说一下。
我们知道,常数项b0(你用a来表示,为了与本庄其它帖子一致,这里用b0)反映的是当所有自变量分别取值为0时因变量Y的值。
但是,在很多实际研究中,出现负值的b0是一件很奇怪或很尴尬的事。
在本例中,如果自变量X1-X3(工厂、工地、居民区)没有污染面积,那么该区域不仅没有任何污染而且还会“负污染”(世上真有比蓝天、绿地、白云更圣洁的境界?),真的很奇怪。
其实,这仅仅是有关变量的取值区间及其关系强度之间的特定搭配而造成的错位而已。
我们先从下图中获得一些直观的认识。
图中的两条线分别代表一个回归方程,其中A线是向上的(即b1为正),但它在X = 0时Y < 0(即b0为负);相反,B线是向下的(即b1为负),而它在X = 0时Y < 0(即b0也为负)。
说明b0的取向与b1没有直接关系。
另外,A的数据可以局限在A1-A2范围内,即X和Y全部为正值;也可以局限在A3-A4范围内,即X和Y全部为负值。
反之,B 的数据可以局限在B1-B2范围内,即X为全为负值而Y全为正值;或者局限在B3-B4范围内,即X全为正值而Y全为负值。
当然,如果数据局限在A2-A3或B2-B3范围内,X和Y即可为正也可为负。
以上六种情况,穷尽了X和Y的可能取值,但其回归方程的常数b0总是为负,说明b0的取向与X和Y的取值范围也没有直接关系。
那么,b0的取向到底受什么影响?其中有什么规律可循?我查了一些教科书,希望找到一个权威的说法来引用一下,可惜还没有查到(也许我查的不够广泛和彻底)。
以下是我的推导,尚未得到“权威”认可,仅供大家参考。
我们从简单回归方程出发:Y = b0 + b1X (1)如重新组织公式1即有:b0 = Y – b1X (2)我们知道,如果b1已知(通过回归分析而得知)、就可以将Y和X的任意一对常数(如两者的均值、最大值、最小值、均值之一个标准差之上或之下、等等)分别代入公式2而求出b0。
这里,我们分别用Y和X的最小值(记为“Ymin”和"Xmin”)来代入公式2:b0 = Ymin – b1Xmin (3)很显然,Ymin、Xmin和b1可以取任何值而公式3均可成立,这与我们从上图得到的直观理解是一致的。
更重要的是,我们可以从公式3推导出b0取负值的条件:如果b0 < 0, 那么Ymin – b1Xmin < 0, 也即b1Xmin > Ymin (4)或者,b1 > Ymin/Xmin (5)公式4告诉我们,如果Ymin小于Xmin与b1的乘积,那么该回归方程的常数b0为负值;而公式5则直接显示,如果Ymin与Xmin的比值小于b1,那么b0为负值。
(当然,我们将公式4和5中的“>”改成“<”或“=”,则可得到b0为正值或为0的条件,但因为后两者属于“正常”现象,所以不再赘言。
)好了,我希望大家至此明白b0为负实属正常情况,即不代表任何“负相关”、也不反映任何数据问题,而是我一开始说的那样:“有关变量的取值区间及其关系强度之间的特定搭配而造成的错位而已”。
所谓“错位”,其实只是“错觉”而言。
当然,这种错觉有时很难向读者交代或解释清楚,尤其是在A1-A2数据的情况下,出现一个负b0总会令人质疑的。
有何解决方法?有,很简单,就是对X取中值(centering,详见本庄前贴)。
X取中值后,回归方程的斜率b1保持不变,但b0会变,其已经不再是X = 0时Y的值,而是X=均值时Y的值。
如果数据是A1-A2段的话,那么X的均值一定是正的,所以b0也一定为正(见下图,其中A1’和A2’分别为A1和A2的取中值)。
最后简单回答一下L君的其它问题。
一、虽然你的a1为正、a2为负,但两个方程仍然是直接可比的。
a1为正、a2为负的意思是,区域1的“污染起点”(即在没有受到X1-X3的任何影响下)高于区域2(也许因为还有其它污染来源)。
当然,如果你对两个样本的X1-X3都取中值后,a1和a2应该全部为正,看起来好像更可比,但它们之间的差别应该与现在的差别完全一样。
当然,取中后的a1和a2的解读有所变化,反映的是自变量X1-X3各自为均值(即工厂、工地和居民区平均污染水平)时该区域的污染总量。
二、比较两个方程,应该用非标准化回归系数(b)、而不是标准化回归系数(Beta),因为b反映了X和Y的关系强度,而Beta则是用以下公式从b转换而来:Beta = bSDx/SDy (6)其中SDx和SDy分别是X和Y的标准差。
我们知道,两个样本之间的X或Y 的标准差会因为各自样本大小、异常值(如区域1有一个超大的异常值或区域2有一个超小的异常值)等因素而不同,所以即使两个样本的b相等,它们的Beta 也很可能不等。
所以,比较不同方程之间的Beta是没有意义的。
如果你想比较X1-X3在两个区域的各自独立贡献(net contribution),可以比较每个X与Y的semipartial correlation coefficient之平方(在SPSS回归中叫做PART)。
三、如果你的数据满足了线性回归(OLS)的要求,那么OLS回归的结果是“蓝色的”(best linear unbiased estimate,间称BLUE,即最佳无偏线性估计),所以应该报告OLS回归结果。
12月5日如何提高间接影响模型的效应?hz @ 2009-11-30:我提出了一个理论模型(见下图),假设A通过B和C对D有间接影响。
实证数据表明,A->B、B– C、C–>D的影响都显著,但是三者的乘积(即A–>D的间接影响)却不显著。
另外,A–>D的直接影响也显著。
不知有无方法提高间接影响?是否可以将显著水平从0.05放宽到0.10?庄主 @ 2009-12-04:你的理解对了一部分,即A–>D的间接影响包括A–>B–>C–>D的所有回归系数之连续乘积 (= 0.30 x 0.20 x 0.10 = 0.006)。
但在你的模型中,A->D之间其实有三条间接路径:一是你说的A–>B–>C–>D;二是A–>B->D;三是A–>C–>D (见下图)。
如果你的理论规定A–>D的间接影响只能有A->B->C->D一条路径,是否可以?当然可以。
但你须要预期到如此假设更难被证实。
如果你的理论容许,那么加上A->B->D和A->C->D的间接影响之后会如何?一切取决于A->C和B->D的系数强度。
你可以代入一些可能发生的数值来计算A->D的总间接影响。
如,1.A->B = 0.20和B->D=0.20,总间接影响=0.086,可能不显著,同时也小于A->D的直接影响;2.A->B = 0.30和B->D=0.30,总间接影响=0.126,虽然仍小于A->D的直接影响,但可能显著,属于“弱间接影响”(参见前贴“如何检验两个中介变量的效应? ”/2009/04/blog-post_25.html或/blog/cns!3F49BBFB6C5A1D86!1159.entry);3.A->B = 0.40和B->D=0.40,总间接影响=0.166,可能显著,并大于A->D的直接影响,属于“强间接影响”。
当然,基于你现有的回归系数均在0.10到0.30之间,我怀疑即使将后两条间接路径等间接影响(假定两个未知的系数也在0.10到0.30之间)加进去,总间接影响还可能不显著。
总之,间接影响模型在理论上很诱人、但在实证上要求很高,尤其是多阶段间接影响模型,一般都很难证明。
最后,你问是否可以将显著水平条件放宽到0.10?答案是否定的。
一、统计决策的显著水平(α)是在检验之前就要设置的,而不能在检验之后、因实证显著水平p大于α而将α提高。
二、α一般设为0.05,代表犯Type I 错误的概念有5%,如果提高到0.10,则将Type I 错误提高到10%,除了初步的探索性研究之外,这种错误率太高。
三、结构方程模型中的回归系数已经修正了测量误差,所以一般不应该再放宽其显著水平。
11月15日如何确定名目变量交互项的参照组是什么?台灣吳同學 @ 2009-11-13:老師您好,我是台灣的學生,對您的統計解釋相當有興趣。
最近我遇到了一個問題,我嘗試把他說清楚,希望您可以幫我解惑。
在我的logit model裡頭,有兩個類別變數,分別為性別與教育程度。
其中,性別是男女二分變數(男=1,女=0),而教育程度則分為低,中,高三類(中=0).我的依變數是收入,分為低與高兩種(低=0).假設,我想探討性別與教育程度的交互作用(性別X教育程度),我的交互作用項只能把1.男X低教育和2.男X高教育放入模型中,請問我的交互作用項在這時候的參照類是什麼?是1.男X中教育? 還是2.女X中教育?另外,也想知道要如何解讀交互作用項B和EXP(B)的意義。