医学统计学解释28
医学统计学

医学统计学医学统计学是应用统计学原理和方法来分析、解释医学数据的学科。
医学统计学涉及的内容有很多,包括疾病的发病率、死亡率、治疗效果、药物试验、临床试验等。
医学统计学的应用范围非常广泛,它可以帮助医生和研究者更好地了解疾病的发病机制、诊断标准、治疗效果和预后预测等方面,从而更好地开展医学研究和医疗工作。
医学统计学的基本概念在医学统计学中,有许多基本概念需要了解,以便更好地理解数据的含义。
以下是一些常见的医学统计学概念:1. 样本和总体在医学研究中,我们通常不可能研究每一个人,因此我们只能从总体中抽取一部分人作为样本,然后对它们进行研究。
所以,在医学统计学中,样本就是从总体中抽取的一部分人或物体。
2. 变量变量是研究中需要测量和分析的事物,例如人的年龄、身高、体重等,还有许多与医学有关的变量,如血糖、血压、胆固醇、白细胞计数等。
3. 参数参数是描述总体的特征的量,例如总体的平均数、标准差等。
4. 统计量统计量是描述样本的特征的量,例如样本的平均数、标准差等。
5. 分布分布是指变量在总体或样本中的出现频率和分布情况,可以利用概率分布来描述。
医学统计学的基本方法在医学研究中,我们通常采用以下几种方法来分析数据:1. 描述统计描述统计是对样本的基本特征进行总结和描述的方法,包括常见的测量指标如平均数、中位数、众数、方差和标准差等。
2. 推断统计推断统计是通过样本估计总体参数的方法。
常见的推断统计方法包括假设检验、置信区间和方差分析等。
3. 多元统计多元统计是通过同时考虑多个变量来分析数据的方法。
它包括回归分析、因子分析、聚类分析等方法。
临床试验临床试验是指为了评价新药物或治疗方法在人体中的疗效和安全性而进行的研究。
在临床试验中,医学统计学起着非常重要的作用。
医学统计学可以帮助选择合适的样本、制定合理的试验方案、确定研究指标、提高数据质量、分析数据等。
例如,在药物研发中,我们需要先进行前期实验,确定药物的毒性、吸收、分布、代谢和排泄等特性。
医学统计学考试必会名词解释

,更确切地说,就是同质的所有观察单位某种观察值(变量值)的集合。
,观察单位数无限。
,其实测值的集合。
样本应具有代表性。
研究者则应对每个观察单位的某项特征进行测量与观察,这种特征称为变量。
,亦称为资料。
,可以控制的主要因素尽可能相同。
,就是对每个观察对象的观察指标用定量方法测定其数值大小所得的资料,一般用度量衡单位。
,就是先将观察对象的观察指标按性质或类别进行分组,然后计数各组该观察指标的数目所得的资料。
,常用P表示。
(用希腊字母代表),如总体均数μ,总体率л,总体标准差σ等。
,称为统计量。
(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。
(变量取值为一定范围内的任意值)的资料,其结果表达的限制因素就是测量仪器或方法的灵敏度。
,表示观察值在各组内出现的频繁程。
,即为频数分布表,简称频数表。
,左右两侧的频数基本对称。
,集中位置偏向一侧。
若集中位置偏向数值小的一侧(左侧),称为正偏态;若集中位置偏向数值大的一侧(右侧),,在医学领域中常用的平均数有算术均数、几何均数及中位数。
,描述一组同质计量资料的平均水平。
统计学中常用希腊字母μ表示总体均数,用x表演示样本均数。
,但经过对数变换后呈正态分布或近似正态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均数描,即全部观察值中最大值与最小值之差,用符号R表示。
极差大,说明变异程度大;反之,说明变异程度小。
x百分位置上的数值,用符号表示为P x。
简记为CV),亦称离散系数,为标准差与均数之比。
写成公式为:CV=S/X×100%,常用于(1)比较计量单位不同的几组资料的离散程;(2),也称正常值。
,生物医学数据并非常数,而就是在一定范围内波动。
,随机抽样引起的样本统计量与总体参数间的差异称为抽样误差。
样本均数的标准差称为标准误 ,其计算公式为。
,就是统计推断的一个重要方面。
,称为点值估计。
,指按预先给定的概率估计未知总体均数的可能范围。
,用α表示,就是预先规定的概率值,在实际工作中一般取α=0、05。
医学统计学名词解释简答

●【抽样误差】由抽样引起的样本统计量与总体参数间的差别。
原因:个体变异+抽样 表现:样本统计量与总体参数间的差别、不同样本统计量间的差别。
抽样误差是有规律的 ●【可信区间CI 】区间估计是按一定的概率或者可信度1-α,用一个区间估计总体参数所在的范围CI ,这个范围成为可信度为1-α的可信区间,置信区间。
影响:可信度、个体差异、样本含量 两要素:可信度1-α、可靠性;精确性可信度为95%的CI 涵义:每100个样本计算95%的CI ,平均有95%的CI 包含了总体参数。
95%,指方法本身,而非某个区间。
该区间包含总体参数,可信度为95%●【总体和样本】根据研究目的确定的同质的所有观察单位的某种变量值的集合。
样本是指在研究总体中随机抽出一部分个体进行观察或测量,这些个体的测量值构成的集 ●【参数和统计量】描述总体特征的指标,不变的,固定的,未知的统计量:描述样本特征的指标,变化的,已知的,有误差的●【概率和小概率原理】描述某随机事件发生可能性大小的度量,记做P ,取值0<P <1 小概率原理:P ≤0.05,该事件发生的可能性很小,进而认为在一次抽样中不可能发生 ●【随机】机会均等、随机抽样、随机分组、实验顺序随机●【变异系数CV 】离散系数,标准差S 、均数之比。
用来衡量单位不同的多组资料的变异度、比较均数相差悬殊的多组资料的变异度●【相关系数】两个有直线关系的变量间相关关系的密切程度与相关方向的指标,记做r ,-1≤r ≤1,正、负相关,其绝对值越大表示关系越密切,越接近于0相关越不密切 ●【回归系数】b 回归直线的斜率,自变量增加一个单位,应变量的平均改变量●【标准误】样本统计量的标准差,衡量抽样误差的大小 ●【偏倚】实验中某些非实验因素的干扰所形成的系统误差,歪曲了处理因素的真实效应 ●【一类错误、二类错误】【检验效能】1-β 就是对真实的H 1作出肯定结论之概率●【假设检验中的P 值】从 H0 总体中随机获得等于或大于现有统计量值的概率。
医学统计学 名词解释

29、统计表:是以表格的形式列出统计分析的事物及其指标,它可避免长篇文字叙述,并具体列出数据。
30、统计图:是用点的位置、线段的升降、直条的长短或面积的大小等形式表达统计资料,它可直观醒目地反映出事物间的数量关系。
31、正态分布:靠近均数分布的频数最多,两边频数逐渐减少并且近似对称,这种两头低中间高、略呈钟形、左右近似对称的连续性分布称为~。
4、分类变量/定性变量/计数资料/定性资料:是以定性的方式来表示观察单位某项观察指标,所得的资料 称之为~,无固有度量单位。
5、有序分类/等级资料:是以等级的方式来表示观察单位某项观察指标,所得的资料称之为~,为半定量的观察结果,有大小顺序。
6、同质:是指事物的性标准差:方差是指样本观察值的离均差平方和的均值,方差的正平方根为标准差,表示一组数据的平均偏离程度。
24、变异系数:是指标准差与均数之比,常用百分数表示,没有单位,主要用于度量衡单位不同或均数相差悬殊的几组资料间的比较。
25、相对比:是指A、B两个有联系的指标之比,用于说明A为B的若干倍或百分之几,是对比的最简单形式。
20、平均数:是反应一组观察值的集中趋势、中心位置或平均水平的指标体系,常用的指标有均数、几何均数、中位数。
21、中位数:是将一组观察值从小到大按顺序排列,位次居中的观察值就是中位数,适用于任何分布、开口资料、偏态分布。
22、百分位数:是指一种位置指标,用Px表示,一个百分位数将按大小顺序排列的变量值分为100份,旦论上有x%的变量值比它小,有(100-x)%的变量值比它大,对应x%位次的数值。
7、变异:是指同质的个体之间的差异。
8、总体:是根据研究目的所确定的同质观察单位的全体或集合,分为有限总体和无限总体。
医学统计学名词解释

统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。
总体(population):大同小异的研究对象全体。
更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。
样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利用样本信息可以对总体特征进行推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。
参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间揭示的是按一定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、二项分布法。
置信区间估计总体参数所在范围参数统计(parametric statistics)非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性。
回归系数有单位,而相关系数无单位β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。
医学统计学考试必会名词解释

P表示。
,如总体均数μ,总体率л,总体标准差σ等。
(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。
,称为正偏态;若集中位置偏向数值大的一侧(右x表演示样本均数。
R表示。
极差大,说明变异程度大;反之,说明变异程度小。
x百分位置上的数值,用符号表示为P x。
CV),亦称离散系数,为标准差与均数之比。
写成公式为:CV=S/X×100%,常用于(1)比较计量单位不同的几组资料的离样本均数的标准差称为标准误,其计算公式为。
=0.05。
H0,即“弃真”的错误。
Ⅰ型错误的概率用а表示,若确立检验水准为а=0.05,则犯第一类错误的概率为H0,即“存伪”的错误。
Ⅱ型错误的概率用β表示。
H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。
N(u,б2),经变换后,u服从均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布。
X,它的可能取值是0,1,……n,且相应的取值概率P 叫随机变量服从以n,л为参数的二项分布,记X,它的可能取值为0,1,……n,,且相应取值概率为称随机变量X服从μ为参数M-Friedman在符号检验的基础上提出来的,常称为Friedman检验,又称M检验。
SS e表示。
反映组间变异。
b表示,b的统计意义为自变量x改变一个单位时,应变量y平均变化b个单位。
x对y的线性影响外,其它所有因素对y变异的影响,即在总平方和中无法用x与y的线性关系所能解释的部分y的随机误差。
x,y间的相互关系。
Pearson积矩相关系数,说明具有直线关系的两变量间相关方向与密切程度。
以符号r表示样本相关系数,ρ表示总体相r2表示,它反映应变量y的总变异中,可用回归关系解释的比例,其公式为r2= 。
医学统计学必考的名词解释

医学统计学必考的名词解释医学统计学是一门研究医学数据收集、分析和解释的学科。
在这个领域中,有许多重要的名词需要被掌握和理解。
本文将对其中几个必考的名词进行解释,以助于读者更好地理解医学统计学的核心概念。
一、样本和总体在医学统计学中,样本和总体是两个基本的概念。
总体是指我们想要了解的整个群体,而样本是从总体中选择的一小部分个体。
通过研究样本,我们可以推断总体的特征。
样本应该是有代表性的,并且选择要符合一定的随机原则,以避免观察误差和抽样偏差。
二、建立假设在医学统计学中,我们通常需要提出一个假设来研究和探索问题。
这个假设可以是一个关于总体参数的陈述,我们可以利用样本数据来判断这个假设是否成立。
一般来说,我们提出两个对立的假设,即原假设和备择假设。
原假设通常是一个无关或无差异的假设,而备择假设则是相反的。
三、显著性水平和P值显著性水平是用来评估某个观察结果是否由于偶然误差所导致的概率。
通常情况下,我们会将显著性水平设定为0.05或0.01,代表了我们对接受原假设的程度的容忍度。
而P值则是用来衡量观察结果的统计显著性。
如果P值小于设定的显著性水平,我们就可以拒绝原假设,认为观察结果是有统计学意义的。
四、置信区间置信区间是用来估计总体参数的一种方法。
它给出了一个范围,其中包含了总体参数的真实值的可能性。
置信区间的计算通常基于样本统计量和抽样误差的大小。
一般来说,置信区间的置信水平为95%或99%,意味着在重复抽样的情况下,有95%或99%的置信区间会包含真实值。
五、回归分析回归分析是医学统计学中常用的一种分析方法。
它可以用来探索和预测两个或多个变量之间的关系。
在回归分析中,我们通过建立一个数学模型来描述因变量和自变量之间的关系,并通过拟合该模型来预测未知观测值。
回归分析可以帮助我们理解和解释变量之间的相互作用,对于研究和应用医学中的复杂问题有着重要的意义。
六、生存分析生存分析是一种特殊的统计方法,用于研究在给定时间内发生某个事件的概率。
医学统计学名词解释

统计学(statistics)统计学是关于数据(data)的科学,是从数据中提取信息的一门学科,包括设计、搜集、整理、分析和表达等步骤。
医学统计学(medical statistics)是以医学理论为指导,借助概率论和数理统计的原理和方法研究医学现象中数据的搜集、整理、分析和推断的一门应用学科。
变异(variation)是社会和生物医学中的普遍现象。
变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同。
计量资料measurement data(定量变量quantitative data、数值变量)指对每个观察单位用定量方法测定某项指标所得的数值。
基本特征:①有定量手段或工具;②一般有度量衡单位;③往往带有小数点。
计数资料enumeration (counting) data(定性数据qualitative data、分类资料)指先将观察单位按性质或类别进行分组,然后清点各组观察单位的个数所得资料基本特征为:①无顺序分组;②清点每组个数。
等级资料ranked data(有序分类资料ordinal data、有序资料)指先按某种属性的不同程度分组,再清点各组观察单位个数所得资料。
特征:①顺序分组;②清点各组个数变量variable——可以测量的任何特征或属性Any characteristic or attribute that can be measured。
(不同个体结果可能不同)随机变量random variable——在概率论中称变量为随机变量对随机变量的取值过程为测量。
取值所采用的标准为测量尺度。
同质(homogeneity):指对研究指标有影响的因素尽可能的相同。
变异(variation) :指观察结果间的差异和指标值间的不同。
总体population:根据研究目的确定的同质研究对象的全体(集合)。
分有限总体与无限总体样本sample:从总体中随机抽取的部分研究对象随机抽样random sampling为了保证样本的可靠性和代表性,需要采用随机的方法抽取样本(在总体中每个个体具有相同的机会被抽到)参数parameter:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
3.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
4.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。
等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
等级资料又称有序变量。
如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。
等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。
等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。
5.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。
0﹤P(A)﹤1。
频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。
当试验重复很多次时P(A)= m/n。
6. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的差。
它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。
误差变量一般服从正态分布。
随机误差可以通过统计处理来估计。
抽样误差(sampling error )是指样本统计量与总体参数的差别。
在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
7.系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。
系统误差可以通过实验设计和完善技术措施来消除或使之减少。
8.随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。
随机量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。
9.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。
总体参数是固定的常数。
多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
10.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。
样本统计量可用来估计总体参数。
总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
11.频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。
对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…个病人的天数。
对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。
12.算术均数(arithmetic mean)描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用X 表示。
13.几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。
记为G。
14.中位数(median)Md将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。
反映一批观察值在位次上的平均水平。
15.极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。
16.百分位数(percentile)是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。
百分位数的另一个重要用途是确定医学参考值范围。
17.四分位数间距(inter-quartile range)是由第3 四分位数和第1 四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。
18.方差(variance):方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。
19.标准差(standard deviation)是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。
20.变异系数(coefficient of variation)用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。
用CV 表示。
计算:标准差/均数*100%21.统计推断:通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断(statistical inference)。
22.抽样误差:由个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差(sampling error)。
23.标准误及X s :通常将样本统计量的标准差称为标准误。
许多样本均数的标准差X s称为均数的标准误(standard error of mean,SEM ),它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。
24.可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间(confidence interval,CI)。
它的确切含义是:可信区间包含总体参数的可能性是1- α ,而不是总体参数落在该范围的可能性为1-α 。
25.参数估计:指用样本指标值(统计量)估计总体指标值(参数)。
参数估计有两种方法:点估计和区间估计。
26.假设检验中P 的含义:指从H0 规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。
27.I 型和II 型错误:I 型错误(type I error ),指拒绝了实际上成立的H0,这类“弃真”的错误称为I 型错误,其概率大小用α表示;II 型错误(type II error),指接受了实际上不成立的H0,这类“存伪”的误称为II 型错误,其概率大小用β表示。
28.检验效能:1- β称为检验效能(power of test),它是指当两总体确有差别,按规定的检验水准a 所能发现该差异的能力。
29.检验水准:是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差别”的结论时犯错误的概率称为检验水准(level of a test),记为α 。
30..率(rate)又称频率指标,说明一定时期内某现象发生的频率或强度。
计算公式为:发生某现象的观察单位数/可能发生某现象的观察单位总数*100%,表示方式有:百分率(%)、千分率(‰)等。
31.构成比(proportion)又称构成指标,说明某一事物内部各组成部分所占的比重或分布。
计算公式为:某一组成部分的观察单位数/同一事物各组成部分的观察单位总数*100%,表示方式有:百分数等。
32.比(ratio)又称相对比,是A、B 两个有关指标之比,说明A 是B 的若干倍或百分之几。
计算公式为:A/B ,表示方式有:倍数或分数等。
33.非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题的一种不依赖总体分布的具体形式的统计分析方法。
由于这类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics),或称为不拘分布(distribution-free statistics)的统计分析方法,又称为无分布型式假定(assumption free statistics)的统计分析方法。
34.参数统计:通常要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行估计和检验,称为参数统计(parametric statistics)35.秩次:变量值按照从小到大顺序所编的秩序号称为秩次(rank)。
36.秩和:各组秩次的合计称为秩和(rank sum),是非参数检验的基本统计量。
37.直线回归(linear regression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。
直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simple regression)。
38.回归系数(regression coefficient )即直线的斜率(slope),在直线回归方程中用b 表示,b 的统计意义为X每增(减)一个单位时,Y平均改变b 个单位。
39.相关系数r:用以描述两个随机变量之间线性相关关系的密切程度与相关方向的统计指标。