统计学相关术语(2)
常用统计学术语

统计学术语population 母体sample 样本census 普查sampling 抽样quantitative 量的qualitative/categorical质的discrete 离散的continuous 连续的population parameters 母体参数sample statistics 样本统计量descriptive statistics 叙述统计学抽样调查(sampling survey单纯随机抽样(simple random sampling 系统抽样(systematic sampling分层抽样(stratified sampling整群抽样(cluster sampling多级抽样(multistage sampling实验设计(Design of Experiment)参数(Parameter)Statistics 统计学Population 母体Sample 样本Data analysis 资料分析Statistical table 统计表Statistical chart 统计图Pie chart 圆饼图Stem-and-leaf display 茎叶图Histogram 直方图Bar Chart 长条图Polygon 次数多边图Expectation 期望值Mode 众数Mean 平均数Variance 变异数Standard deviation 标准差Standard error 标准误Covariance matrix 共变异数矩阵Inferential statistics 推论统计学Point estimation 点估计Interval estimation 区间估计Confidence interval 信赖区间Confidence coefficient 信赖系数Testing statistical hypothesis 统计假设检定Regression analysis 回归分析Analysis of variance 变异数分析Correlation coefficient 相关系数Sampling survey 抽样调查Census 普查Sampling 抽样Reliability 信度Validity 效度Sampling error 抽样误差Non-sampling error 非抽样误差Random sampling 随机抽样Simple random sampling 简单随机抽样法Stratified sampling 分层抽样法Cluster sampling 群集抽样法Systematic sampling 系统抽样法Two-stage random sampling 两段随机抽样法Convenience sampling 便利抽样Quota sampling 配额抽样Snowball sampling 雪球抽样Nonparametric statistics 无母数统计The sign test 等级检定Wilcoxon signed rank tests 魏克森讯号等级检定Wilcoxon rank sum tests 魏克森等级和检定Run test 连检定法Discrete uniform densities 离散的均匀密度Binomial densities 二项密度Hypergeometric densities 超几何密度Poisson densities 卜松密度Geometric densities 几何密度Negative binomial densities 负二项密度Continuous uniform densities 连续均匀密度Normal densities 常态密度Exponential densities 指数密度Gamma densities 伽玛密度Beta densities 贝他密度Multivariate analysis 多变量分析Principal components 主因子分析Discrimination analysis 区别分析Cluster analysis 群集分析Factor analysis 因素分析Survival analysis 存活分析Time series analysis 时间序列分析Linear models 线性模式Quality engineering 品质工程Probability theory 机率论Statistical computing 统计计算Statistical inference 统计推论Stochastic processes 随机过程Decision theory 决策理论Discrete analysis 离散分析Mathematical statistics 数理统计统计学: Statistics母体: Population样本: Sample资料分析: Data analysis统计表: Statistical table统计图: Statistical chart圆饼图: Pie chart茎叶图: Stem-and-leaf display盒须图: Box plot直方图: Histogram长条图: Bar Chart次数多边图: Polygon肩形图: Ogive叙述统计学: Descriptive statistics期望值: Expectation众数: Mode平均数: Mean变异数: Variance标准差: Standard deviation标准误: Standard error共变异数矩阵: Covariance matrix推论统计学: Inferential statistics点估计: Point estimation区间估计: Interval estimation信赖区间: Confidence interval信赖系数: Confidence coefficient统计假设检定: Testing statistical hypothesis 回归分析: Regression analysis变异数分析: Analysis of variance相关系数: Correlation coefficient抽样调查: Sampling survey普查: Census抽样: Sampling信度: Reliability效度: Validity抽样误差: Sampling error非抽样误差: Non-sampling error随机抽样: Random sampling简单随机抽样法: Simple random sampling分层抽样法: Stratified sampling群集抽样法: Cluster sampling系统抽样法: Systematic sampling两段随机抽样法: Two-stage random sampling便利抽样: Convenience sampling配额抽样: Quota sampling雪球抽样: Snowball sampling无母数统计: Nonparametric statistics等级检定: The sign test魏克森讯号等级检定: Wilcoxon signed rank tests魏克森等级和检定: Wilcoxon rank sum tests连检定法: Run test离散的均匀密度: Discrete uniform densities二项密度: Binomial densities超几何密度: Hypergeometric densities卜松密度: Poisson densities几何密度: Geometric densities负二项密度: Negative binomial densitie,连续均匀密度:Continuous uniform densities常态密度: Normal densities指数密度: Exponential densities伽玛密度: Gamma densities贝他密度: Beta densities多变量分析: Multivariate analysis 主因子分析: Principal components 区别分析: Discrimination analysis 群集分析: Cluster analysis因素分析: Factor analysis存活分析: Survival analysis时间序列分析: Time series analysis 线性模式: Linear models品质工程: Quality engineering机率论: Probability theory统计计算: Statistical computing统计推论: Statistical inference随机过程: Stochastic processes决策理论: Decision theory离散分析: Discrete analysis数理统计: Mathematical statistics统计名词市调辞典众数(Mode) 普查(census)指数(Index) 问卷(Questionnaire)中位数(Median) 信度(Reliability)百分比(Percentage) 母群体(Population)信赖水准(Confidence level) 观察法(Observational Survey)假设检定(Hypothesis Testing) 综合法(Integrated Survey)卡方检定(Chi-square Test) 雪球抽样(Snowball Sampling)差距量表(Interval Scale) 序列偏差(Series Bias)类别量表(Nominal Scale) 次级资料(Secondary Data)顺序量表(Ordinal Scale) 抽样架构(Sampling frame)比率量表(Ratio Scale) 集群抽样(Cluster Sampling)连检定法(Run Test) 便利抽样(Convenience Sampling)符号检定(Sign Test) 抽样调查(Sampling Sur)算术平均数(Arithmetic Mean) 非抽样误差(non-sampling error) 展示会法(Display Survey)调查名词准确效度(Criterion-Related Validity)元素(Element) 邮寄问卷法(Mail Interview)样本(Sample) 信抽样误差(Sampling error)效度(Validity) 封闭式问题(Close Question)精确度(Precision) 电话访问法(Telephone Interview)准确度(Validity) 随机抽样法(Random Sampling)实验法(Experiment Survey)抽样单位(Sampling unit) 资讯名词市场调查(Marketing Research) 决策树(Decision Trees)容忍误差(Tolerated erro) 资料采矿(Data Mining)初级资料(Primary Data) 时间序列(Time-Series Forecasting)目标母体(Target Population) 回归分析(Regression)抽样偏差(Sampling Bias) 趋势分析(Trend Analysis)抽样误差(sampling error) 罗吉斯回归(Logistic Regression)架构效度(Construct Validity) 类神经网络(Neural Network)配额抽样(Quota Sampling) 无母数统计检定方法(Non-Parametric Test)人员访问法(Interview) 判别分析法(Discriminant Analysis)集群分析法(cluster analysis) 规则归纳法(Rules Induction)内容效度(Content Validity) 判断抽样(Judgment Sampling)开放式问题(Open Question) OLAP(Online Analytical Process)分层随机抽样(Stratified Random sampling) 资料仓储(Data Warehouse)非随机抽样法(Nonrandom Sampling) 知。
《统计学》 各章关键术语(中英文对照)

第二部分 各章关键术语(中英文对照)第1章统计学(statistics)随机性(randomness)描述统计学(descriptive statistics)推断统计学(inferential statistics)总体(population)母体(parent)(parent population)样本、子样(sample)调查对象总体(respondents population)有限总体(finite population)调查的理论总体(survey’s heoretical population)超总体(super population)变量(variable)数据(data)原始数据(original data)派生数据(derived data)定类尺度(nominal scale)定类尺度变量(nominal scale level variable)定类尺度数据(nominal scale level data)定序尺度(ordinal scale)定序尺度变量(ordinal scale level variable)定序尺度数据(ordinal scale level data)定距尺度(interval scale)定距尺度变量(interval scale level variable)定距尺度数据(interval scale level data)定比尺度(ratio scale)定比尺度变量(ratio scale level variable)定比尺度数据(ratio scale level data)分类变量(categorical variable)定性变量、属性变量(qualitative variable)数值变量(numerical variable)定量变量、数量变量(quantitative variable)绝对数变量(absolute number level variable)绝对数数据(absolute number level data)比率变量(ratio level variable)比率数据(ratio level data)实验数据(experimental data)调查数据(survey data)观察数据(observed data)第2章随机性(randomness)随机现象(random phenomenon)随机试验(random experiment)事件(event)基本事件(elementary event)复合事件(union of event)必然事件(certain event)不可能事件(impossible event)基本事件空间(elementary event space)互不相容事件(mutually exclusive events)统计独立(statistical independent)统计相依(statistical dependence)概率(probability)古典方法概率(classical method probability)相对频数方法概率(relative frequency method probability)主观方法概率(subjective method probability)几何概率(geometric probability)条件概率(conditional probability)全概率公式(formula of total probability)贝叶斯公式(Bayes’ formula)先验概率(prior probability)后验概率(posterior probability)随机变量(random variable)离散型随机变量(discrete type random variable)连续型随机变量(continuous type random variable)概率分布(probability distribution)特征数(characteristic number)位置特征数(location characteristic number)数学期望(mathematical expectation)散布特征数(scatter characteristic number)方差(variance)标准差(standard deviation)变异系数(variable coefficient)贝努里分布(Bernoulli distribution)二点分布(two-point distribution)0-1分布(zero-one distribution)贝努里试验(Bernoulli trials)二项分布(binomial distribution)超几何分布(hyper-geometric distribution)正态分布(normal distribution)正态概率密度函数(normal probability density function)正态概率密度曲线(normal probability density curve)正态随机变量(normal random variable)卡方分布(chi-square distribution)F_分布(F-distribution)t_分布(t-distribution)“学生”氏t_分布(Student’s t-distribution)列联表(contingency table)联合概率分布(joint probability distribution)边缘概率分布(marginal probability distribution)条件分布(conditional distribution)协方差(covariance)相关系数(correlation coefficient)第3章统计调查(statistical survey)数据收集(collection of data)统计单位(statistical unit)统计个体(statistical individual)社会经济总体(socioeconomic population)调查对象总体(respondents population)有限总体(finite population)标志(character)标志值(character value)属性标志(attributive character )品质标志(qualitative character )数量标志(numerical indication)不变标志(invariant indication)变异(variation)调查条目(item of survey)指标(indicator)统计指标(statistical indicator)总量指标(total amount indicator)绝对数(absolute number)统计单位总量(total amount of statistical unit )标志值总量(total amount of indication value)(total amount of character value)时期性总量指标(time period total amount indicator)流量指标(flow indicator)时点性总量指标(time point total amount indicator)存量指标(stock indicator)平均指标(average indicator)平均数(average number)相对指标(relative indicator)相对数(relative number)动态相对指标(dynamic relative indicator)发展速度(speed of development)增长速度(speed of growth)增长量(growth amount)百分点(percentage point)计划完成相对指标(relative indicator of fulfilling plan)比较相对指标(comparison relative indicator)结构相对指标(structural relative indicator)强度相对指标(intensity relative indicator)基期(base period)报告期(given period)分组(classification)(grouping)统计分组(statistical classification)(statistical grouping)组(class)(group)分组设计(class divisible design)(group divisible design)互斥性(mutually exclusive)包容性(hold)分组标志(classification character)(grouping character)按品质标志分组(classification by qualitative character)(grouping by qualitative character)按数量标志分组(classification by numerical indication)(grouping by numerical indication)离散型分组标志(discrete classification character)(discrete grouping character)连续型分组标志(continuous classification character)(continuous grouping character)单项式分组设计(single-valued class divisible design)(single-valued group divisible design)组距式分组设计(class interval divisible design)(group interval divisible design)组界(class boundary)(group boundary)频数(frequency)(frequency number)频率(frequency)组距(class interval)(group interval)组限(class limit)(group limit)下限(lower limit)上限(upper limit)组中值(class mid-value)(group mid-value)开口组(open class)(open-end class)(open-end group)开口式分组(open-end grouping)等距式分组设计(equal class interval divisible design)(equal group interval divisible design)不等距分组设计(unequal class interval divisible design)(unequal group interval divisible design)调查方案(survey plan)抽样调查(sample survey)有限总体概率抽样(probability sampling in finite populations)抽样单位(sampling unit)个体抽样(elements sampling)等距抽样(systematic sampling)整群抽样(cluster sampling)放回抽样(sampling with replacement)不放回抽样(sampling without replacement)分层抽样(stratified sampling)概率样本(probability sample)样本统计量(sample statistic)估计量(estimator)估计值(estimate)无偏估计量(unbiased estimator)有偏估计量(biased estimator)偏差(bias)精度(degree of precision)估计量的方差(variance of estimates)标准误(standard error)准确度(degree of accuracy)均方误差(mean square error)估计(estimation)点估计(point estimation)区间估计(interval estimate)置信区间(confidence interval)置信下限(confidence lower limit)置信上限(confidence upper limit)置信概率(confidence probability)总体均值(population mean)总体总值(population total)总体比例(population proportion)总体比率(population ratio)简单随机抽样(simple random sampling)简单随机样本(simple random sample)研究域(domains of study)子总体(subpopulations)抽样框(frame)估计量的估计方差(estimated variance of estimates)第4章频数(frequency)(frequency number)频率(frequency)分布列(distribution series)经验分布(empirical distribution)理论分布(theoretical distribution)品质型数据分布列(qualitative data distribution series)数量型数据分布列(quantitative data distribution series)单项式数列(single-valued distribution series)组距式数列(class interval distribution series)频率密度(frequency density)分布棒图(bar graph of distribution)分布直方图(histogram of distribution)分布折线图(polygon of distribution)累积分布数列(cumulative distribution series)累积分布图(polygon of cumulative distribution)位置特征(location characteristic)位置特征数(location characteristic number)平均值、均值(mean)平均数(average number)权数(weight number)加权算术平均数(weighted arithmetic average)加权算术平均值(weighted arithmetic mean)简单算术平均数(simple arithmetic average)简单算术平均值(simple arithmetic mean)加权调和平均数(weighted harmonic average)加权调和平均值(weighted harmonic mean)简单调和平均数(simple harmonic average)简单调和平均值(simple harmonic mean)加权几何平均数(weighted geometric average)加权几何平均值(weighted geometric mean)简单几何平均数(simple geometric average)简单几何平均值(simple geometric mean)绝对数数据(absolute number data)比率类型数据(ratio level data)中位数(median)众数(mode)耐抗性(resistance)散布特征(scatter characteristic)散布特征数(scatter characteristic number)极差、全距(range)四分位差(quartile deviation)四分间距(inter-quartile range)上四分位数(upper quartile)下四分位数(lower quartile)在外截断点(outside cutoffs)平均差(mean deviation)方差(variance)标准差(standard deviation)变异系数(variable coefficient)第5章随机样本(random sample)简单随机样本(simple random sample)参数估计(parameter estimation)矩(moment)矩估计(moment estimation)修正样本方差(modified sample variance)极大似然估计(maximum likelihood estimate)参数空间(space of paramete)似然函数(likelihood function)似然方程(likelihood equation)点估计(point estimation)区间估计(interval estimation)假设检验(test of hypothesis)原假设(null hypothesis)备择假设(alternative hypothesis)检验统计量(statistic for test)观察到的显著水平(observed significance level)显著性检验(test of significance)显著水平标准(critical of significance level)临界值(critical value)拒绝域(rejection region)接受域(acceptance region)临界值检验规则(test regulation by critical value)双尾检验(two-tailed tests)显著水平(significance level)单尾检验(one-tailed tests)第一类错误(first-kind error)第一类错误概率(probability of first-kind error)第二类错误(second-kind error)第二类错误概率(probability of second-kind error)P_值(P_value)P_值检验规则(test regulation by P_value)经典统计学(classical statistics)贝叶斯统计学(Bayesian statistics)第6章方差分析(analysis of variance,ANOV A)方差分析恒等式(analysis of variance identity equation)单因子方差分析(one-factor analysis of variance)双因子方差分析(two-factor analysis of variance)总变差平方和(total variation sum of squares)总平方和SST(total sum of squares)组间变差平方和(among class(group) variation sum of squares),回归平方和SSR (regression sum of squares)组内变差平方和(within variation sum of squares)误差平方和SSE(error sum of squares)皮尔逊χ2统计量(Pearson’s chi-statistic)分布拟合(fitting of distrbution)分布拟合检验(test of fitting of distrbution)皮尔逊χ2检验(Pearson’s chi-square test)列联表(contingency table)独立性检验(test of independence)数量变量(quantitative variable)属性变量(qualitative variable)对数线性模型(loglinear model)回归分析(regression analysis)随机项(random term)随机扰动项(random disturbance term)回归系数(regression coefficient)总体一元线性回归模型(population linear regression model with a single regressor)总体多元线性回归模型(population multiple regression model with a single regressor)完全多重共线性(perfect multicollinearity)遗漏变量(omitted variable)遗漏变量偏差(omitted variable bias)面板数据(panel data)面板数据回归(panel data regressions)工具变量(instrumental variable)工具变量回归(instrumental variable regressions)两阶段最小平方估计量(two stage least squares estimator)随机化实验(randomized experiment)准实验(quasi-experiment)自然实验(natural experiment)普通最小平方准则(ordinary least squares criterion)最小平方准则(least squares criterion)普通最小平方(ordinary least squares,OLS)最小平方(least squares)最小平方法(least squares method)第7章简单总体(simple population)复合总体(combined population)个体指数:价比(price relative),量比(quantity relative)总指数(general index)(combined index)统计指数(statistical indices)类指数、组指数(class index)动态指数(dynamic index)比较指数(comparison index)计划完成指数(index of fulfilling plan)数量指标指数(quantitative indicator index)物量指数(quantitative index)(quantity index)(quantum index)质量指标指数(qualitative indicator index)价格指数、物价指数(price index)综合指数(aggregative index)(composite index)拉斯贝尔指数(Laspeyres’ index)派许指数(Paasche’s index)阿斯·杨指数(Arthur Young’s index)马歇尔—埃奇沃斯指数(Marshall-Edgeworth’s index)理想指数(ideal index)加权综合指数(weighted aggregate index)平均指数(average index)加权算术平均指数(weighted arithmetic average index)加权调和平均指数(weighted harmonic average index)因子互换(factor-reversal)购买力平价(purchasing power parity,PPP)环比指数(chain index)定基指数(fixed base index)连环替代因素分析法(factor analysis by chain substitution method)不变结构指数、固定构成指数(index of invariable construction)结构指数、结构影响指数(structural index)第8章截面数据(cross-section data)时序数据(time series data)动态数据(dynamic data)时间数列(time series)发展水平(level of development)基期水平(level of base period)报告期水平(level of given period)平均发展水平(average level of development)序时平均数(chronological average)增长量(growth quantity)平均增长量(average growth amount)发展速度(speed of development)增长速度(speed of growth)增长率(growth rate)环比发展速度(chained speed of development)定基发展速度(fixed base speed of development)环比增长速度(chained growth speed)定基增长速度(fixed base growth speed)平均发展速度(average speed of development)平均增长速度(average speed of growth)平均增长率(average growth rate)算术图(arithmetic chart)半对数图(semilog graph)时间数列散点图(scatter diagram of time series)时间数列折线图(broken line graph of time series)水平型时间数列(horizontal patterns in time series data)趋势型时间数列(trend patterns in time series data)季节型时间数列(season patterns in time series data)趋势—季节型时间数列(trend-season patterns in time series data)一次指数平滑平均数(simple exponential smoothing mean)一次指数平滑法(simple exponential smoothing method)最小平方法(leas square method)最小平方准则(least squares criterion)原资料平均法(average of original data method)季节模型(seasonal model)(seasonal pattern)长期趋势(secular trends)季节变动(变差)(seasonal variation)季节波动(seasonal fluctuations)不规则变动(变差)(erratic variation)不规则波动(random fluctuations)时间数列加法模型(additive model of time series)时间数列乘法模型(multiplicative model of time series)11。
统计学相关术语

统计学相关术语1、概率(proability):度量一随机事件发生可能性大小的实数,其值介于0 与1 之间。
一随机事件的慨率可看作在相同条件下重复试验时,该事件发生的频率的稳定值,也可看作对事件发生的相信程度。
2、统计学(statistics):主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。
也就是收集、处理、分析、解释数据并从数据中得出结论的科学。
主要又分为描述统计学和推断统计学。
3、描述统计(Descriptive statistics):描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。
目的是描述数据特征,找出数据的基本规律。
描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
4、推断统计(Inferential Statistics):推断统计是研究如何根据样本数据来推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。
主要包括参数估计与假设检验两种方法。
描述统计学和推断统计学的划分,一方面反映了统计方法发展的前后两个阶段,同时也反映了应用统计方法探索客观事物数量规律性的不同过程。
5、数值型数据(metric data):按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度,例如:身高为175cm、168cm、183cm。
6、分类数据(categorical data) :只能归于某一类别的非数字型数据,对事物进行分类的结果,数据表现为类别,用文字来表述,例如,人口按性别分为男、女两类。
7、总体(population):所研究的全部个体(数据) 的集合,其中的每一个个体也称为元素。
分为有限总体和无限总体:有限总体的范围能够明确确定,且元素的数目是有限的;无限总体所包括的元素是无限的,不可数的。
常用统计术语

常用统计术语统计术语在现代社会中扮演着重要的角色,它们被广泛运用于各个领域,如经济学、社会学、医学等等。
对于研究人员、决策者和普通公众来说,了解和掌握常用的统计术语是至关重要的。
本文将介绍一些常用的统计术语,帮助读者更好地理解和运用统计数据。
1. 样本(Sample):从总体中选取的一部分观察对象,以代表总体。
选择样本的目的在于降低调查成本和时间,并且在一定程度上能够提供总体的真实情况。
2. 总体(Population):研究对象的全体。
总体可以是人群、产品、事件等等。
3. 随机抽样(Random Sampling):一种抽样方法,所有样本具有相同的机会被选中的概率,从而保证样本的代表性和可靠性。
4. 样本容量(Sample Size):样本中的观察对象数量。
样本容量的选择应根据研究目的和研究对象的特点来确定,样本容量越大,结果越可靠。
5. 参数(Parameter):总体的数值指标,如总体均值、总体方差等。
参数通常用希腊字母表示,如μ表示总体均值,σ表示总体标准差。
6. 统计量(Statistic):样本的数值指标,如样本均值、样本方差等。
统计量是通过样本来估计参数。
7. 平均值(Mean):一组数据的加权平均数,可以代表数据的集中趋势。
常用符号X表示样本平均值,μ表示总体平均值。
8. 中位数(Median):把一组数据从小到大排列,位于中间位置的数值。
中位数可以代表数据的中间位置。
9. 众数(Mode):一组数据中出现次数最多的数值。
众数可以代表数据的峰值。
10. 标准差(Standard Deviation):衡量数据的离散程度,是每个数据与该组数据平均值的差异的平方和的平均值的平方根。
11. 偏度(Skewness):衡量数据的偏斜程度,描述数据分布偏向左侧或右侧的程度。
偏度为正表示数据分布向右偏,为负表示数据分布向左偏。
12. 峰度(Kurtosis):衡量数据的峰态程度,描述数据分布的尖锐程度。
统计专业术语

统计专业术语
统计学:作为一门学科,统计学涉及收集、整理、分析和解释数据的方法和技巧。
样本:被用于进行统计分析的数据子集。
总体:指整个群体或研究对象的集合,统计学中的分析结果通常是关于总体的。
抽样:从总体中选择以获得样本的过程。
标本误差:样本结果与总体结果之间的差异。
均值:一组数值的平均值,通过将所有数值相加并除以数值的总数来计算得到。
中位数:将一组数值按顺序排列后,位于中间位置的数值。
众数:一组数值中出现次数最多的数。
方差:度量一组数值离其均值的差异程度。
标准差:方差平方根,度量一组数值的离散程度。
相关性:指两个变量之间的关联程度。
回归分析:用于预测一个变量与其他变量之间关系的统计方法。
假设检验:用于评估统计推断中的假设的方法,通常将一个观察结果与一个预期结果进行比较。
置信区间:对一个估计值的不确定性进行度量的区间。
显著性水平:用于判断一个结果是否足够令人信服的概率阈值。
p值:表示观察到的统计数据在假设为真的情况下出现的概率。
设计效应:抽样过程中的某些因素对样本结果的影响。
统计显著性:指在统计学中观察到的差异超出了偶然误差的程度。
SPSS:一种常用的统计软件,用于数据分析和统计建模。
R语言:一种开源统计计算和图形化工具,广泛用于统计学和
数据分析。
这只是统计学中的一些常见专业术语,还有许多其他概念和方法,可以进一步探索和研究。
统计学概论主要术语

第1章统计学研究什么?主要术语1. 统计学(statistics):收集、处理、分析、解释数据并从数据中得出结论的科学。
2. 描述统计(descriptive statistics):研究数据收集、处理和描述的统计学方法。
3. 推断统计(inferential statistics):研究如何利用样本数据来推断总体特征的统计学方法。
4. 变量(variable):每次观察都会得到不同结果的某种特征。
5. 分类变量(categorical variable):又称无序分类变量,观测结果表现为某种类别的变量。
6. 顺序变量(rank variable):又称有序分类变量,观测结果表现为某种有序类别的变量。
7. 数值变量(metric variable):又称定量变量,观测结果表现为数字的变量。
8. 分类数据(categorical data):只能归于某一类别的非数字型数据。
9. 顺序数据(rank data):只能归于某一有序类别的非数字型数据。
10. 数值型数据(metric data):按数字尺度测量的数据。
11. 总体(population):包含所研究的全部个体(数据)的集合。
12. 样本(sample):从总体中抽取的一部分元素的集合。
13. 样本量(sample size):构成样本的元素的数目。
14. 简单随机抽样(simple random sampling):从含有N个元素的总体中,抽取n个元素组成一个样本,使得总体中的每一个元素都有相同的机会(概率)被抽中。
15. 分层抽样(stratified sampling):也称分类抽样,在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。
16. 系统抽样(systematic sampling):也称等距抽样,先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的间隔抽取一个元素,直至抽取n个元素组成一个样本。
统计学术语

统计学术语1. 平均数:平均值,又称平均算术,是统计学中分析数据及描述数据特征的常用统计量。
2. 中位数:中位数是一组有序数据中居于中间位置的数据项。
3. 众数:一组数据中出现次数最多的数据项即为众数。
4. 极差:极差是最大值减去最小值的结果,用来表示一组数据范围大小的统计量。
5. 标准差:标准差是一组数据离均值偏差程度的反映,用来衡量一组数据离散程度。
6. 方差:方差是一组数据平均分布情况的反映,用来衡量一组数据离散度。
7. 协方差:协方差是一组数据关联和变化特征的反映,用来统计数据间的线性相关程度。
8. 相关系数:相关系数是对数据关联程度的反映,用来统计数据间的线性相关性。
9. 相关分析:相关分析是统计学中的研究方法,用来研究两个或两个以上变量之间的关系和联系。
10. 误差估计:误差估计是统计学及其应用中经常使用的统计量,用来研究某统计量的估计值和真实值之间的差异。
11. 测度:测度是衡量变量本质特征的方法,可以用来研究变量的取值范围大小、数据的分布特点等。
12. 抽样技术:抽样技术是指在样本中抽取部分数据进行定量研究的方法,使用的抽样方法有简单随机抽样、系统抽样、分层抽样和多方抽样等。
13. 模拟:模拟是指根据现实中或实验中的相关数据,以近似真实环境的方式模拟出理论模型,计算机模拟是应用最广泛的一种数学模拟方法。
14. 回归分析:回归分析是指研究两变量或多变量之间相互关系,并用线性等数学模型对该关系进行拟合和估计的统计学分析方法。
15. 分类分析:分类分析是对对象进行分组的统计学分析方法,可以使用适当的统计方法进行分类比较,以揭示不同群体之间的差异。
16. 抽象数量分析:抽象数量分析是指使用抽象的统计模型分析实验数据的方法,准确确定模型参数,有效地估计观察值。
17. 分位数:分位数是一组有序数据中,从最小到最大排列后比例所处位置的数值,它可以用来衡量数据中位置分布的特点。
18. 箱线图:箱线图是一种用来表示数据分布特征的统计图,可以观察分布的中位数、四分位数等重要信息。
统计学中的专业术语

Canonical correlation, 典型相关Caption, 纵标目Case-control study, 病例对照研究Categorical variable, 分类变量Catenary, 悬链线Cauchy distribution, 柯西分布Cause-and-effect relationship, 因果关系Cell, 单元Censoring, 终检Center of symmetry, 对称中心Centering and scaling, 中心化和定标Central tendency, 集中趋势Central value, 中心值CHAID -χ2 Automatic Interaction Detector, 卡方自动交互检测Chance, 机遇Chance error, 随机误差Chance variable, 随机变量Characteristic equation, 特征方程Characteristic root, 特征根Characteristic vector, 特征向量Chebshev criterion of fit, 拟合的切比雪夫准则Chernoff faces, 切尔诺夫脸谱图Chi-square test, 卡方检验/χ2检验Choleskey decomposition, 乔洛斯基分解Circle chart, 圆图Class interval, 组距Class mid-value, 组中值Class upper limit, 组上限Classified variable, 分类变量Cluster analysis, 聚类分析Cluster sampling, 整群抽样Code, 代码Coded data, 编码数据Coding, 编码Coefficient of contingency, 列联系数Coefficient of determination, 决定系数Coefficient of multiple correlation, 多重相关系数Coefficient of partial correlation, 偏相关系数Coefficient of production-moment correlation, 积差相关系数Coefficient of rank correlation, 等级相关系数Coefficient of regression, 回归系数Coefficient of skewness, 偏度系数Coefficient of variation, 变异系数Cohort study, 队列研究Column, 列Column effect, 列效应Column factor, 列因素Combination pool, 合并Combinative table, 组合表Common factor, 共性因子Common regression coefficient, 公共回归系数Common value, 共同值Common variance, 公共方差Common variation, 公共变异Communality variance, 共性方差Comparability, 可比性Comparison of bathes, 批比较Comparison value, 比较值Compartment model, 分部模型Compassion, 伸缩Complement of an event, 补事件Complete association, 完全正相关Complete dissociation, 完全不相关Complete statistics, 完备统计量Completely randomized design, 完全随机化设计Composite event, 联合事件Composite events, 复合事件Concavity, 凹性Conditional expectation, 条件期望Conditional likelihood, 条件似然Conditional probability, 条件概率Conditionally linear, 依条件线性Confidence interval, 置信区间Confidence limit, 置信限Confidence lower limit, 置信下限Confidence upper limit, 置信上限Confirmatory Factor Analysis , 验证性因子分析Confirmatory research, 证实性实验研究Confounding factor, 混杂因素Conjoint, 联合分析Consistency, 相合性Consistency check, 一致性检验Consistent asymptotically normal estimate, 相合渐近正态估计Consistent estimate, 相合估计Constrained nonlinear regression, 受约束非线性回归Constraint, 约束Contaminated distribution, 污染分布Contaminated Gausssian, 污染高斯分布Contaminated normal distribution, 污染正态分布Contamination, 污染Contamination model, 污染模型Contingency table, 列联表Contour, 边界线Contribution rate, 贡献率Control, 对照Controlled experiments, 对照实验Conventional depth, 常规深度Convolution, 卷积Corrected factor, 校正因子Corrected mean, 校正均值Correction coefficient, 校正系数Correctness, 正确性Correlation coefficient, 相关系数Correlation index, 相关指数Correspondence, 对应Counting, 计数Counts, 计数/频数Covariance, 协方差Covariant, 共变Cox Regression, Cox回归Criteria for fitting, 拟合准则Criteria of least squares, 最小二乘准则Critical ratio, 临界比Critical region, 拒绝域Critical value, 临界值Cross-over design, 交叉设计Cross-section analysis, 横断面分析Cross-section survey, 横断面调查Crosstabs , 交叉表Cross-tabulation table, 复合表Cube root, 立方根Cumulative distribution function, 分布函数Cumulative probability, 累计概率Curvature, 曲率/弯曲Curvature, 曲率Curve fit , 曲线拟和Curve fitting, 曲线拟合Curvilinear regression, 曲线回归Curvilinear relation, 曲线关系Cut-and-try method, 尝试法Cycle, 周期Cyclist, 周期性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学相关术语1、概率(proability):度量一随机事件发生可能性大小的实数,其值介于0 与1 之间。
一随机事件的慨率可看作在相同条件下重复试验时,该事件发生的频率的稳定值,也可看作对事件发生的相信程度。
2、统计学(statistics):主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。
也就是收集、处理、分析、解释数据并从数据中得出结论的科学。
主要又分为描述统计学和推断统计学。
3、描述统计(Descriptive statistics):描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。
目的是描述数据特征,找出数据的基本规律。
描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
4、推断统计(Inferential Statistics):推断统计是研究如何根据样本数据来推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。
主要包括参数估计与假设检验两种方法。
描述统计学和推断统计学的划分,一方面反映了统计方法发展的前后两个阶段,同时也反映了应用统计方法探索客观事物数量规律性的不同过程。
5、数值型数据(metric data):按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度,例如:身高为175cm、168cm、183cm。
6、分类数据(categorical data) :只能归于某一类别的非数字型数据,对事物进行分类的结果,数据表现为类别,用文字来表述,例如,人口按性别分为男、女两类。
7、总体(population):所研究的全部个体(数据) 的集合,其中的每一个个体也称为元素。
分为有限总体和无限总体:有限总体的范围能够明确确定,且元素的数目是有限的;无限总体所包括的元素是无限的,不可数的。
8、样本 (sample):从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量或样本量 (sample size)。
9、变量(variable):说明现象某种特征的概念,如商品销售额、性别等,变量的具体表现称为变量值,即数据。
变量基本分类可分为分类变量:说明事物类别的名称;数值型变量:说明事物数字特征的名称。
其他分类可分为随机变量与非随机变量;经验变量和理论变量。
10、平均数(mean):是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位置,易受极端值的影响,是反映数据集中趋势的一项指标。
它包括算术平均数、加权算术平均数、调和平均数和几何平均数。
11、众数(mode):是指一组数据中出现次数最多的变量值(数据值),不受极端值的影响,一组数据可能没有众数或有几个众数。
众数适合于数据量较多时,并且在数据分布偏斜程度较大且有明显峰值时应用。
12、中位数(median):是另外一种反映数据的中心位置的指标,其确定方法是将所有数据以由小到大的顺序排列,位于中央的数据值就是中位数,不受极端值的影响。
中位数在数据分布偏斜程度较大时应用。
13、四分位数(quartile):一组数据中,把所有数值由小到大排列并分成四等份,处于三个分割点位置的数据就是四分位数,不受极端值的影响。
四分位数在统计学中的箱线图绘制方面应用较为广泛。
14、算术平均数(Arithmetic mean)简称平均数、均数或均值,是指在一组数据中所有数据之和再除以数据的个数。
它是反映数据集中趋势的一项指标。
算术平均数易受极端数据的影响,这是因为平均数反应灵敏,每个数据的或大或小的变化都会影响到最终结果。
15、加权平均数(Weighted mean)是不同比重数据的平均数,加权平均数就是把原始数据按照合理的比例来计算。
加权算术平均数主要用于处理经分组整理的数据。
加权算术平均数同时受到两个因素的影响,一个是各组数值的大小,另一个是各组分布频数的多少。
16、调和平均数(Harmonic mean)调和平均数是总体各单位标志值倒数的算术平均数的倒数,也称倒数平均数。
调和平均数易受极端值的影响,且受极小值的影响比受极大值的影响更大。
只要有一个变量值为零,就不能计算调和平均数。
调和平均数应用的范围较小。
17、几何平均数(Geometric mean)n个变量值乘积的n次方根就是几何平均数。
适用于对比率数据的平均,主要用于计算平均增长率。
21、极差(range)一组数据的最大值与最小值之差,极差也称为全距。
它是数据离散程度的最简单测度值,极差越大,离散程度越大,反之,离散程度越小。
极差易受极端值影响,未考虑数据的分布。
22、平均差(mean deviation)各标志值与其平均数离差绝对值的平均数。
平均差是一种平均离差。
离差是总体各单位的标志值与算术平均数之差。
因离差和为零,离差的平均数不能将离差和除以离差的个数求得,而必须讲离差取绝对数来消除正负号。
23、方差(variance)是各个数据与平均数之差的平方和的平均数,表示一系列数据或统计总体的分布特征的值。
通俗点讲,就是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差。
在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定。
24、标准差(Standard Deviation)也称均方差,是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根。
标准差是方差的算术平方根。
标准差能反映一个数据集的离散程度。
平均数相同的,标准差未必相同。
25、变异系数(coefficient of variation)又称“标准差率”,表示离散程度,是标准差和相应平均数的比值,记为。
当进行两组或多组数据离散程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。
如果单位和(或)平均数不同时,比较其离散程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。
简单来说就是:在表示离散程度上,标准差并不是全能的,当度量单位或平均数不同时,只能用变异系数了,它也是表示离散程度,是标准差和相应平均数的比值。
26、偏度(skewness)是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。
偏度=0为对称分布,偏度> 0为右偏分布,偏度< 0为左偏分布。
27、峰度(kurtosis)是用来反映频数分布曲线顶端尖峭或扁平程度的指标。
有时两组数据的算术平均数、标准差和偏度都相同,但他们分布曲线顶端的高耸程度却不同。
峰度=0扁平峰度适中,峰度<0为扁平分布,峰度>0为尖峰分布。
28、分组根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。
有等距分组和不等距分组两种方式,进行分组要遵循两个原则:穷尽原则、互斥原则。
29、频数(frequency)频数是指一组数据中个别数据重复出现的次数。
例如某校A班学生共50名同学,按性别进行分组,分为男与女两个组别,男同学的频数为30,女同学的频数为20。
30、频率频率是每个小组的频数与数据总数的比值,它代表某组在总体中出现的频繁程度,一般采用百分数表示,所有组的频率加总等于100%。
31、绝对数是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标,也是数据分析中常用的指标,如GDP、总人口等。
此外,绝对数也可以表现为在一定时间、地点条件下数量增减变化的绝对数,比如A国人口比B国人口多1000万人。
32、相对数是指由两个有联系的指标对比计算而得到的数值,用以反映客观现象之间数量联系程度的综合指标。
计算公式=比较数值(比值)/基础数值(基数)。
分母是用做对比标准的指标数值,简称基数;分子是用做与基数对比的指标数值,简称比数。
相对数一般以倍数、成数、百分数等表示,它反映了客观现象之间数量联系的程度。
使用相对数时需要注意指标的可比性,同时要与总量指标(绝对数)结合使用。
33、百分比(percent)百分比是相对数中的一种,它表示一个数是另一个数的百分之几,也称百分率或百分数。
百分比通常采用百分号(%)来表示,如8%,50%,168%等。
由于百分比的分母都是100,也就是都以1%作为度量单位,因此便于比较,在数据分析中的应用非常广泛。
34、百分点是指不同时期以百分数的形式表示的相对指标的变动幅度,1个百分点=1%。
常有人混淆了百分比与百分点的概念。
表示构成的变动幅度不宜用百分数,而应用百分点。
35、比例是指在总体中,各部分的数值占全部数值的比重,通常反映总体的构成和结构。
比如A班共有学生50人,男生30人,女生20人,则男生的比例是30/50,女生的比例是20/50。
由此可以看出,比例的基数(也就是分母)都是全体学生人数,即为同一个基数。
36、比率是指不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。
比如A班共有学生50人,男生30人,女生20人,则男生与女生的比率是30/20,这一指标经常会用在社会经济领域,比如我国的人口性别比就是用每100名女性数量相对的男性数量来表示的。
37、倍数是一个数除以另一个数所得的商。
如A÷B=C,就是说A是B的C倍。
需要注意的是,倍数一般是表示数量的增长或上升幅度,而不适用于表示数量的减少或下降。
38、番数是指原来数量的2的N次方倍。
比如翻一番为原来数量的2倍(2的1次方),翻两番为4倍(2的2次方)。
39、同比为与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况。
例如2010年12月与2009年12月相比。
40、环比为与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况。
例如2010年12月与2010年11月相比。