多点地质统计学_理论_应用与展望 (1)

多点地质统计学_理论_应用与展望 (1)
多点地质统计学_理论_应用与展望 (1)

《统计学基础(第2版)》教学大纲

《统计学基础》课程教学大纲 适用专业工商企业管理、市场营销、金融保险、电子商务课程类型职业基础课学分数3 学时数48 第一部分总纲 一、课程性质、教学目的 1.课程性质 统计学基础是为经济与管理学科各专业学生开设的一门必修的重要的专业基础课,也是经济管理工作者和经济研究人员所必备的一门知识。它研究如何用科学的方法去搜集、整理、分析国民经济和社会发展的实际数据,并通过统计所特有的统计指标和指标体系,表明所研究的社会经济现象的规模、水平、速度、比例和效益,以反映社会经济现象发展规律在一定时间、地点、条件下的作用,描述社会经济现象数量之间的联系关系和变动规律,也是进一步学习其他相关学科的基础。 2.教学目的通过教学,培养学生系统地掌握统计工作的基础理论、主要方法和基本技能;以社会经济统计工作的一般原理和原则为主,密切联系实际,培养学生获取信息的能力以及分析问题和解决问题的能力,为从事各项经济工作、财会工作和管理工作奠定分析研究的基础。 3.前导课程与后续课程 该课程的开出一般在经济数学、经济学基础之后。

二、推荐教材及主要参考资料 1. 宋粉鲜,陈世文.《统计学基础》,现代教育出版社,2012年1月。 2. 宋粉鲜,陈世文.《统计学基础——习题与实训》,现代教育出版社,2012年1月。 3. 栗方忠.《统计学原理》,东北财经大学出版社,2011年1月。 4. 栗方忠.《统计学原理标准化题型习题集》,东北财经大学出版社,2011年1月。 5. 马庆国.《管理统计》,科学出版社,2 002年8月。 6. 贾俊平.《统计学基础》,中国人民大学出版社,2006年。 7. Douglas A. Lind, William G. Marchal, Robert D. Ma son. Statistical Techniques in th Business and Economics(11 ed.).中信出版社,2002年。 8. Ron Larson, Betsy Farber. Elementary Statistics.清华大学出版社,2004。 三、大纲执行说明 本课程教学内容包括理论教学和实训教学两部分。

管理统计学SPSS数据管理 实验报告

数据管理 一、实验目的与要求 1.掌握计算新变量、变量取值重编码的基本操作。 2.掌握记录排序、拆分、筛选、加权以及数据汇总的操作。 3.了解数据字典的定义和使用、数据文件的重新排列、转置、合并的操作。 二、实验内容提要 1.自行练习完成课本中涉及的对CCSS案例数据的数据管理操作 2.针对SPSS自带数据Employee data.sav进行以下练习。 (1)根据变量bdate生成一个新变量“年龄” (2)根据jobcat分组计算salary的秩次 (3)根据雇员的性别变量对salary的平均值进行汇总 (4)生成新变量grade,当salary<20000时取值为d,在20000~50000范围内时取值为c,在50000~100000范围内取值为b,大于等于100000时取值为a 三、实验步骤 1、针对CCSS案例数据的数据管理操作 1.1.计算变量,输入TS3到目标变量,在数字表达式中输入3,把任意年龄段分成三个组20-30设为1组,1-40设为2组41-50设为3组。图1, 图1 1.2.对已有变量的分组合并,在“名称”文本框中输入新变量名TS3单击“更改”按钮,原来的S3->?就会变为S3->TS3,单击“旧值和新值”按钮,系统打开“重新编码到其他变量:旧值和新值”,如下图2,

图2 图3 1.3.可视离散化,选择“转换”->“可视离散化”,打开的对话框要求用户选择希望进行离散化的变量,单击继续,如下图4,

图4 单击“生成分割点”,设定分割点数量为10,宽度为5,第一个分割点位置为18,单击“应用”,如下图, 图5 结果显示如下,

地质统计学

第一章绪论 一、历史背景与产生 地质统计学是二十世纪六七十年代发展起来的一门新兴的数学地质学科的分支。它开始主要是为解决矿床从普查勘探、矿山设计到矿山开采整个过程中各种储量计算和误差估计问题而发展起来的。它是由法国著名学者G. 马特隆教授于1962年创立的。其核心即所谓的“克立格”。它是一种无偏的最小误差的储量计算方法。该方法按照样品与待估块段的相对空间位置和相关程度来计算块段品位及储量,并使估计误差为最小。这是南非采矿工程师D. G. Krige 根据南非金矿的具体情况与1952年提出的,故命名为克立格法。后来法国学者G. 马特隆(Matheron)对克立格提出的方法进行研究,认为克立格提出的方法是在考虑了空间分布特征的基础上,合理地改进了统计学,是一种传统方法与统计学方法结合起来的新方法。同时为了解决具二重型(结构型与随机性)的地质变量的条件下使用统计方法的问题。马特隆教授提出了区域化变量的概念(Regionalized Variable),从而创立了地质统计学。根据地质统计学理论,地质特征可以用区域化变量的空间分布特征来表征。而研究区域化变量的空间分布特征分布的主要数学工具是变差函数(Variogram)。 到七十年代中后期,马特隆的学生JOURENL等在研究其它地质变量的基础上,认为某些地质变量并不是一成不变的,而是有一定波动的,这样使用克立格法就不能很好再现地质变量的分布特征。因此他们采样模拟的方法,将克立格估计的离散方差的波动性模拟出来,从而产生了随机模拟法。因此,从二十世纪八十年代以来,地质统计学分为两派:一派以法国的马特隆教授等人为主,仍致力于克立格估计的研究;一派以美国JOURENL等人为主,主要致力于随机模拟方法的研究。 地质统计学的产生是在经典统计学的基础上发展起来的。在此前,为了反映地质变量的空间变化性,一些地质学家曾经使用一些经典的概率统计方法来研究地质变量。但由于地质变量并不是纯粹的随机变量,因此,直接用简单的统计方法解决复杂的地质问题,有一定的局限性。主要表现在:①经典统计方法在研究地质变量时,不考虑样品的空间分布,由于样品的空间分布位置不同,尽管它们的均值、方差都一样,但地质变量的稳定性并不相同。②经典概率统计学研究对象是纯随机变量,并都服从一定的已知概率分布,而地质变量既有随机性又有结构性。③经典统计学的变量原则上要求可以无限次重复测量或试验,且每次测量可能结果均不同,而地质变量不行。④经典统计学一般要求每次抽样是独立进行,相互独立,而地质变量并不相互独立,往往具有空间相关性。为了寻求一种既能保持概率统计的有效性,又考虑到地质变量的特点,使地质统计学应运而生。 二、地质统计学研究现状 经过三十多年的发展,目前地质统计学已经形成了一套完整的理论体系,提出了一些重要的方法和技巧,形成了一系列有实用价值的程序包,并迅速传播到世界各地。从目前来看,可概括为如下: ⑴形成一套完整的理论体系 a. 完善的基础理论(5基本) 基本概念——区域化变量 基本工具——变差函数 基本假论——二阶平稳假设和本征(亦称“内蕴”)假设 基本公式——估计方差离散方差正则化公式 基本方法——普通克立格 b. 非线性及非平稳理论充实 泛克立格K阶本征函数析取克立格等

多点地质统计学

多点地质统计学Multiple-point geostatistic是相对于传统的两点地质统计学而言的,主要应用于储层表征与建模中. 传统的地质统计学在储层建模中主要应用于两大方面:其一,应用各种克里金方法建立确定性的模型,这类方法主要有简单克里金、普通克里金、泛克里金、协同克里金、贝叶斯克里金、指示克里金等;其二,应用各种随机建模的方法建立可选的、等可能的地质模型,这类方法主要有高斯模拟(如序贯高斯模拟)、截断高斯模拟、指示模拟(如序贯指示模拟)等。上述方法的共同特点是空间赋值单元为象元(即网格),故在储层建模领域将其归属为基于象元的方法。这些方法均以变差函数为工具,亦可将其归属为基于变差函数的方法。 变差函数局限性(传统地质统计学)变差函数只能把握空间上两点之间的相关性,亦即在二阶平稳或本征假设的前提下空间上任意两点之间的相关性,因而难于表征复杂的空间结构和再现复杂目标的几何形态(如弯曲河道)。弯曲河道的3种不同的空间结构(图1a,b,c)在横向上(东西方向,图1d)和纵向上(南北方向,图1e)的变差函数十分相似,这说明应用变差函数不能区分这3种不同的空间结构及几何形态,因此,基于变差函数的传统地质统计学插值和模拟方法难于精确表征具有复杂空间结构和几何形态的地质体。 现有的储层随机建模的另一途径是基于目标的方法,它是以目标物体为基本模拟单元,进行离散物体的随机模拟(Haldorsen and Damsleth,1990;Holdenet al.,1998)。主要方法为示性点过程(亦称标点过程),其根据先验地质知识、点过程理论及优化方法(如模拟退火)表征目标地质体的空间分布,因此这种方法可以较好地再现目标体几何形态。但这种方法亦有其不足:1)每类具有不同几何形状的目标均需要有特定的一套参数(如长度、宽度、厚度等),而对于复杂几何形态,参数化较为困难;2)由于该方法属于迭代算法,因此当单一目标体内井数据较多时,井数据的条件化较为困难,而且要求大量机时

《地质统计学》读书报告

《地质统计学》课程读书报告

地质统计学读书报告 地质统计学包含经典统计学与空间统计学,按其基本原理可定义为:地质统计学是以区域化变量理论为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性,又有结构性的自然现象的科学。其为数学地质领域中一门发展迅速且有着广泛应用前景的新兴学科。国内外的生产实践表明,地质统计学除了在异常评价、找矿勘探、矿体圈定、储量计算、采矿设计、矿山生产及地学科研等方面具有明显的优越性外,它在石油地质、第四纪地质、地层学、生物学、生态学、岩石学、地球化学、构造地质、地震地质、海洋地质、农业、水文地质、工程地质、古气候、古地理、环境、林业、医学等许多方面都有成功应用的实例。地质统计学在不到50年的研究和实践中得到了很大的发展 [1]。 一、理论研究及进展 经历了数十年的发展,地质统计学的理论与方法研究有了很大的提高[2-3]。包括:①从初期二维平面分析到三维立体空间的静态估计,发展到今天在时空域内对研究对象进行四维乃至更高维空间的动态估计和模拟。Journel[4]将克立格法的估值问题,从一般矢量空间扩展到个原始数据的全部可测度函数所形成

的矢量空间(希尔伯特空间)进行考察;②在单变量区域化变量理论的基础上,提出了适合多变量的协同区域化理论[4];③发展了许多计算变异函数(或协方差函数)的方法;④线性地质统计学与非线性地质统计学共同发展;⑤参数地质统计学与非参数地质统计学相互补充。Matheron[5]为首的参数地质统计学派以正态假设为前提,在协同区域化理论的基础上,提出多元地质统计学的基本思想。Journel发展了无须对数据分布作任何假设的非参数地质统计学,提出了一些非参数地质统计学克立格方法;⑥由于时空多元地质统计学的研究得到重视,早期空间域静态建模技术的研究逐渐过渡到研究时空域多元动态条件模拟,各种模拟方法得到了发展;⑦早期的等因子模型的因子是埃尔米特多项式,它要求原始数据服从正态分布。为了拓宽等因子模型的应用,Matheron提出了离散的等因子模型和连续的等因子模型,Rivoirard利用析取克立格技术建立了正交指标剩余模型,Lajauine和La ntuejoul等也提出了建立等因子模型的一些方法;⑧已有的地质统计学方法相互融合。如指示克立格法与协同克立格法相结合形成指示协同克立格法;指示克立格法与因子克立格法相结合形成主分量指示克立格法;协同克立格法与其它不同的线性地质统计技术相结合形成各种协同克立格技术等[6]。 这里重点介绍一下多点地质统计学[7]。多点地质统计学是相对于基于变差函数的两点地质统计学而言的。在两点统计里,储集层相关性通过空间两点协方差( 变差函数) 进行描述。在多点统计里,则是利用空间多个点组合模式进行描述。空间多点组合样式称为数据样板,如果在空间点赋予了值,则为一个特定的空间多点组合模式,称为数据事件。在建模时,对每一个未知点,估计在其处满足给定条件的数据事件出现的概率,随后抽样获得未知点处值或者数

统计学中几个基本理论

统计学中几个基本理论的释疑 文章摘要:如果仍用教材中的公式计算样本成数,则所计算出来结果就会与实际不符。 在计算加权算术平均数时,即使各组的单位数相等,权数也不一定会失去其应有的作用。正确的说法应该是:当各组权数相等且都等于某一任意常数时,权数就失去了其应有作用。此时,加权算术平均数就变成了简单算术平均数。也正是因为如此,所以我们说简单算术平均数是加权算术平均数的一个特例,是各组权数相等时的一种特殊的加权算术平均数。 对“下限在内,上限不在内”原则的辨析现行统计学教材在讲到组距式变量数列的编制时,指出“凡遇到某单位的变量值刚好等于相邻两组界限时,例行规定是将这个单位归入作为下限的组内,即所谓…下限在内,上限不在内?的原则。”代写理论统计学论文笔者认为,对其变量值刚好等于相邻两组界限值的单位,究竟是归入作为下限的组内,还是归入作为上限的组内,不应简单地像教材中所说的那样用一条“下限在内,上限不在内”的原则去解决,而是应当视变量的取值是越大越好还是越小越好来分别解决。具体说来,对于其取值越大越好的变量,当某一单位的变量值刚好等于相邻两组的界限值时,应按“下限在内 ,上限不在内”的原则归组;而对于其取值越小越好的变量,当某一单位的变量值刚好等于相邻两组的界限值时,则应按“上限在内,下限不在内”的原则归组。因为只有这样,才能将性质不同的单位分别划归到不同的组里去,从而实现统计分组的目的。否则,就不能做到这一点。以下分别举例说明。 “下限在内,上限不在内”原则的例题资料如表6所示。表 6 按耐穿时间分组(天) 鞋数(双) 280~300 300~320 320~340 340~360 360~380 2 000 3 000 26 000 8 000 1 000 ∑40 000 注:国家规定,该种鞋的耐穿时间在300天以上(含300 天)为合格。此例中,由于鞋的耐穿时间是一个取值越大越好的变量, 因此,当某一双鞋的耐穿时间刚好等于300天时,理应将其归入300天作为下限的第二组,而不应将其归入300天作为上限的第一组。因为只有这样,才能保证第一组的鞋都是不合格的,第二组的鞋都是合格品。现在如果硬要将耐穿时间刚好等于300天的鞋划归到第一组中去,则第一组的全部鞋中,既有合格品,又有不合格品,这样就达不到统计分组的目的。“上限在内,下限不在内”的原则的例题资料如表7所示因为只有这样,才能确保第三组中的零件都为不合格品。否则的话,如果硬要将尺寸误差刚好等于3mm 的零件划归到第三组中去,则就会使第三组的全部零件中,既有合格品,又有不合格品,从而也就不能达到统计分组的目的。对“整群抽样中样本成数计算公式”的质疑与释疑现行统计学教材中, 在谈到整群抽样方式下样本成数的计算公式时,往往是这样介绍的:若已知样本中各群的成数分别P1, P2, P3,…Pr,则样本成数计算公式为: P=P1+P2+P3+…Prr=∑Pir(i=1, 2, 3,…, r) 例如,从某县的50个村中随机不重复抽取5个村,对被抽中的5个村的所有养猪专业户进行全面调查,以推算该县存栏牲猪数及其优良品种率。调查结果,各村养猪专业户存栏牲猪的优良品种率分别为90%、80%、50%、70%和55%,则该县养猪专业户样本存栏牲猪的优良品种率为: P =∑Pir =90%+80%+50%+70%+55%5 =69% 笔者认为,用上述公式计算样本成数是不正确的一方面,在介绍平均数时,所有教材都讲到如果只知道若干个比率而要求计算其平均数,则最合适的方法应是简单几何平均法,而不应是简单算术平均法;另一方面,在实际抽样中,所获取的信息往往是计算各样本群成数的原始信息,此时,如果仍用教材中的公式计算样本成数,则所计算出来结果就会与实际不符。 因此,我认为,在计算样本成数时,应针对不同的已知条件,采取不同的计算方法: (1)当已知样本中各样本群内具有某种特征的单位数n1i、不具有某种特征的单位数noi和样本单位总数n三个中的任意两个时,可采用下列公式计算样本成数: P=∑n1i∑ni或=∑(ni-noi)∑ni=∑n1i∑(n1i+noi)(i=1, 2, 3, …, r) 如,假设原例中被抽中的5个村养猪专业户的存栏牲猪数分别为5 000头、8 000头、7 000头、8 800头和6 500头, 且其中的优良品种数分别为4 500头、6 400头、3 500头、6 160头和3 575头,则该县养猪专业户样本存栏牲猪

利用多点地质统计学方法模拟岩相分布

收稿日期:2005-01-18 基金项目:国家教育部高等学校优秀青年教师教学科研奖励计划(T RA POYT )资助作者简介:冯国庆(1974-),男,山东荷泽人,博士,主要从事油藏描述和油藏数值模拟研究. 文章编号:1673-064X(2005)05-0009-03 利用多点地质统计学方法模拟岩相分布 Stochastic simulation of lithofacies distribution using multi -point g eostatistics 冯国庆1,陈浩2,张烈辉1,李允1 (1.西南石油学院油气藏地质及开发工程国家重点实验室,四川成都610500; 2.新疆油田分公司陆梁油田作业区,新疆克拉玛依834000) 摘要:文中介绍了多点地质统计学的基本原理,并利用该算法模拟了我国东部某砂岩油藏的岩相分布.通过对储层非均质性模拟研究,揭示储层在岩性、物性和含油气性的各向异性或非均质性,揭示 砂体展布、连通程度以及在横向、纵向上的变化规律,有利于开发方案的制定及注采井网的布署.模拟结果表明,多点地质统计学模拟方法可以很好地再现砂体局部的变异性和非均质性.由此可得出以下结论:snesim 模拟算法可以快速灵活地进行多点地质统计模拟,多点地质统计学比两点地质统计学更具有优势. 关键词:多点地质统计学;随机模拟;训练图像中图分类号:TE19;T E121.1+5 文献标识码:A 传统的地质统计学是利用变差函数描述地质变量的相关性和变异性,通过建立在某个方向上两点之间的地质变量的变化关系来描述空间的变化特性.但是,建立在两点统计关系上的变差函数本身在描述储层非均质性上有很大的不足,它反映的仅仅是空间两点之间的相关性,不能充分描述复杂几何形状砂体如河道砂体和冲积扇砂体空间的连续性和变异性.当井资料较少时,用于计算实验变差函数的点对很少,它也就不能正确反应空间两点之间的相关性.建立在两点基础上的变差函数在储层地质建模中存在一定的不足,而多点地质统计学[1-4] 是建立在多个点的相关关系上,所以它在解决描述空间变量的连续性和变异性方面得到越来越广泛的应用.斯坦福大学的Journel 教授曾指出多点地质统计学是今后地质统计学发展的方向,它的优势已越来越显著. 1 多点地质统计学的原理 在阐述多点地质统计学之前,首先回顾一下变 差函数的地质统计学方法是如何模拟储层岩相分布的,以序贯指示模拟算法为例进行说明.该方法的基本原理[5]简述如下: 假设在模拟区域有k 种岩相s 1,s 2,,s k ,对于模拟目标区域内的每一相,定义指示变量: I (u )= 1 Z(u)I s k 0 Z(u)|s k , 对于任一待模拟点,其出现第k 种相的概率为:P (I k =1|Z(u A )=s A ,P A ),A 为待估点所包括的条件区域,利用两点地质统计学方法计算该概率是采用克里格方法: P (I k =1|Z(u A )=s A ,P A )=E (I k )+ E n A =1 K A [1-E (I k )]. 2005年9月第20卷第5期西安石油大学学报(自然科学版) Journal of Xi c an Shiy ou U niversity(N atural Science Edition)Sep.2005V ol.20No.5

[管理学]统计学实验报告

实验报告 ——(关于小麦品种对小麦产量显著性影响的分析研究) 班级:09工商2班组长:tjs学号:09513285成绩: 小组成员姓名: tjs 09513285 wdh 09513286 ww 09513287 wj 09513288 一、实验目的与意义 本文运用单因素方差分析的统计方法对小麦品种对小麦产量是否具有显著性影响进行实证研究,经过数据分析得出了不同小麦品种对小麦产量具有显著性影响的结论。 二、实验内容 1、为了研究不同的小麦品种对小麦的产量是否有显著性影响,我们选取三个小麦品种:品种1、品种 2、品种3并且对每个品种选取四个地块的产量作为观测值。设三个品种总体均值分别为μ1 μ2 μ3 提出假设:H0 :μ1 =μ2 =μ3 总体均值完全相等,自变量对因变量没有显著性影响。 H1 :μ1 μ2 μ3总体均值不完全相等,自变量对因变量有显著性影响 设置显著性水平为0.05 其数据结构如下: 2、运用spss软件进行数据处理,以下是具体操作过程 (1)选择[Analyze]=>[Compare Means]=>[One-Way ANOVA...],打开[One-Way ANOVA]主对 话框(如图所示)。

(2)从主对话框左侧的变量列表中选定小麦产量[var01],单击按钮使之进入[DependentList]框,再选定变量小麦品种[var02],单击按钮使之进入[Factor]框。单击[OK]按钮完成。 (3)生成统计结果如下:

3、结果分析 根据上面的计算结果,SS为离差平方和; df为自由度;MS为均方;F为检验的统计量;Sig=0.009 为P 值。我们直接运用计算出的P值与显著性水平α的进行比较,若P>α则不能拒绝原假设H0;若P<α则拒绝原 假设H0 ;在本题中,P=0.009<α=0.05 所以拒绝原假设H0 即小麦品种对产量有显著性影响。

统计学基础知识要点

第一章:导论 1、什么就是统计学?统计方法可以分为哪两大类? 统计学就是收集、分析、表述与解释数据的科学。统计方法可分为描述统计方法与推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据与数值型数据;按照统计数据的收集方法,分为观测的数据与实验的数据;按照被描述的对象与时间的关系,分为截面数据与时间序列数据。 按计量尺度分时:分数数据中各类别之间就是平等的并列关系,各类别之间的顺序就是可以任意改变的;顺序数据的类别之间就是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据就是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的就是现象在某一时刻的变化情况;时间序列数据所描述的就是现象随时间而变化的情况。 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体就是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就就是总体。样本就是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数就是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量就是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量就是说明现象某种特征的概念。比如商品的销售额就是不确定的,这销售额就就是变量。 第二章:数据的收集 1、调查方案包括哪几个方面的内容? 调查目的,就是调查所要达到的具体目标。调查对象与调查单位,就是根据调查目的确定的调查研究的总体或调查范围。调查项目与调查表,要解决的就是调查的内容。 2、数据的间接来源(二手数据)主要就是公开出版或公开报道的数据;数据的直接来源一就是调查或观察,二就是实验。 3、统计调查方式:抽样调查、普查、统计报表等。 抽样调查就是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查就是为某一特定目的而专门组织一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。统计报表就是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。 除此之外,还有重点调查与典型调查。 4、统计数据的误差通常就是指统计数据与客观现实之间的差距,误差的主要类型有抽样误差与非抽样误差两类。 抽样误差主要就是指在样本数据进行推断时所产生的随机误差(无法消除);非抽样误差就是人为因素造成的(理论上可以消除) 5、统计数据的质量评价标准:精度,即最低的抽样误差或随机误差;准确性,即最小的非抽样误差或偏差;关联性,即满足用户决策、管理与研究的需要;及时性,即在最短的时间里取得并公布数据;一致性,即保持时间序列的可比性;最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。 6、数据的收集方法分为询问调查与观察实验。 7、统计调查方案包括哪些内容? 调查目的即调查所要达到的具体目标;调查对象与调查单位,调查对象就是根据调查目的确定的调查研究的总体或调查范围,调查单位就是构成调查对象中的每一个单位;调查项目与调查表,就就是调查的具体内容;其它问题,即明确调查所采用的方式与方法、调查时间及调查组织与实施细则。 第三章:数据整理与展示 1、对于通过调查取得的原始数据,应主要从完整性与准确性两个方面去审核。 2、对分类数据与顺序数据主要就是做分类整理,对数值型数据则主要就是做分组整理。 3、数据分组的步骤:确定组数、组距,最后制成频数分布表 统计分组时“上组限不在内”,相邻两组组限间断,上限值采用小数点。 组中值=(下限值+上限值)/2 4、频数:落在各类别中的数据个数;频数分布指把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来;比例:某一类别数据占全部数据的比值;百分比:将对比的基数作为100而计算的比值;比率:不同类别数值的比值;分类数据的图示包括条形图与饼图。 5、直方图与条形图的差别:条形图就是用条形的长度表示各类别频数的多少,宽度则就是固定的,直方图就是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,直方图的各矩形通常就是连续排列,而条形图则就是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章:数据分布特征的测度 1、一组数据的分布特征可以从哪几个方面进行测度? 一就是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二就是分布的离散程度,反映各数据据远离其中心值的趋势;三就是分布的形状,反映数据分布偏斜程度与峰度。 2、简述众数、中位数与均值的特点与应用场合及关系。

地质统计学

地统计(Geostatistics)又称地质统计,是在法国著名统计学家G. Matheron大 量理论研究的基础上逐渐形成的一门新的统计学分支。它是以区域化变量为基础,借助变异函数,研究既具有随机性又具有结构性,或空间相关性和依赖性的自然现象的一门科学。凡是与空间数据的结构性和随机性,或空间相关性和依赖性,或空间格局与变异有关的研究,并对这些数据进行最优无偏内插估计,或模拟这些数据的离散性、波动性时,皆可应用地统计学的理论与方法。 地统计学与经典统计学的共同之处在于:它们都是在大量采样的基础上,通过对样本属性值的频率分布或均值、方差关系及其相应规则的分析,确定其空间分布格局与相关关系。但地统计学区别于经典统计学的最大特点即是:地统计学既考虑到样本值的大小,又重视样本空间位置及样本间的距离,弥补了经典统计学忽略空间方位的 缺陷。 地统计分析理论基础包括前提假设、区域化变量、变异分析和空间估值。 第一章品位与储量计算 第一节概述 投资一个矿床开采项目,首先必须估算其品位和储量。一个矿床的矿量、品位及其空间分布是对矿床进行技术经济评价、可行性研究、矿山规划设计以及开采计划优化的基础,是矿山投资决策的重要依据。因此,品位估算、矿体圈定和储量计算是一项影响深远的工作,其质量直接影响到投资决策的正确性和矿山规划及开采计划的优劣。从一个市场经济条件下的矿业投资者的角度看,这一工作做不好可能导致两种对投资者不利的决策:(1)矿体圈定与品位、矿量估算结果比实际情况乐观,估计的矿床开采价值在较大程度上高于实际可能实现的最高价值,致使投资者投资于利润远低于期望值,甚至带来严重亏损的项目。(2)与第一种情况相反,矿床的矿量与品位的估算值在较大程度上低于实际值,使投资者错误地认为在现有技术经济条件下,矿床的开采不能带来可以接受的最低利润,从而放弃了一个好的投资机会。 然而,准确地估算出一个矿床的矿量、品位绝非易事。大部分矿体被深深地埋于地下,即使有露头,也只能提供靠近地表的局部信息。进行矿体圈定和矿量、品位估算的已知数据主要来源于极其有限的钻孔岩心取样。已知数据量相对于被估算的量往往是一比几十万乃至几百万的关系,即对一吨岩心进行取样化验的结果,可能要用来推算几十万乃至几百万吨的矿量及其品位。可以不过分地说,矿量、品位的估算是世界上最大胆的外推。因此,矿体圈定与矿量、品位估算不仅是一项十分重要的工作,而且是一项极具挑战性的工作。做好这一工作要求掌握现代理论知识与手段,并应用它们对有限的已知数据进行各种详细、深入的定量、定性分析;同时也要求从事这一工作的地质与采矿工程师具有科学的态度和求实精神。 本章将较详细地介绍当今世界上常用的矿量、品位估算方法,包括探矿数据的分析、处理和用于品位估值的剖面法、平面法及矿床模型法等。地质统计学作为品位估值的一种方法,从其诞生起就显示了强大的生命力,得到了越来越广泛的应用,本章对此给予较大的篇幅。本章的主要目的不是教会读者如何一步一步

管理统计学-假设检验的SPSS实现-实验报告

假设检验的SPSS实现 、实验目的与要求 1. 掌握单样本 t检验的基本原理和 spss实现方法。 2. 掌握两样本 t检验的基本原理和 spss实现方法。 3. 熟悉配对样本 t检验的基本原理和 spss实现方法。 二、实验内容提要 1. 从一批木头里抽取 5根,测得直径如下(单位: cm),是否能认为这批木头的平均直径是1 2.3cm 12.3 12.8 12.4 12.1 12.7 2. 比较两批电子器材的电阻,随机抽取的样本测量电阻如题表2所示,试比较两批电子器 材的电阻是否相同(需考虑方差齐性的问题) 3. 配对 t检验的实质就是对差值进行单样本t检验,要求按此思路对例课本 13.4进行重新分析,比较其结果和配对 t检验的结果有什么异同。 4.一家汽车厂设计出 3种型号的手刹,现欲比较它们与传统手刹的寿命。分别在传统手刹,型号I、II、和型号 III中随机选取了 5只样品,在相同的试验条件下,测量其使用寿命(单位:月),结果如下: 传统手刹:21.213.417.015.212.0 型号 I :21.412.015.018.924.5 型号 II :15.219.114.216.524.5 型号 III :38.735.839.332.229.6 ( 1)各种型号间寿命有无差别 ? (2)厂家的研究人员在研究设计阶段,便关心型号III 与传统手刹寿命的比较结果。此时应 当考虑什么样的分析方法?如何使用 SPSS实现? 三、实验步骤 为完成实验提要 1. 可进行如下步骤 1. 在变量视图中新建一个数据,在数据视图中录入数据,在分析中选择比较均值,单样本t 检验,将直径添加到检验变量,点击确定。

统计学基础知识及其概念

一、概念篇 总体:总体是指客观存在的,在同一性质基础上结合起来的许多个别事务的整体,亦称统计总体。 总体单位:总体单位是指构成统计总体的个别事物的总称。 指标:指标是反映总体现象数量特征的概念。 标志:标志是说明总体单位特征的名称。 统计调查:是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地向客观实际搜集统计资料的过程。 调查对象:是根据调查目的、任务确定的调查的范围,即所要调查的总体,它是由某些性质上相同的许多调查单位所组成的。 调查单位:是所要调查的现象总体中的个体,即调查对象中的一个一个具体单位,它是调查中要调查登记的各个调查项目的承担者。 报告单位:是负责向统计调查机关提交调查资料的单位。 普查:是专门组织的一次性的全面调查,用来调查属于一定时点上或时期内的现象的总量。 抽样调查:是从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。抽样调查又称为概率抽样或称为随机抽样。 抽样调查是抽取总体重的部分单位,收集这些单位的信息,用来对总体进行推断的调查方法。这里的总体是指抽样推断所要认识的研究对象的整体,它是由所要研究的范围内具同一性质的全体单位所组成的整体。被抽中的部分单位构成样本。一般的,将总体记作N,将样本记作n。 面谈访问法:是由访问员与被调查者见面,通过直接访问来填写调查问卷的方法。 统计整理:是统计工作的一个重要环节,它是根据统计研究的任务与要求,对调查所取得的各种原始资料,进行审核、分组、汇总,使之系统化、条理化,从而得到反映总体特征的综合资料的过程。 复合分组:对同一总体选择两个或两个以上的标志重叠起来进行分组。 复合分组体系:多个复合分组组成的分组体系。 频数:是指分配数列中各组的单位数,也称次数。 频率:是将跟组的单位数(频数)与总体单位数相比,求得的用百分比表示的相对数,也称比率或比重。 统计指标:是反映总体现象数量特征的基本概念及其具体数值的总称。 总量指标:是反映总体规模的统计指标,表明现象总体发展的结果。 平均指标:是总体各单位某一数量标志一般水平的统计指标。 是将一个总体内各个单位在某个数量标志上的差异抽象化,以反映总体的一般水平的综合指标。 标志变异指标:是表明总体各个单位标志值的差异程度(离散程度)的指标。 强度相对指标:是不属于同一总体的两个性质不同但相互间有联系的总量指标对比的比值,是用来反映现象的强度、密度和普遍程度、利用程度的综合指标。 加权算数平均数:是在总体经过分组形成变量数列(包括单项数列和组距数列),有变量值和次数的情况下,将各组变量值分别与其次数相乘后加总求得标志总量,再除以总体单位数(即次数总和)而求得的数值。 标准差:是总体各单位变量值与其平均数的离差平方的算术平均数的平方根。 发展速度:是表明社会经济现象发展程度的相对指标,它是根据两个不同时期发展水平对比求得,说明报告期水平是基期水平的几倍或百分之几,常用倍数或百分数来表示。由于所采用的基期不同,发展速度又可分为定基发展速度和环比发展速度。 概率抽样:概率抽样在抽取样本时不带有任何倾向性,它通过从总体中随机抽选单位来避免这种偏差,因而对总体的推断更具代表性。 比例分析法:比例分析法又名“比率分析法”,是用倍数或百分比表示的分数式,即通过计算相关指标之间的相对比值,来揭示和对比不同规模、不同性质事物的水平和效益的好坏,或分析部分和整体之间比例关系的分析方法。 国家统计报表制度:国家统计报表制度是各级政府统计部门实施国家统计调查项目的业务工作方案,由国家统计局制定,或者由国家统计局和国务院有关部门共同制定。 现行国家统计报表制度分为周期性普查制度、经常调查制度和非经常性调查制度三大类。 周期性普查制度:是国家统计报表制度的一个类型,是就我国社会经济发展的状况,由国务院组织,每隔一段时

《管理统计学》实验报告

《管理统计学》实验报告 学号: 姓名: 班级: 指导老师: 2020年9 月11 日

目录 熟悉SPSS的使用方法___________________________________________________________ 3实验(或实训)总结、评价 ____________________________________________________ 6描述统计、参数估计及假设检验 _________________________________________________ 6实验(或实训)总结、评价 ___________________________________________________ 24方差分析(含单因素和双因素) ________________________________________________ 24实验(或实训)总结、评价 ___________________________________________________ 31相关系数、回归参数估计和检验 ________________________________________________ 32实验(或实训)总结、评价 ___________________________________________________ 36

熟悉SPSS的使用方法 一、实验目的、任务 (1)了解SPSS 的运行模式,熟悉其主要窗口的结构; (2)理解并掌握有关数据文件创建和整理的基本操作,学习如何将收集到的数据输入计算机,建成一个正确的 SPSS 数据文件; (3)掌握如何对原始数据文件进行整理,包括数据查询,数据修改、删除,数据的排序等。 二、实验基本内容 (1)SPSS的启动和退出方法; (2)创建数据文件和读取外部数据的方法; (3)数据的编辑、保存和整理。 实验(实训)结果 例题:实验原始数据 某航空公司38 名职员性别和工资情况的调查数据,如表所示,试在SPSS 中进行如下操作: 1、将数据输入到SPSS 的数据编辑窗口中,将gender 定义为字符型变量,将salary 定义为数值型变量,并保存数据文件,命名为“实验1.sav”。 /插入一个变量income,定义为数值型变量。 将数据文件按性别分组。 查找工资大于40000 美元的职工。 当工资大于40000 美元时,职工的奖金是工资的20%;当工资小于40000 美元时, 职工的奖金是工资的10%,假设实际收入=工资+奖金,计算所有职工的实际收入,并添加到income 变量中。

2016中级统计师真题_统计学基础理论与相关知识

2016中级统计师《统计学基础理论及相关知识》真题 i ?在你拿到试卷的同时将得到一份专用答题卡,所有试题均须在专用答题卡上作答, 卷或 草稿纸上作答不得分。 2?答题时请认真阅读试题,对准题号作答。 一、单项选择题(以下每小题各有四项备选答案,其中只有一项是正确的。本题共 每小题1分。) 1 ?统计分析中研究如何用样本统计量估计总体参数的统计方法是( )。 A. 描述统计 B. 推断统计 C. 理论统计 D. 数理统计 2.天气形势”、职业”等是从现象的属性来表现现象的特征,这类变量属于( ) A. 定性变量 B. 定量变量 C. 定距变量 D. 定比变量 3 ?在抽取样本单位时,如果先将总体分成组,然后在每一组中随机抽选样本单元,这种抽 样的方法 是()。 A. 简单随机抽样 B. 分层抽样 C. 系统抽样 D. 整群抽样 4?能够反映变量分布的统计图是( )。 A. 饼图 B. 散点图 C. 环形图 D. 直方图 5.有一数列 59、44、38、22、90、32,其中位数是( )。 在试 40分,

A.38 B.22 C.41 D.30 6?某地区2015年居民的月平均收入为5200元,标准差为200元。则该地区居民收入的离 散系数为()。 A.19.61% B.3.85% C.0.15% D.0.27% 7?张红是某大学一年级的学生,她参加了微积分的两次考试。第一次考试中,全班的平均成绩是75分,标准差是10分;第二次考试中,全班的平均成绩是70分,标准差是15分。张红每次考试成绩都是85分。假定考试分数近似服从正态分布,则张红两次考试的成绩在班里的相对位置()。 A.不相同,第一次比第二次好 B.不相同,第二次比第一次好 C.相同 D.因为不知道班里人数而无法判断 8?某学校10000名女生身高服从正态分布,其均值为160cm,标准差为5cm,其中6827 名女生身高的可能范围是()。 A.160cm 到165cm B.150cm 到170cm C.155cm 到165cm D.155cm 到160cm 9.从一个服从正态分布的总体中随机抽取样本容量为n的样本,在95%的置信度下对总体 参数进行估计的结果为:20+0.08。如果其他条件不变,样本量扩大到原来的4倍,则总体参数的置信区间应该是()。

地质统计学反演

地质统计学反演(StatMod) 一、方法原理 JASON的StatMod是一个集多种随机模拟技术的软件包,是以概率论为其理论基础的。其目的是提供一个或多个在某种概率条件下的,既满足数据的地质统计学特征又满足地质、测井和地震信息的三维储层参数概率模型。数据的地质统计学特征由数据的概率分布图和变异函数描述。 由于地质统计模拟是基于概率意义上的随机模拟。为满足概率条件必须有足够多的井资料。软件要求的已知井数不少于6口。 地质统计学主要的算法是岩性指示模拟和序贯高斯模拟技术(SGS)。 序贯高斯模拟方法是一种产生来自高斯场模型实现的方法。它基于序贯模拟思想。该方法首先是将研究区域离散为网格系统,然后序贯地处理每一个网格节点。由于每个节点处随机变量是服从条件化的正态分布,因此,网格节点值完全由均值和方差两个参数确定。通过求解克里金方程组就可给出该网格节点处的均值和方差,从而将节点处的正态分布确定下来,并采用相应的抽样方法得到该网格节点处的一个样本。直至全部网格节点计算完毕。需要指出的是:求解克里金方程组时的条件数据包括原始数据,先前已模拟的、落在模拟邻域内所有被模拟的网格节点处的值。序贯高斯模拟方法是一种条件模拟,它保证原始数据和直方图及变异函数都被条件化。在地震储层预测中,每一道就是一个网格节点。 在模拟过程中,需要求取的最典型的属性是波阻抗和孔隙度。地质统计学考虑了模拟过程中结果的不唯一因素,故而增加了结果的误差分析。通过用户定义方式在三维地质模型的每个网格节点上计算出的概率密度函数,可以计算出结果数据体。概率密度函数是数据体中能够对不确定性进行正常估算的参数分布规律。 地质统计学反演对测井曲线的应用方式,与Jason其它的反演方法截然不同。Jason其它反演方法再队测井曲线进行应用过程中,除子波估算外。只有在地震数据中没有低频信息时,在最终的反演结果中才会反映测井曲线的信息。然而地质统计学将重采样后的测井曲线沿井轨迹复制到三维网格点中。在这种方式下,测井曲线被认为是“Priori”类型的信息,因此,在开展地质统计学反演之前,开展其它类型的常规反演就显得十分重要。只有这样,我们才能够确保曲线和地震数据具有一致性,代表了相同带限的地质模型。因此,地质统计学反演比其它类型的反演具有如下技术优势: 1 小井距间的精细尺度内插 2能够进行误差估算,进而评价风险 3改善常规反演结果的分辨率 4能够生成岩性类型数据体,如砂岩和泥岩

统计学实验报告【最新】

统计学实验报告 一、实验主题:大学生专业与实习工作的关系 二、实验背景: 二十一世纪的今天大学生已是一个普遍的社会群体,高校毕业人数日益增加,社会、企业所提供的职位日益紧张,大学生就业问题是当今社会关注的焦点。面对日益沉重的就业压力,越来越多的大学毕业生选择了企业需求的职业,而这种职业与自己在校所学专业根本“无关”或相去甚远,大学毕业生就业专业不对口的现象非常严重。专业对口是个广义的概念,就是说你所学的专业与你所作的工作相关,比如你专业是会计,工作后你到了一个企业做会计,或者到银行做柜员,这都是与经济相关的,这就是对口。如果你学机械设计,但工作后却做了统计员,业务员等于你所学专业无关的工作,这就叫专业不对口。专业不对口导致毕业生所学知识没有用武之地,所以这是一种人力资源的浪费。 三、实验目的: 大学生就业专业不对口是客观存在的问题,我们研究此问题有这几点目的:①了解当代大学生实习工作与专业是否对口的情况,当代大学生对工作与专业不对口现象的态度。②分析大学生就业结构和

专业对口问题,了解当今大学生专业对口情况,为以后大学生选择专业、选择工作岗位提供有效的信息和借鉴。③寻找导致专业不对口的原因,以减少社会普遍存在的人力资源的浪费。 四、实验要求:就相关问题收集一定数量的数据,用EXCEL进行如下 分析:1进行数据筛选、排序、分组;2、制作饼图并进行简要解释;3、制作频数分布图,直方图等并进行简要解释。 五、实验设备及材料:计算机,手机,EXCEL软件,WORD软件。 六、实验过程: (一)制作并发放调查问卷。 (二)收回并统计原始数据:收回了102名大学生填写的调查问卷,并对相关数据进行统计。 (三)筛选与实验相关问题: 1.您的性别( ): A. 男B.女

相关文档
最新文档