数字资源整合研究领域的文献计量分析

计量研究方法

計量研究方法 Quantitative Research Methods 陳建州南華大學教育社會學研究所與社會學研究所計量研究方法是社會學重要的分析方法之一。本課程將介紹量化研究的特性及常見的分析方法，並釐清重要觀念，以避免統計的誤用與濫用，使學習者能正確運用，並能獨立完成研究。課程進度：第一週2008.09.18 課程簡介；選定主題第二週2008.09.25 概念化、操作化與測量陳文俊譯（2005）。社會科學研究方法。第五章「概念化、操作化及測量」。載於Earl Babbie原著，社會科學研究方法（The Practice of Social Research），頁161-205。台北：雙葉。第三週2008.10.02 指數、量表及分類法陳文俊譯（2005）。社會科學研究方法。第六章「指數、量表及分類法」。載於Earl Babbie原著，社會科學研究方法（The Practice of Social Research），頁207-243。台北：雙葉。

第四週2008.10.09 抽樣、問卷設計陳文俊譯（2005）。社會科學研究方法。第七章「抽樣的邏輯」。載於Earl Babbie 原著，社會科學研究方法（The Practice of Social Research），頁 245-297。台北：雙葉。陳文俊譯（2005）。社會科學研究方法。第九章「抽樣調查」。載於Earl Babbie 原著，社會科學研究方法（The Practice of Social Research），頁 329-382。台北：雙葉。第五週2008.10.16 問卷處理與列表實例示範。第六週2008.10.23 抽樣分配、點估計、信賴區間 Chap 6-9, Wonnacott T. H. and R. J. Wonnacott (1990).Introductory statistics for business and economics. New York : John Wiley & Sons. 江建良（1999）。第8章「推論（一）--估機」。統計學。頁231-280。台北：龍騰。江建良（1999）。第9章「推論（二）--假設檢定」。統計學。頁285-343。台北：龍騰。第七週2008.10.30 迴歸分析Ⅰ：迴歸模型的假設條件與解釋 Chap. 1-2, Wonnacott, Thomas H and Ronald J. Wonacott. 1981. Regression: A Second Course in Statistics.FL: Krieger Publishing Company. 鄭旭智、張育哲、潘倩玉、林克明譯（2002）。第二章「連續結果變項—線

测量系统分析方法82638

测量系统分析(MSA)方法测量系统分析(MSA)方法**** 1.目的对测量系统变差进行分析评估，以确定测量系统是否满足规定的要求，确保测量数据的质量。 2.范围适用于本公司用以证实产品符合规定要求的所有测量系统分析管理。 3.职责质管部负责测量系统分析的归口管理; 公司计量室负责每年对公司在用测量系统进行一次全面的分析; 各分公司(分厂)质检科负责新产品开发时测量系统分析的具体实施。 4.术语解释测量系统(Measurement system)：用来对被测特性赋值的操作、程序、量具、设备以及操作人员的集合，用来获得测量结果的整个过程。偏倚(Bias):指测量结果的观测平均值与基准值的差值。稳定性(Stability):指测量系统在某持续时间内测量同一基准或零件的单一特性时获得的测量平均值总变差,即偏倚随时间的增量。重复性：重复性（Repeatability）是指由同一位检验员,采用同一量具,多次测量同一产品的同一质量特性时获得的测量值的变差。再现性: 再现性(Reproductivity) 是指由不同检验员用同一量具，多次测量同一产品的同一质量特性时获得的测量平均值的变差。分辨率（Resolution）:测量系统检出并如实指示被测特性中极小变化的能力。可视分辨率（Apparent Resolution）:测量仪器的最小增量的大小,如卡尺的可视分辨率为。有效分辨率（Effective Resolution）:考虑整个测量系统变差时的数据等级大小。用测量系统变差的置信区间长度将制造过程变差（6δ）（或公差）划分的等级数量来表示。关于有效分辨率，在99%置信水平时其标准估计值为GR&R。分辨力(Discrimination):对于单个读数系统,它是可视和有效分辨率中较差的。盲测:指在实际测量环境中,检验员事先不知正在对该测量系统进行分析，也不知道所测为那一只产品的条件下,获得的测量结果。计量型与计数型测量系统:测量系统测量结果可用具体的连续的数值来表述,这样的测量系

文献计量学实务

第三章文献计量学实务 (1) 第一节Web of Science (1) 第二节运用Excel (2) No.1 文章类型 (5) No.2 语言 (6) No.3 期刊 (6) No.4文章页数 (6) 参考文献数 (6) No.5国家分析 (6) No.7国家分析 (9) No.6作者分析 (11) No.7成长趋势 (12) 影响因子 (13) 作者关键词 (13) 研究领域 (14) 文献计量模式分析 (14) 被引用率 (14) 第三节 (14) 第四节 (15) 第五节 (15) 第三章文献计量学实务第一节Web of Science 进行搜索：在search框内敲入所需要查找的关键词，不同关键词间用and或or连接。如通常格式可为：（XX or XX or XX）and XX*。*可要可不要，表示后续内容可任意。点击search。 (如：搜索吸附领域粘土的文献，可敲入：（adsorption or sorption） and clay*。点击Refine your results下的Subject Categories从众多领域中选出所需要关注的领域内的文章，点击VIEW RECORDS。对所有文献进行了初步筛选。 Add to marked list 在网页右下方Output Records:下的Records选择所需要输出的文献序号，ISI一词输出可以最多500篇，所以我们通常选1－500，依次501——1000，等等。点击右下Add to marked list。此时网页整上方会出现有红勾的Add to marked list，点击。

Step 1. Select the fields to include in the output下选择所需要输出的数据项。通常我们做分析时候应选上除cited references和abstract外的所有项。这两项是由于内容较多，EXCEL 处理起来不便，所以通常不选。 Step 2. Select an option.我们需要选择的是Tab Delimited(Windows). 接下来很重要的一步是我们应在“Automatically delete selected records from the Marked List after output is complete.”前打勾，否则在后续输出时候会因对前面输出项目的记忆造成干扰。点击SAVE TO FILE。在下个网页中会输出一个记事本（.txt）格式的文档，对其内容全选复制贴贴入新建EXCEL中，便自动输出各项数据。此时可进行下一查找：直接点击BACK,然后RETURN 即可。需要注意的是在后续贴入EXCEL时，每次再贴入EXCEL的第一行都是标题，应该删除。重复执行，最终便可得到我们所需领域的文献数据。如果我们在电脑里安装有软件Reference Manager或者 EndNote，也可直接将文献输出其中进行管理。前面的操作基本雷同，只是再Add to marked list后Step 1. Select the fields to include in the output后所选项重点可变为选择Author(s)，Title，Title，abstract*，keywords及times cited等所需项。Step 2. Select an option.我们需要选择的是 Field Tagged.然后在下面小方框打勾，再点击SAVE TO FILE。第二节运用Excel 通过第一节我们对所需查找领域文献全部已经输出为EXCEL形式数据，接下来可对其进行整理分析。（一）前期处理步骤： 1．首要的工作是保存好原始数据，在EXCEL里将其所在sheet命名为OD （original data的缩写），方便我们在后续处理工作中进行核对。 2．数据的初步处理，包括：（1）先从原始数据库中找到我们想要进行分析的部分保留，其它意义不大的可直接删除。新建一个sheet，将OD的全部数据复制过来，将其命名为D。可删除的列有：CA,SE,AB,EM，CR,PU,PI,PA,J9,JI,PD,VL,IS,PN,SU,SI,BP,EP,AR,DI,GA 。（注：各列title所代表的含义见附二。）（2）可将年份PY进行排列，如从按Z→A降序排序得2006→1995，按A→Z则相反。因为我们从WOS中所下当年的文献只是一部分，数据不完全，所以在分析

文献计量学综述

文献计量学综述一、起源及发展早在20世纪初，人们已经开始对文献进行定量化研究，但是当时文献计量学并没有作为一门独立的学科而存在。直到1969年，英国著名情报学家阿伦.普理查德首次提出术语“Bibliometrics”，这一术语的出现标志着文献计量学的正式诞生。三阶段：萌芽、发展和分化萌芽（1917-1933）这一时期文献研究人员首创文献统计方法,并在一些学科领域解剖学和化学专业进行了文献计量分析的大胆尝试,取得了一定的成果。这些研究都为文献计量学的诞生与后期的发展奠定了基础发展（1934- 1960）年注重理论研究与规律发现，著名的文献计量学的三大基本定律中的布拉德福定律以及齐普夫定律就是在这一时期发现的到成熟与分化阶段全面发展与分化时期(1960年至今) 这一时期文献计量学已由狭隘的理论研究发展到了广阔的应用研究和指标的研究,同时涉及的领域和主题也越来越多。迁移衍生：专利计量学文献计量学网络计量学政策计量学二、概念界定文献计量学是以文献体系和文献计量特征为研究对象,采用数学、统计学等计量研究方法, 研究文献信息的分布结构、数量关系、变化规律和定量管理,并进而探讨科学技术的某些结构、特征和规律的一门学科。可以定量地揭示某一学术领域的发展历程、研究重点以及未来的研究方向。目前，文献计量分析已被看作总结历史研究成果、揭示未来研究趋势的一种重要工具。学科交叉使得文献计量研究内容体系日益丰富。数学中的图论、社会学中的社会网络分析、物理学中的复杂网络等理论与方法均被移植到文献计量学的研究体系中。三、三大定律布拉德福定律该定律描述文献分布规律，利用刊载某专业论文的数量来确定该专业的核心期刊，应用于指导文献情报工作和科学评价。齐普夫定律该定律用以统计文献中的词频，通过文献的词频分析可确定学科或行业的研究热点和研究趋势。洛特卡定律该定律描述著者人数与所著论文之间的关系。探讨了科学论文著者分布平衡的规律，在宏观的科学著作活动中，少数作者写出了大量文章，大多数人的著作还是很少的。依此定律推论出“杰出科学家数目仅是科学家数目的平方根”。从表面上三大定律的统计对象各异，其结论也不尽相同，但是它们的研究方法存在着某些相似之处，事实上它们属于同一个分布体系。该体系被称为布－齐－洛体系。如果把期刊、字词、书籍、文章等称为信息发生源，将作品、论文、字词的出现、书籍的使用、文章的被引等称为产物，那么文献计量学的规律可认为是发生源数量与产物数量之间存在的函数关系。

23种计量学习方法

首先，我们对前面介绍的方法进行简单的归纳。我们把研究方法分为三个层面，即方法论、一般方法和特殊方法。在一般方法层面又分为定量研究和定性研究方法，而定量研究方法所涵盖的内容最多，也是社会科学研究中使用最为广泛的方法，规范的定性研究方法在中国使用得并不多。这主要是因为中国学者对定性研究有自己的理解，甚至把理论研究、思辨研究都称为定性研究，这是错误的。定咸研究方注定忤研禿方法丄[ 丄 I ■「 ] 坨济学恃室方法沁介学畅定方法人瓷学騎定方法研究方法的三个层次 F 面给出23种具体定量研究方法的名称: 10) 分层分析 11) 纵向分析 12) 路径分析 13) 结构方程模型 14) 项目评估方法 15) 系统动态学 16) 贝叶斯方法 17) 队列分析 18) 随机过程或马尔科夫链多元数据分析 9) 1) 社会科学应用统计学原理 2) 社会测量方法 3) 实验设计方法 4) 抽样调查方法 5) 应用线性回归模型 6) 分类数据分析 7) 生存分析（或事件史分析） 8) 空间数据分析

19)系统仿真方法 20)文献分析方法 21)内容分析方法 22)势分析方法 23)复杂调查数据分析方法在一般方法中的定性研究方法中，给出了下面几种方法: 1) 叙述研究 2) 现象学 3) 扎根理论 4) 民族志 5) 案例研究 6) 焦点组讨论上面所列的研究方法课程，并不是可以随便想学哪一门课就可以学哪一门课的，它们之间具有内在逻辑联系。要想系统学习社会科学研究方法，需要遵循这种内在的逻辑顺序，否则会影响对内容的理解。学习社会科学研究方法，第一门课应该是“研究设计和研究方法”。学习这门课，可以对社会科学研究的基本思路、原理、过程、各类方法等有基本的、全面的理解。在这门课中还会介绍一些简单的、与社会测量有关的内容，包括实验设计、问卷设计、抽样设计等。学完这门课以后，有人喜欢继续学习定量研究方法，也有人可能会喜欢学习定性研究方法，那么就可以开始学习第二个层次的课程。目前，国内社会科学领域均把定性研究方法作为独立的一门课。尽管这属于一类方法，其中还有很多具体的研究方法，但目前还很少有学校把每一种具体方法设置为一门课。学习定性研究方法，通常不需要任何前修课，但最好能够有过一些研究的经历，并掌握一定的社会科学理论。对从来没有学过定量分析方法特别是统计学方法的人来说，最好从统计学基础课开始学。“社会科学应用统计学原理”被称为应用统计学或定量研究方法的第一门课。它将介绍统计学的基本概念、原理，以及针对单变量和双变量的描述、解释和推断方法。学完了解决单变量和双变量问题的方法以后，就将学习多变量问题的方法。针对多变量问题，最重要也是最基础

计量方法的步骤

计量方法的步骤第一，确定研究课题。依据题目明确取得统计数据的资料对象，确定统计数据的具体项目。第二，确定数据资料的代表性。在研究课题确定后，要支研究那些用来解决这一课题的史料内容，确定这些数据资料的置信度和准确度，以及这些数据资料对于解决所确定的课题有多在代表性，即它们能在多大程度上正确地揭示研究对象的实质。第三，利用电子计算机系统地整理、储存史料。这是在历史研究中使用计量研究法的必要条件，也是进一步采用数学分析和数学模型方法的前提。其具体步骤是：第一，编制运算程序；第二，将数据输入电子计算机；第三，计算机按照指令进行运算；第四，计算机输出资料和信息。第四，对数据资料进行计量分析。这是历史研究中运用计量研究法中的一个关键性步骤。根据所使用的统计方法难易程度的不同，又把计量分析划分为描述性统计和分析性统计两种。描术性统计不需要高深的统计学知识，便于掌握，并且应用这种方法所得出的结论容易理解，因而为大多数计量史学家所采用。常见的描述性统计有以下几种方法：其一，次数分布法。这是对变量矩阵的再处理，往往以表格的形式显示出来。其二，图表法。就是计量史学家依据对其数据资料的分类，制成相应的图表。常见的图表有条形图、直方图、曲线图、离散性图、比率图等。其三，概括法。就是在大量同质的数据中，利用统计学求出那些数量上能反映总体的基本特征和规律性的指标，如算术平均数、几何平均数、中位数等。其四，动态分析法，又称时间数列分析法。就是将反映某一历史现象的统计指标按时间的先后顺序排列起来，形成数列。它又分为绝对动态数列、相对动态数列，平均数动态数列。动态分析法从数量方面研究历史现象发展变化的趋势和速度，揭示历史现象各个发展阶段的特点和规律，因而在计量研究法中占有重要地位。分析性统计的实质在于利用较为复杂的数理统计方法，从一些相关的数据中推断历史现象的变化情况。其具体方法有相关分析、路径分析、因素分析、对数曲线、对数百分比等几种。分析性统计要求较深的数理统计方面的理论和技巧。第五，制定数学模型，进行模拟研究。使用数学方法分析数据资料，目的就是要建立这些资料的数量形式的数学模型。数学模型是研究对象的基本实质的抽

Bibexcel进行文献计量分析和引文分析快速指南

Bibexcel进行文献计量分析和引文分析快速指南 Alan Pilkington 【a.pilkington@https://www.360docs.net/doc/9316051010.html,】概述与安装本人使用Bibexcel业已多年，一直向大家推荐这个工具。但是，总是被人们问及如何上手使用，每次拿它进行分析的时候，总是要回头再次读一读自己手写的笔记。所以，我感到有必要就如何利用Bibexcel进行文献计量分析写出一个介绍性的东西，希望能给大家提供有用的信息。如果有任何建议或者发现任何错误，请通知我。 Bibexcel是一个用于文献计量分析、特别是引文分析的完美工具。用户可以在www.umu.se/inforsk网站上获得最新版本。其安装也十分简单，只需要把文件拷贝到硬盘的目录下即可，记住要把帮助文档也放在一个目录下。如果本指南不能满足你的需求请到该网站上浏览网页。利用Bibexcel进行引文分析第一步要有用于分析的来源数据。在引文分析中，来源数据就是从《科学引文索引》、《社会科学引文索引》中检索到来源文献。这两个数据库是商业数据库，是Web of Science或者ISI数据服务的组成部分，你所在的大学可能已经订购了它们。《科学引文索引》和《社会科学引文索引》的使用和平时一样，使用WOS/ISI检索功能检索到来源文献。在开始下载文献之前，必须了解你研究的内容。如果是对一种期刊的文章内容进行分析，其来源文献很容易确认下来。比较复杂的研究有可能是针对某一作者或者大学的某个系的文献记录。无论你的计划是什么，如果你是要从《科学引文索引》和《社会科学引文索引》中下载数据，下载和准备数据的步骤都是一样的：在WOS，下载前需要对要下载的记录进行标记。然后开始下载所选择的论文，保证下载项目中包括论文的引文。可以通过“download for future analysis （为进一步分析而下载）”或者通过电子邮件发给自己，两种方式都生成纯文本文件。如果下载的文献记录过多，下载中有的时候会导致数据传输超时。可以打开已经得到的文件查看（可以用Bibexcel中左上角的窗口找到文件，在左下角的窗口中可以看到文件的内容，也可以使用文本编辑器），找到文件的最后几行，看看是否存在HTML格式错误，如果有错误就表明下载中出现了超时。如果出现超时，解决的办法只有重新下载并注意减少下载记录的数量，比如减少检索的年限。如果是分段下载的，必须记住，在下一步分析之前，要把分离的文件重新组合到一起。用文本编辑器（如记事本）打开这些文件，剪切和粘贴，要保证在合成的文件的顶部只有一个文件头，而不是在已下载的每一个部分的开头： FN ISI Export Format VR 1.0 利用文本编辑器可以很容易查看纯文本中的数据，但是在使用诸如MS wor d之类的字处理器时候要当心，因为它们会增加字符、重新定义过的行格式和其他可以在后来引起问题的东西。

第三讲：计量分析方法

第三讲：计量分析方法一、回归分析 ●回归的本质英国著名遗传学家弗朗西斯·高尔顿（Si r Francis Galton,1822-1911）在子女与父母相像程度遗传学研究方面，取得了重要进展。高尔顿的学生卡尔·皮尔逊（Karl Pearson,1857-1936）在继续这一遗传学研究的过程中，测量了1078个父亲及其成年儿子的身高。在高个子人群中，下一代的平均身高会低于高个子本代的平均身高；而在矮个子人群中，下一代的平均身高则会超过本代的平均身高，也就是人的身高存在一种趋势，即向整个人群平均身高靠拢的趋势。高尔顿将变量向均值靠拢的趋势称为“回归” ◇回归的本质：用X来推断Y（利用样本数据来估计未知参数向量β），而非“预测”Y。＊能否进行经济预测？

● 理论回归模型 ◇ 简单回归模型：一元线性回归＊最小二乘法（OLS ）： εββ++=x y 10 y ：因变量、被解释变量、响应变量，等 x ：自变量、解释变量、控制变量，等 ε（μ）：误差项、残差项、扰动项，等，观察不到的因素。最小二乘方法是选择β的值，使得残差平方和达到最小。 () =--= ∑∑2 102 i i x Y ββε () ∑--2 10min i x Y ββ ◇ 参数估计对0β 和1β 求一阶偏导数，并令其=0.，可得： 1 β =()()()∑∑---2 x x Y Y x x i i i = ∑∑--2 2 x n x Y x n Y x i i i 0β =x Y 1β -

残差( )x Y Y Y 10ββε +-=-= 残差平方和（RSS ） ( )[] 2 102 +-=x Y ββε 计算顺序： ①求0β 和1β ：1β =2013 =0.65， 0β =0.3 ②求估计值和残差：i Y =0β +1β i x =0.3+0.65i x i ε =i y -i Y == 2 3.22 s 1.15 2 β s =() 005 .10676 696469615.1=-?? * 0β s =3.163 2 1 β s =0575 .0676 69615.1=- *1 β s =0.240

文献计量学分析

文献计量学用数学和统计学的方法，定量地分析一切知识载体的交叉科学。它是集数学、统计学、文献学为一体，注重量化的综合性知识体系。其计量对象主要是：文献量（各种出版物，尤以期刊论文和引文居多）、作者数（个人集体或团体）、词汇数（各种文献标识，其中以叙词居多）文献计量学最本质的特征在于其输出务必是“量”。文献计量学是以几个经验统计规律为核心的。例如：表征出科技文献作者分布的洛特卡定律(1926)；表征文献中词频分布的齐普夫定律(1948)；确定某一学科论文在期刊中分布的布拉德福定律(1934)等。文献计量学一直围绕这几个定律，沿着两个方向发展：其一是验证与完善这些经验定律；其二是扩大与推广这些经验定律的实际应用。洛特卡定律：洛特卡定律是由美国学者A.J.洛特卡在本世纪20年代率先提出的描述科学生产率的经验规律，又称“倒数平方定律”。它描述的是科学工作者人数与其所著论文之间的关系：写两篇论文的作者数量约为写一篇论文的作者数量的1/4;写3篇论文的作者数量约为写1篇论文作者数量的1/9;写n篇论文的作者数量约为写一篇论文作者数量的1/ n2……，而写一篇论文作者的数量约占所有作者数量的60％。该定律被认为是第一次揭示了作者与数量之间的关系。 f x=?/x2=0.6079/x2 x为科学工作者发表的论文数量；f x为发表x篇论文的著者出现的频率；C 为常数。齐普夫定律：齐普夫定律是美国学者G.K.齐普夫于本世纪40年代提出的词频分布定律。它可以表述为：如果把一篇较长文章中每个词出现的频次统计起来，按照高频词在前、低频词在后的递减顺序排列，并用自然数给这些词编上等级序号，即频次最高的词等级为1，频次次之的等级为2，……，频次最小的词等级为Ｄ。若用f表示频次，r表示等级序号，则有f*r＝C（C为常数）。人们称该式为齐普夫定律。布拉德福定律：布拉德福定律是由英国著名文献学家B.C.Bradford于本世纪30年代率先提出的描述文献分散规律的经验定律。文字表述为：如果将科技期刊按其刊载某专业论文的数量多寡，以递减顺序排列，则可分出一个核心区和相

计量经济学模型分析方法(1)

计量经济学上机模型分析方法总结一、随机误差项的异方差问题的检验与修正模型一： Dependent Variable: LOG(Y) Method: Least Squares Date: 07/29/12 Time: 09:03 Sample: 1 31 Included observations: 31 Variable Coefficient Std. Error t-Statistic Prob. C 1.602528 0.860978 1.861288 0.0732 LOG(X1) 0.325416 0.103769 3.135955 0.0040 LOG(X2) 0.507078 0.048599 10.43385 0.0000 R-squared 0.796506 Mean dependent var 7.448704 Adjusted R-squared 0.781971 S.D. dependent var 0.364648 S.E. of regression 0.170267 Akaike info criterion -0.611128 Sum squared resid 0.811747 Schwarz criterion -0.472355 Log likelihood 12.47249 F-statistic 54.79806 Durbin-Watson stat 1.964720 Prob(F-statistic) 0.000000 （一）异方差的检验 1、GQ检验法模型二： Dependent Variable: LOG(Y) Method: Least Squares Date: 07/29/12 Time: 09:19 Sample: 1 12 Included observations: 12 Variable Coefficient Std. Error t-Statistic Prob. C 3.744626 1.191113 3.143804 0.0119 LOG(X1) 0.344369 0.082999 4.149077 0.0025 LOG(X2) 0.168904 0.118844 1.421228 0.1890 R-squared 0.669065 Mean dependent var 7.239161 Adjusted R-squared 0.595524 S.D. dependent var 0.133581 S.E. of regression 0.084955 Akaike info criterion -1.881064 Sum squared resid 0.064957 Schwarz criterion -1.759837 Log likelihood 14.28638 F-statistic 9.097834 Durbin-Watson stat 1.810822 Prob(F-statistic) 0.006900

我国国际疾病分类的文献计量分析

我国国际疾病分类的文献计量分析摘要目的了解我国ICD领域的整体研究情况，为科研人员深入展开相关研究提供借鉴。方法在《中国学术期刊网络出版总库》中检索有关ICD的研究论文，对其发文量、作者及其所在机构和地区、期刊和基金资助情况进行统计分析。结果共检索到相关文献1443篇；大部分作者的发文量只有1篇，发表3篇及以上论文的作者占作者总数的8.40%；发文量统计指标表明，单位层面湛江市中心人民医院的发文量最多，地区层面广东省的发文量处于领先地位，但全国范围内地区间存在很大差异；《中国病案》是刊载ICD研究论文最多的期刊。结论目前国内ICD的相关研究尚未达到成熟稳定阶段，需要更多专家、学者和工作人员的关注和深入研究。关键词国际疾病分类；文献计量；统计分析疾病分类是病案信息管理的重要工具，目前世界上最具影响力的分类方案当数国际疾病分类（International Classification of Diseases，简称ICD）[1]。ICD由世界卫生组织国际分类家族编制，目前全世界普遍通用的疾病分类标准为第十版，即ICD-10。我国对ICD的应用可以追溯至1981年，至今已有30多年的历史。30多年中，众多学者对其研究及应用进行了探讨与交流，随之涌现出了大量的相关文献。2007年张浩[2]等人选取了2004年～2006年三年间有关ICD的文献进行了文献计量的统计分析，但该研究选取的数据范围较窄，不能反映国内ICD研究的整体情况，故笔者欲检索国内ICD领域的所有文献数据进行统计分析，以探讨我国在该领域的整体研究情况，为科研人员能够深入地展开相关研究提供借鉴。 1 数据来源与方法本文的实证数据来源于《中国学术期刊网络出版总库》，以“疾病编码、疾病分类、ICD-10编码、ICD-10、ICD-10编码质量、ICD分类、双重编码、ICD植入术、ICD-9、ICD-9-CM-3、疾病分类编码、主要编码、疾病分类统计、手术操作分类、疾病分类标准、单病种、编码质量、编码员、编码工作、单病种付费、主导词、手术编码、手术名称、编码原则、诊断名称、ICD编码、手术操作、DRGs、疾病/分类、ICD-10主要诊断、ICD疾病编码、主要诊断编码、国际疾病分类、疾病分类报表”等34个关键词进行检索（检索截止日期2012年12月4日）。在检索到的文献中去掉重复文献和不相关文献（包括与该主题无关的文献、会议记录、会议通知等），剩余1443篇文献作为本文的研究样本。本文对上述样本文献的发文量、作者情况、机构和地区分布、期刊分布、基金论文等方面进行统计分析。 2 结果 2.1 发文量发表文献的数量在一定程度上代表了某个领域的研究水平与发展趋势[3]。图1所示的是1981年～2012年31年间的文献量，由于检索时间的限制，图中2012年缺少一部分文献，估计全部数据与2011年的数据相差不多。从图中可以看出从1981年开始发文量大致呈逐年上升的趋势，其中从2003年开始增长幅度大幅提升，据此可以预见在未来一段时间内，国际疾病分类及其应用仍将是我国学者关注的热点之一

掌握常用计量软件、实证分析方法介绍

实证研究学习园地国泰安信息技术有限公司 GTA Information Technology Company

第一部分如何学习实证研究方法第三章掌握常用计量软件对于实证研究初学者来说在掌握了基本知识和查阅了大量的文献之后，但是开始做实证研究不仅需要数据和方法，而且需要工具来检验实证研究的结果，如果工具不全，那么实证研究者也无法达到收发自如。另外，实证研究可能面对处理大量甚至海量的数据，这些对于实证研究初学者来说都是棘手的问题，随着计算机的发展，不同的处理软件的出现，帮助我们解决了这个问题。在实证金融会计领域中，目前常用的计量软件包括SAS、SPSS、Matlab、Eviews、Excel、Foxpro等。下面我们对于这几个常用的软件和实证研究的关系作简要的论述。第一节常见计量软件一、SAS SAS是美国SAS软件研究所研制的一套大型集成应用软件系统，具有完备的数据存取、数据管理、数据分析和数据展现功能。尤其是创业产品统计分析系统部分，由于其具有强大的数据分析能力，一直为业界著名软件，在数据处理和统计分析领域，被誉为国际上的标准软件和最权威的优秀统计软件包，广泛应用于政府行政管理、科研、教育、生产和金融等不同领域，发挥着重要的作用。SAS系统中提供的主要分析功能包括统计分析、经济计量分析、时间序列分析、决策分析、财务分析和全面质量管理工具等等。详细内容请登陆：https://www.360docs.net/doc/9316051010.html,/offices/asiapacific/china/查询。二、SPSS SPSS（Statistical Package for the Social Science）－－社会科学统计软件包是世界是著名的统计分析软件之一。20世纪60年代末，美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSS，同时成立了SPSS公司，并于1975年在芝加哥组建了SPSS总部。20世纪80年代以前，SPSS统计软件主要应用于企事业单位。1984年SPSS总部首先推出了世界第一个统计分析软件微机版本SPSS/PC+，开创了SPSS微机系列产品的开发方向，从而确立了个人用户市场第一的地位。同时SPSS公司推行本土化策略，目前已推出9个语种版

计量分析方法

一、统计推断中的假设检验常见的随机变量有标准正态变量Z 以及演变而成的t -Statistics 、CHI-Squares 、F-Statistics ；关于这四种随机变量的概率分布我们具备完全信息。分析问题时把研究的具体问题转化为这四种随机变量的任何一种即可进行显著性假设检验。假定已知μ和σ2的估计量S2，则可以用样本标准差（ S ）代替总体标准差（σ），得到一个新的变量t 。

一种检验方法可以采用各假设检验统计量的判别准则判断检验统计量数值落在假设检验的接受区域还是拒绝区域，从而作出是否接受原假设的结论；另一种方法可以比较检验统计量的伴随概率P值是小于还是大于等于显著性水平（α=0.05），若P值小于α，则认为小概率事件发生了，拒绝原假设，反之若P值大于α，则认为无充分证据拒绝原假设，接受原假设。两种方法是等价的。二、模型统计检验中拟合优度检验、方程的显著性检验(F 检验) 、变量的显著性检验（t检验）的逻辑关系？参数的置信区间预测目的何在？ 1. 拟合优度表明被解释变量的平均变动有多大比例可以由模型包含的解释变量来解释。R2大说明样本回归直线的线性拟合程度较高；若R2较小时，我们无从判断回归直线的线性解释能力是否显著，或者说不能判断解释变量的联合体即各变量的线性组合与被解释变量的总体线性关系是否显著，需要将R2转化为F统计量进行显著性检验。 2. 方程的显著性检验等价于拟合优度检验，优点是可以进行显著性检验。该检验旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。 H0：β0=β1=β2= ? =βk=0 H1：βj不全为0