倾向计分(积分,匹配)法PSM_SSWR_2004

合集下载

倾向得分匹配方法步骤

倾向得分匹配方法步骤倾向得分匹配方法（Propensity Score Matching, PSM）是一种用于评估因果效应的经典方法之一。

该方法通过倾向得分（Propensity Score）将处理组和对照组进行配对，以减少处理组和对照组之间的混淆偏倚。

下面是倾向得分匹配方法的步骤：1. 研究问题和数据准备：首先明确研究问题，并收集相关的观测数据。

数据应包括处理组和对照组的特征变量，以及因果变量。

2. 变量选择：根据研究问题，选择适当的特征变量作为倾向得分模型的输入变量。

这些变量应具有影响处理组选择的潜在因素，且与因果变量相关。

通常选择的变量包括年龄、性别、教育水平、收入水平等。

3. 倾向得分估计：倾向得分是处理组与对照组之间的条件概率，表示个体被分到处理组的概率。

可以使用各种统计方法来估计倾向得分，包括逻辑回归、梯度提升树等。

估计得到的倾向得分应在0到1之间。

4. 匹配样本选择：通过选择与处理组匹配的对照组样本，减少混淆偏倚。

常见的匹配方法包括最近邻匹配、卡尔曼匹配等。

匹配前，可以根据倾向得分的近似程度设置质量标准，例如最大汉明距离。

5. 匹配效果评估：在匹配完成后，对匹配样本进行处理效果评估。

通常使用平均处理效应（Average Treatment Effect, ATE）或平均处理效应对受处理样本的平均效应（Average Treatment Effect on the Treated, ATT）进行估计。

处理效果的估计可以使用插补法、回归法等。

6. 效果检验和敏感性分析：对匹配效果进行检验，常用的方法有t检验、Bootstrap法等。

此外，还需要进行敏感性分析，检验结果对于倾向得分估计的敏感性。

常见的敏感性分析方法包括皮贝根评分、加入未观测因素等。

7. 结果解读：根据匹配效果评估、效果检验和敏感性分析的结果，对研究问题进行解读。

解读应注意结果的可靠性、合理性和一致性，并结合文献综述和实证研究来进行解释。

倾向计分(积分,匹配)法PSM_SSWR_2004

“comparison” group are compared to only the best cases from the treatment group, the result may be regression toward the mean
• makes the comparison group look better • Makes the treatment group look worse.
focused on the problem of selection biases, and traditional approaches to program evaluation, including randomized experiments, classical matching, and statistical controls. Heckman later developed “Difference-in-differences” method
NSCAW data used to illustrate PSM were collected under funding by the Administration on Children, Youth, and Families of the U.S. Department of Health and Human Services. Findings do not represent the official position or policies of the U.S. DHHS. PSM analyses were partially funded by the Robert Wood Johnson Foundation and the Childrens Bureau’s Child Welfare Research Fellowship. Results are preliminary and not quotable. Contact information: sguo@

倾向得分匹配法步骤

倾向得分匹配法步骤
倾向得分匹配法（Propensity Score Matching, PSM）是一种常用的统计方法，用于处理因果推断中的选择偏差。

下面我将从多个角度介绍倾向得分匹配法的步骤。

1. 确定研究目的，在使用倾向得分匹配法之前，首先需要明确研究的目的和问题，确定需要进行匹配的变量和研究对象。

2. 计算倾向得分，倾向得分是指个体被暴露于某个处理（例如接受某种治疗）的概率。

通常使用logistic回归等方法来计算每个个体的倾向得分，得到一个介于0到1之间的概率值。

3. 匹配处理组和对照组，根据计算得到的倾向得分，将处理组和对照组中的个体进行配对，使得处理组和对照组在倾向得分上尽可能接近，从而达到减少选择偏差的效果。

4. 检验匹配质量，匹配完成后，需要进行匹配质量的检验，通常会使用标准化差异（Standardized Mean Difference, SMD）等指标来评估匹配的效果，确保处理组和对照组在匹配后的特征上没有显著差异。

5. 进行因果推断，匹配完成后，可以利用匹配后的样本进行因果效应估计，比较处理组和对照组在结果变量上的差异，从而得出处理对结果变量的影响。

6. 稳健性检验，最后，为了确保结果的稳健性，可以进行一些敏感性分析，例如倾向得分模型的选择、不同的匹配算法等，来检验结果的稳健性。

综上所述，倾向得分匹配法的步骤包括确定研究目的、计算倾向得分、匹配处理组和对照组、检验匹配质量、进行因果推断以及稳健性检验。

这些步骤有助于减少因果推断中的选择偏差，提高研究结论的可信度。

倾向匹配得分教程（附PSM操作应用、平衡性检验、共同取值范围、?核密度函数图）

倾向匹配得分教程（附PSM操作应用、平衡性检验、共同取值范围、核密度函数图）展开全文本文主要包括倾向匹配得分命令简介、语法格式、倾向匹配得分操作步骤思路，涉及倾向匹配得分应用、平衡性检验、共同取值范围检验、核密度函数图等内容。

1命令简介Stata does not have a built-in command for propensity score matching, a non-experimental method of sampling that produces a control group whose distribution of covariates is similar to that of the treated group. However, there are several user-written modules for this method. The following modules are among the most popular:Stata没有一个内置的倾向评分匹配的命令，一种非实验性的抽样方法，它产生一个控制组，它的协变量分布与被处理组的分布相似。

但是，这个方法有几个用户编写的模块。

以下是最受欢迎的模块（主要有如下几个外部命令）psmatch2.adopscore.adonnmatch.adopsmatch2.ado was developed by Leuven and Sianesi (2003) and pscore.ado by Becker and Ichino (2002). More recently, Abadie, Drukker, Herr, and Imbens (2004) introduced nnmatch.ado. All three modules support pair-matching as well as subclassification.You can find these modules using the .net command as follows:net search psmatch2net search pscorenet search nnmatchYou can install these modules using the .ssc or .net command, for example:ssc install psmatch2, replaceAfter installation, read the help files to find the correct usage, for example:help psmatch2上述主要介绍了如何获得PSM相关的命令，总结一下目前市面上用的较好的命令为psmatch2.PSM 相关命令help psmatch2help nnmatchhelp psmatchhelp pscore持续获取最新的 PSM 信息和程序findit propensity scorefindit matchingpsmatch2 is being continuously improved and developed. Make sure to keep your version up-to-date as follows ssc install psmatch2, replacewhere you can check your version as follows:which psmatch22语法格式语法格式为：help psmatch2••••••psmatch2 depvar [indepvars] [if exp] [in range] [, outcome(varlist) pscore(varname) neighbor(integer) radius caliper(real) mahalanobis(varlist) ai(integer) population altvariance kernel llr kerneltype(type) b width(real) spline nknots(integer) common trim(real ) noreplacement descending odds index logit ties q uietly w(matrix) ate]选项含义为：depvar因变量；indepvars表示协变量；outcome(varlist)表示结果变量；logit指定使用logit模型进行拟合，默认的是probit模型；neighbor(1)指定按照1:1进行匹配，如果要按照1:3进行匹配，则设定为neighbor(3)；radius表示半径匹配核匹配 (Kernel matching)其他匹配方法广义精确匹配(Coarsened Exact Matching) || help cem局部线性回归匹配 (Local linear regression matching)样条匹配 (Spline matching)马氏匹配 (Mahalanobis matching)pstest $X, both做匹配前后的均衡性检验，理论上说此处只能对连续变量做均衡性检验，对分类变量的均衡性检验应该重新整理数据后运用χ2检验或者秩和检验。

stata：倾向得分匹配（PSM）

stata：倾向得分匹配（PSM）导读：在经济学中，我们常常希望评估项目实施后的效应，一般的做法是加入虚拟变量，但是这种做法并不科学。

例如政府推行就业培训计划，该项目的参与者，我们将其称作处理组（treatment group），未参与的培训的样本称作控制组（control group）也叫对照组。

PSM考虑就业培训的处理效应评估。

我们一般的做法是比较两组的收入状况。

如果这样处理，可能得到的结论是参加培训的收入低于未参加培训者。

这是由于一开始选择控制组的样本时，选择范围比较广阔，存在选择偏差。

所以在此介绍倾向得分匹配方法（PSM）。

本文在此就不介绍相关理论了，因为小编的理论也不是特别的好，如果想学习的可以参阅连玉君老师的相关视频（重点推介），大概有5个课时；同时也可以参考陈强老师的《高级计量经济学及stata应用》中的第28章处理效应。

在此小编仅仅介绍stata的相关操作。

1、安装psmatch2ssc install psmatch2，replace2、导入数据，方法比较多，可以粘贴复制、也可以使用命令use E:\BaiduNetdiskDownload\A\labor.dta,clear3、命令语法格式介绍psmatch2 D x1 x2 x3 ,outcome(y) logit ties ate common odds /// pscore(varname) qui对以上的标准命令进行解析D为处理变量，是虚拟变量即是否参加培训x1 x2 x3是协变量，一般的称呼也叫解释变量outcome(varname)是输出变量，例如收入logit 表示计算得分的时候使用logit模型，如果不写Logit，默认为probit模型计算得分，在连玉君的视频中论述了二者并不存在明显的差异。

ties表示包括所有倾向得分相同的并列个体，默认按照数据排序选择其中一位个体。

ATE表示同是汇报ATE、ATU、ATT，大家看书重点了解common表示仅对共同取值范围内的个体进行匹配odds使用几率比（odds ratio）算法为p/(1-p),熟悉logit模型的应该了解qui屏幕中不显示logit模型估计过程，可以节省运算时间4 匹配方法连玉君的视频教程讲了三种：最近0匹配、半径匹配、核匹配；陈强老师讲了6种，如果想详细学习，可以参考他们的相关视频与书籍。

倾向得分匹配方法

倾向得分匹配方法倾向得分匹配方法是一种常用的因果推断方法，它可以用来评估某个干预措施对于某个结果的影响。

该方法的核心思想是通过建立一个预测模型来估计每个个体接受干预措施的概率，然后将接受干预措施的个体与未接受干预措施的个体进行匹配，从而消除潜在的混淆因素，得到干预措施对于结果的真实效应。

具体来说，倾向得分匹配方法包括以下几个步骤：1. 建立预测模型。

预测模型可以是logistic 回归模型、决策树模型、神经网络模型等，其目的是预测每个个体接受干预措施的概率。

预测模型的自变量包括个体的基线特征，如年龄、性别、疾病状态等。

2. 计算倾向得分。

倾向得分是指每个个体接受干预措施的概率，可以通过预测模型得到。

3. 进行匹配。

将接受干预措施的个体与未接受干预措施的个体进行匹配，匹配的方法可以是最近邻匹配、卡方匹配、基于距离的匹配等。

匹配后，可以比较两组个体的基线特征是否平衡，如果平衡，则说明匹配成功。

4. 评估干预效应。

通过比较接受干预措施的个体与未接受干预措施的个体在结果上的差异，可以得到干预效应的估计值。

常用的评估方法包括差异法、倾向得分加权法、倾向得分匹配法等。

倾向得分匹配方法的优点在于可以消除潜在的混淆因素，得到干预效应的真实估计值。

同时，该方法还可以处理多个干预措施和多个结果的情况。

缺点在于需要建立预测模型和进行匹配，计算量较大，且匹配的结果可能受到匹配方法和倾向得分的影响。

倾向得分匹配方法是一种有效的因果推断方法，可以用来评估干预措施对于结果的影响。

在实际应用中，需要根据具体情况选择合适的预测模型和匹配方法，并进行结果的敏感性分析，以确保结果的可靠性和稳健性。

倾向得分匹配原理

倾向得分匹配的原理
在医疗、经济、金融学等领域中，当某项公共政策实施后，我们通常希望通过一些方法去评估该项政策产生的影响，即政策的作用及效应，以更好的指导政策实施，服务于公共决策。

一般做法是加入虚拟变量，但是这种做法并不科学。

例如，研究某个劳动者接受某种高等教育或技能培训对其收入的影响，又比如研究某个企业实施了某项激励制度后对企业绩效的影响等。

通常情况下，我们会将政策实施对象的“处理组(treatment group)”和“控制组(control group) ”进行对比，以期评估该项政策的处理效应(Treatment effect)。

但是，对于社会科学来说，我们的数据通常来自非随机的观察研究中，处理组和控制组的初始条件不完全相同，故存在“选择偏差( selection bias)”问题，我们真接评估政策效果可能存在一定的偏误。

需要估计的内容：处理效应，Treatment Effect评估某项目或政策实施后的效应，如政策推出的各种项目，此类研究被称之为项目效应评估，也被称之为处理效应，项目参与者的全体构成控制组或对照组，而未参加项目者则构成控制组或对照组。

即PSM解决的是选择偏差问题（即控制混杂因素），倾向得分匹配就是利用倾向评分值，从对照组中为处理组中的每个个体寻找一个或多个背景特征相同或相似的个体作为对照。

这样就最大程度降低了其他混杂因素的干扰。

倾向得分匹配计量方程

倾向得分匹配计量方程倾向得分匹配计量方程是一种用于衡量个体对某种偏好或倾向的量化方法。

它通过将个体的偏好与一系列特征进行比较，计算出一个数值来表示个体对某种倾向的程度。

本文将介绍倾向得分匹配计量方程的原理、应用和局限性。

倾向得分匹配计量方程的原理是基于倾向得分匹配方法。

该方法通过建立一个匹配模型，将个体的倾向得分与其特征进行匹配，从而得出个体对某种倾向的得分。

具体而言，倾向得分是通过回归模型或者机器学习方法得出的，它反映了个体在某种倾向上的可能性。

然后，根据个体的特征，使用匹配算法找到一组最相似的个体，计算出他们的倾向得分，从而得到个体的倾向得分。

倾向得分匹配计量方程的应用非常广泛。

在社会科学领域，它可以用于研究个体对某种政策或措施的态度。

在医学领域，它可以用于评估某种治疗方法的效果。

在商业领域，它可以用于预测个体对某种产品或服务的偏好。

总之，无论是在学术研究还是实际应用中，倾向得分匹配计量方程都可以帮助我们更准确地了解个体的倾向和偏好。

然而，倾向得分匹配计量方程也存在一些局限性。

首先，它要求我们有足够的数据来建立回归模型或者机器学习模型，从而得到个体的倾向得分。

其次，它假设个体的特征与其倾向是独立的，但实际上可能存在一些未观测到的因素影响了个体的倾向。

此外，倾向得分匹配计量方程还需要我们选择适当的匹配算法，以确保得到的匹配样本具有代表性和可比性。

为了克服这些局限性，研究者们在倾向得分匹配计量方程的基础上进行了不断的改进和发展。

例如，他们提出了双重差分法来进一步减少未观测到的因素对估计结果的影响。

他们也提出了倾向得分加权法来处理样本选择偏倚的问题。

这些改进和发展使得倾向得分匹配计量方程在实际应用中更加可靠和有效。

倾向得分匹配计量方程是一种用于衡量个体对某种倾向的量化方法。

它通过建立匹配模型，将个体的倾向得分与其特征进行匹配，从而得出个体对某种倾向的得分。

倾向得分匹配计量方程在社会科学、医学和商业等领域有着广泛的应用。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

NSCAW data used to illustrate PSM were collected under funding by the Administration on Children, Youth, and Families of the U.S. Department of Health and Human Services. Findings do not represent the official position or policies of the U.S. DHHS. PSM analyses were partially funded by the Robert Wood Johnson Foundation and the Childrens Bureau’s Child Welfare Research Fellowship. Results are preliminary and not quotable. Contact information: sguo@
Outline
• Overview: Why Propensity Score
Matching?
• Highlights of the key features of PSM
• Example: Does substance abuse treatment
reduce the likelihood of child maltreatment re-report?
only create an estimate of them.
• PSM is one “correction strategy” that corrects for
the selection biases in making estimates.
Approximating Counterfactuals
• A range of flawed methods have long been
available to us: • RCTs • Quasi-experimental designs • Matching on single characteristics that distinguish
treatment and control groups (to try to make them more alike)
Limitations of Random Assng time and great cost to
generate answers—analysis of existing data may more timely, yet acceptably accurate
Introduction to Propensity Score Matching: A New Device for Program Evaluation
Workshop Presented at the Annual Conference of the Society for Social Work Research New Orleans, January, 2004
should be done before RCTs are deemed necessary.
Limitations of Quasi-Experimental Designs
• Selection bias may be substantial • Comparison groups used to make
overlap, then substantial error may be introduced: • E.g., if only the worst cases from the untreated
“comparison” group are compared to only the best cases from the treatment group, the result may be regression toward the mean
Shenyang Guo, Ph.D.¹, Richard Barth, Ph.D. ¹, and Claire Gibbons, MPH ²
Schools of Social Work¹ and Public Health ² University of North Carolina at Chapel Hill
counterfactual claims may have warped counters and failing factuals, leading to intolerably ambiguous findings
Limitations of Matching
• If the two groups do not have substantial
Why Propensity Score Matching?
• Theory of Counterfactuals
• The fact is that some people receive treatment. • The counterfactual question is: “What would have
happened to those who, in fact, did receive treatment, if they had not received treatment (or the converse)?”
• Counterfactuals cannot be seen or heard—we can
• RCTs are not feasible when variables cannot be
manipulated—e.g., some events in child welfare are driven by legal mandates
• Prior analysis of the need for withholding treatment