线性回归分析方法在税收收入预测中的应用

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

线性回归分析方法在税收收入预测中的应用

郭东颖

税收收入预测是根据历史数据信息和现实客观条件，运用科学的方法和逻辑推理手段，对未来收入状况进行分析、估计、推断。税收收入预测的结果虽然含有主观成份，但并不是毫无科学根据的主观臆测。构建地方税收入预测模型，对于地税机关科学编制税收计划，提高税收征管质量，发现税收管理的科学规律，具有十分重要的参考价值。

一、基本理论

影响地方税收入的决定因素主要包括三个方面，一是经济发展水平，表现为经济总量、增长趋势、产业和行业结构布局；二是税收政策，表现为国家税制及局部性、区域性的税收优惠政策；三是税收征管力度。实证分析表明，税收收入增长与上述三个方面因素有着基本对应的量化关系。税收收入预测的基本思路就是“鉴往知来”，依托这种量化关系，对宏观税源及征管效能进行测算，进而预知未来税收收入数量。考虑其他影响因素后，即可建立如下地方税收入的线性预测模型：y=f（经济发展水平，税收制度，征管力度，其他随机因素……）

二、指标与变量

为使上述关系式模型能够实际计算，必须确定各项要素与税收收入的关联指标。经济发展水平是核心因素，总体上决定可能的税收收入规模；一般认为，宏观经济税源用GDP代表。各税种收入均可用与其计税依据相关的指标进行测算，但受指标体系自身和调查统计手段的限制，目前尚不能取得各项指标的精确数据，仅能指出一些与之密切相关的代表性指标，如：地方税收入总量与国内生产总值（GDP）、营业税与第

三产业及建筑业营业额、企业所得税与利润总额、个人所得税与城乡居民可支配收入、土地增值税与房地产开发业销售额等。

征管力度因素难以具体量化，并且作用机理依附于经济发展水平，实践中可用回归分析的方法予以确定。在国家税制没有发生根本性变革的情况下，局部性、区域性的优惠税收政策效应在各税种收入之间存在互补关系，对税收总量的影响不大，在较长时期（大于一个年度）内税收政策因素可作为一个常量对待。

据此，将税收收入的线性预测模型转化为：

y=a＋bx＋µ

其中：x是自变量，表示预测期间的经济税源数量；y是因变量，表示预测期间税收收入的估计值；µ表示影响地方税收入的随机变量。a、b是待定的未知参数，a又称为截距（Intercept），表示因变量不受自变量影响时的期望结果，b又称为斜率或回归系数（X Variable），表示因变量受自变量影响的程度。a、b的值可用普通最小二乘法求得，其计算公式为：

b＝(nΣxy－ΣxΣy)/[nΣx2－(Σx)2]

a＝(Σy－bΣx)/n

其中：Σ是求和符号，x、y分别表示选取样本中自变量和因变量的观察值，n表示观察样本的容量。

三、假设与检验

模型是对现实世界的简化和抽象，模型化方法便于抓住事物内在本质，是定性与定量分析的基本方法。任何模型背后都有一些假设，这些假设通常需要用实际数据加以检验。地方税收入线性预测模型的假设，是税收收入确实来源于经济，作为衡量经济发展成果的总指标——GDP 数据真实可靠，并且地税征管秩序保持平稳协调，不会因为各种干扰而

大起大落或者突然中断。只是因为这个假设太平常，人们往往认为它理所当然，不去深思把它当作理论模型的前提假设，但它对于预测未来税收收入却是必不可少的。

模型检验的主要内容有：变量相互关系的表现形式，一般通过绘制散点图观察其数据点分布是否呈直线趋势，以确定构建线性或非线性预测模型。线性预测模型主要检验变量间的相关系数（Multiple R）、判定系数（R Square）以及回归系数显著性（t）检验、F检验、卡方（χ2）检验等。一元线性回归模型的相关系数、t检验、F检验及卡方（χ2）检验结果是一致的，相关系数的检验方法是比较其t统计量在给定显著性水平α下自由度为n-2的概率度tα/2（n－2)，如果｜t｜>

tα/2（n－2)，就认为变量之间总体相关。各项检验都涉及一些复杂数学公式，我们可以利用软件工具处理。

下面，借助电子数据表工具软件Microsoft Excel，设“置信

度”为95%，即显著性水平α＝5%，对安徽省2000－2008年度经济和地方税收入进行线性回归预测。

分析结果的解释共三个部分。 “回归统计”部分给出的相关系数为0.992，接近于1（100%），表示因变量与自变量高度相关；判定系数为0.984，表示地方税收入的98.4%是由自变量GDP引起的；标准误差指出因变量估计值与实际值之间的平均平方误差，是对测量数据可靠性的估计。 “方差分析”部分的F统计量432.12远远大于其临界值（Significance F）1.498，F检验的显著性水平检验通过，证明回归方程确有合理的线性相关关系，预测模型从整体上适用。 “参数估计”部分给出回归方程的截距和斜率的置信区间（95%）的上限和下限范围；截距为－86.12886，表示当经济发展水平不变时税收来源于经济的数量关系，截距为负值，揭示有些GDP成份没有为地方税收入作出贡

献；斜率为0.05368，表明宏观边际税收负担率约为5.37%，即：在现有税制和征管水平条件下，平均每增加100元GDP将导致地方税增收5.37元；t检验的P-value值（0.0005）远远小于α（5%），t检验的显著性水平也获得通过。从以上回归分析结果，得到方程式：

y＝－86.12886＋0.05368x

利用回归方程计算的预测值是一个确定数，称为点预测。点预测结果可能不准确，必须进一步指出允许围绕点预测值上下波动的置信区间。以下是区间预测（95%置信度）近似的简易计算公式：预测区间＝y±概率度×标准误差

式中：y表示点预测值，概率度tα/2（n－2) 可以通过查t分布表求得。为简洁起见，这里以点预测值与实际值进行拟合比较，结果如图所示。

注：数据来源于各年度《安徽省国民经济和社会发展统计公报》、《安徽地税年鉴》。

四、应用

（一）预测未来若干时期地税收入。首先，求得全省2000－2008年的GDP年均增长率为11. 8%，据此计算2009年全省预期GDP为9921.28亿元。然后将估计GDP值代入回归方程，则2009年全省地方税收入预测为446.45亿元，可信的预测区间为412.07－480.82亿元。根据税收周期与经济周期相伴而生且基本同向波动的原理，可以判定在经济发展回升时期，税收收入只可能增长，不会出现下滑，故舍弃预测区间下限数额。实际运行的结果，2009年全省GDP为10052.9亿元，增长12.9%；地税收入485.4亿元，与预测上限值的误差仅有4.58亿元。

各地征管力度可能存在一定差异，但从各地自身情况观察，各年度