线性回归分析方法在税收收入预测中的应用

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

线性回归分析方法在税收收入预测中的应用

郭东颖

税收收入预测是根据历史数据信息和现实客观条件,运用科学的方法和逻辑推理手段,对未来收入状况进行分析、估计、推断。税收收入预测的结果虽然含有主观成份,但并不是毫无科学根据的主观臆测。构建地方税收入预测模型,对于地税机关科学编制税收计划,提高税收征管质量,发现税收管理的科学规律,具有十分重要的参考价值。

一、基本理论

影响地方税收入的决定因素主要包括三个方面,一是经济发展水平,表现为经济总量、增长趋势、产业和行业结构布局;二是税收政策,表现为国家税制及局部性、区域性的税收优惠政策;三是税收征管力度。实证分析表明,税收收入增长与上述三个方面因素有着基本对应的量化关系。税收收入预测的基本思路就是“鉴往知来”,依托这种量化关系,对宏观税源及征管效能进行测算,进而预知未来税收收入数量。考虑其他影响因素后,即可建立如下地方税收入的线性预测模型:y=f(经济发展水平,税收制度,征管力度,其他随机因素……)

二、指标与变量

为使上述关系式模型能够实际计算,必须确定各项要素与税收收入的关联指标。经济发展水平是核心因素,总体上决定可能的税收收入规模;一般认为,宏观经济税源用GDP代表。各税种收入均可用与其计税依据相关的指标进行测算,但受指标体系自身和调查统计手段的限制,目前尚不能取得各项指标的精确数据,仅能指出一些与之密切相关的代表性指标,如:地方税收入总量与国内生产总值(GDP)、营业税与第

三产业及建筑业营业额、企业所得税与利润总额、个人所得税与城乡居民可支配收入、土地增值税与房地产开发业销售额等。

征管力度因素难以具体量化,并且作用机理依附于经济发展水平,实践中可用回归分析的方法予以确定。在国家税制没有发生根本性变革的情况下,局部性、区域性的优惠税收政策效应在各税种收入之间存在互补关系,对税收总量的影响不大,在较长时期(大于一个年度)内税收政策因素可作为一个常量对待。

据此,将税收收入的线性预测模型转化为:

y=a+bx+µ

其中:x是自变量,表示预测期间的经济税源数量;y是因变量,表示预测期间税收收入的估计值;µ表示影响地方税收入的随机变量。a、b是待定的未知参数,a又称为截距(Intercept),表示因变量不受自变量影响时的期望结果,b又称为斜率或回归系数(X Variable),表示因变量受自变量影响的程度。a、b的值可用普通最小二乘法求得,其计算公式为:

b=(nΣxy-ΣxΣy)/[nΣx2-(Σx)2]

a=(Σy-bΣx)/n

其中:Σ是求和符号,x、y分别表示选取样本中自变量和因变量的观察值,n表示观察样本的容量。

三、假设与检验

模型是对现实世界的简化和抽象,模型化方法便于抓住事物内在本质,是定性与定量分析的基本方法。任何模型背后都有一些假设,这些假设通常需要用实际数据加以检验。地方税收入线性预测模型的假设,是税收收入确实来源于经济,作为衡量经济发展成果的总指标——GDP 数据真实可靠,并且地税征管秩序保持平稳协调,不会因为各种干扰而

大起大落或者突然中断。只是因为这个假设太平常,人们往往认为它理所当然,不去深思把它当作理论模型的前提假设,但它对于预测未来税收收入却是必不可少的。

模型检验的主要内容有:变量相互关系的表现形式,一般通过绘制散点图观察其数据点分布是否呈直线趋势,以确定构建线性或非线性预测模型。线性预测模型主要检验变量间的相关系数(Multiple R)、判定系数(R Square)以及回归系数显著性(t)检验、F检验、卡方(χ2)检验等。一元线性回归模型的相关系数、t检验、F检验及卡方(χ2)检验结果是一致的,相关系数的检验方法是比较其t统计量在给定显著性水平α下自由度为n-2的概率度tα/2(n-2),如果|t|>

tα/2(n-2),就认为变量之间总体相关。各项检验都涉及一些复杂数学公式,我们可以利用软件工具处理。

下面,借助电子数据表工具软件Microsoft Excel,设“置信

度”为95%,即显著性水平α=5%,对安徽省2000-2008年度经济和地方税收入进行线性回归预测。

分析结果的解释共三个部分。 “回归统计”部分给出的相关系数为0.992,接近于1(100%),表示因变量与自变量高度相关;判定系数为0.984,表示地方税收入的98.4%是由自变量GDP引起的;标准误差指出因变量估计值与实际值之间的平均平方误差,是对测量数据可靠性的估计。 “方差分析”部分的F统计量432.12远远大于其临界值(Significance F)1.498,F检验的显著性水平检验通过,证明回归方程确有合理的线性相关关系,预测模型从整体上适用。 “参数估计”部分给出回归方程的截距和斜率的置信区间(95%)的上限和下限范围;截距为-86.12886,表示当经济发展水平不变时税收来源于经济的数量关系,截距为负值,揭示有些GDP成份没有为地方税收入作出贡

献;斜率为0.05368,表明宏观边际税收负担率约为5.37%,即:在现有税制和征管水平条件下,平均每增加100元GDP将导致地方税增收5.37元;t检验的P-value值(0.0005)远远小于α(5%),t检验的显著性水平也获得通过。从以上回归分析结果,得到方程式:

y=-86.12886+0.05368x

利用回归方程计算的预测值是一个确定数,称为点预测。点预测结果可能不准确,必须进一步指出允许围绕点预测值上下波动的置信区间。以下是区间预测(95%置信度)近似的简易计算公式:预测区间=y±概率度×标准误差

式中:y表示点预测值,概率度tα/2(n-2) 可以通过查t分布表求得。为简洁起见,这里以点预测值与实际值进行拟合比较,结果如图所示。

注:数据来源于各年度《安徽省国民经济和社会发展统计公报》、《安徽地税年鉴》。

四、应用

(一)预测未来若干时期地税收入。首先,求得全省2000-2008年的GDP年均增长率为11. 8%,据此计算2009年全省预期GDP为9921.28亿元。然后将估计GDP值代入回归方程,则2009年全省地方税收入预测为446.45亿元,可信的预测区间为412.07-480.82亿元。根据税收周期与经济周期相伴而生且基本同向波动的原理,可以判定在经济发展回升时期,税收收入只可能增长,不会出现下滑,故舍弃预测区间下限数额。实际运行的结果,2009年全省GDP为10052.9亿元,增长12.9%;地税收入485.4亿元,与预测上限值的误差仅有4.58亿元。

各地征管力度可能存在一定差异,但从各地自身情况观察,各年度

相关文档
最新文档