ETL中数据清洗技术在税务系统中的应用

ETL中数据清洗技术在税务系统中的应用
ETL中数据清洗技术在税务系统中的应用

0引言

税务系统由于有复杂的财务关系、财务流程等,不可避免在事物扭转等过程中会产生错误数据。贵州省地税局九个市(州、地)的数据已经集中到市(州、地),但是由于地税局的相关业务系统经过多次改版和升级等原因,造成了很多数据不一致等数据质量问题,并且各市(州、地)的数据质量参差不齐,对省级数据集中和在省级数据集中基础上的其它应用都会带来很大的麻烦和困难。因此对九个市(州、地)的原始数据进行数据质量监控与分析,保证原始数据的数据质量就显得非常重要,也是省局通知中规定的八个目标之一。因此,数据质量监控与分析系统作为贵州省地税局省级数据集中项目中的一个子系统,肩负着其它目标实现质量好坏的基础性任务。1数据清洗错误数据产生原因

在税务系统中,“脏数据”产生的原因主要如下:(1)MIS系统数据的迁移(从03版到06版,再从06版到09版MIS数据的两次迁移)。

(2)人工不合法的操作,主要涉及应用层和数据库层两个方面。其中应用层人工的不合法操作主要原因是因为软件本身存在的漏洞,数据库层主要原因是操作人员直接修改数据库中的数据。

ETL中数据清洗技术在税务系统中的应用

Data Cleaning Technology of ETL Tax System in the Application

王时绘1伍江磊2

Wang Shihui Wu Jianglei

(1.湖北大学数学与计算机学院软件研究所,湖北武汉430062;2.湖北大学数学与计算机学院,

湖北武汉430062)

(1.Mathematics and Computer College Software Institute,Hubei University,Hubei Wuhan430062;

2.Mathematics and Computer College,Hubei University,Hubei Wuhan430062)

摘要:ETL即数据抽取、转换、装载的过程,它是构建数据仓库的重要环节,而数据仓库是面向主题的、集成的、稳定的且随时间不断变化的数据集合。数据清洗是一个减少错误和不一致性、解决对象识别的过程,目前有很多数据清洗研究和ETL研究,但是如何在ETL过程中进行有效的数据清洗,此方面研究不多。本文将以此为问题出发点,探讨ETL中的数据清洗技术在税务系统(贵州省省直属局和九个地市州的原始数据)中的应用。

关键词:ETL;中间数据库;目标数据库;MIS系统(管理信息系统)

中图分类号:TP311文献标识码:A文章编号:1671-4792-(2011)11-0065-03

Abstract:ETL namely data extraction,conversion,loading process.It is the building the important link of the data warehouse.The data warehouse is the theme for,integrated,stable and the changed with time data set.

Data cleaning is a reducing errors and inconsistencies,and solve the object recognition process.At present there are many data cleaning research and study,but how to ETL ETL process of effective data cleaning,this research is not much.This paper will be based on the starting point,this paper discusses the problem of cleaning technology in data ETL tax system(guizhou province ZhiShuJu and nine cities and states of the original data)application.

Keywords:Extraction-Transformation-Loading;Staging Database;Target Database;Management Informa-tion System ETL 中

数据

清洗技术在税务系统中的应用

65

科技广场

2011.11

(3)数据库设计的不合理。比如,应该有主外健

约束的在现有表中没有,从而导致数据不一致的结

果。图一是部分原始数据表的表间关系图,从中可

以看出这几张表应该有主外健约束,却没有建立主

外健关系。

(4)其他因素,比如计算机出现故障等。

2数据清洗方法分析

目前国内外研究最早出现数据清洗的是美国。

美国信息业和商业的发展,极大的刺激了对数据清

洗技术的研究。国内对数据清洗技术的研究还处于

初级阶段。直接针对数据清洗,特别是针对中文数

据清洗的研究成果并不多。银行、保险、证券等对客

户数据的准确性要求很高的行业,都在做各自的客

户数据清洗工作,针对各自具体应用而开发的软件,

而很少有理论性的成果见诸于报道。

在数据仓库系统中,数据清洗是ETL过程中的

一个重要环节,主要任务是检测并删除/改正将装

入数据仓库的错误数据。在数据抽取到中间数据库

后,还需要一个再次清洗转换的环节以对转换后的

数据再次清洗,然后装载到目标数据仓库中。

在本系统中,也是紧紧围绕ETL的思想,在数

据抽取到省局前,对九个地市州的数据需要进行一

次抽取转换;将抽取到九个地市州后的中间数据库

中的数据也有再次清洗转换的过程,其流程如图二

所示。

考虑到本系统开发的软件主要是对税收这一特

定领域而作的数据质量分析与清理工作,本软件就

必须要具有灵活、特定等特性。因此,我们采取的方

案是:以自己编写软件为主,应用其他清洗工具(比

如oracle warehouse builder)为辅的策略。

2.1自己编写软件的方案分析

(1)前期通过数据库原始数据生成类图,采用的

方案是具有完整版和精简版两种不同的类图版本。

完整版便于从整体查看数据之间的关联关系;精简

版可以更详细地查看单张数据表及其相关表信息。

生成类图的目的是为了方便制订查错和改错的清洗

规则。

(2)根据前期的清洗规则数据准备,我们需要对

九个地市州原始数据库中另外建一个数据清洗的用

户,用于存放数据清洗相关表及存储过程等信息。

(3)在调度查错及修改的存储过程前,我们还需

要一些准备工作。准备工作分两个方面来考虑:①只

运行一次(即只在系统上线前统一运行一次的工

作);②每次都需运行的工作(系统在每次调度前都

需要执行的检查工作)。

①只运行一次的工作有以下几点:

a)历史数据备份与删除的步骤有如下几步:

i.先备份完整的历史数据。做修改之前,对su-

per、kt2011两个用户做dmp备份,提供备份语句。

ii.备份历史数据(对要截取的数据表和代码表

进行备份)。

图一原始数据表间关系图

图二数据清洗在ETL中的应用流程图

66

iii.删除数据(删除数据表中已备份到备份表中原数据表中的数据)。

b)表结构的统一、定义主键、约束重命名。

c)用规范代码统一代码表,以后每次才是代码表内容一致性检查。

②每次都运行的工作有以下几点:

a)系统每次运行前需人工设置检查期数表的地区代码、检查期数、检查时间范围,是否允许修改数据等参数。检查期数表的功能实现需注意如下几点:

i.不同检查期数的时间范围不交叉,相邻两个检查期数时间范围不能漏选。

ii.同一期可以做无限次,但每次都是做原来没有做的部分或原来没有做成功的部分,每次都要全部检查。

b)表结构一致性检查,如果不一致,整个检查工作终止(系统每次运行前需用存储过程检查全省9地市州的数据库中的1300张表的主键、字段名、字段类型、外键、字段长度等是否与标准库一致)。

c)代码表内容一致性检查,如果不一致,整个检查工作终止。

d)新旧代码表对应关系中,09版代码值是否与MIS 系统中一致,如果不一致,整个检查工作终止(用存储过程调用)。

e)每次都运行的工作可通过采用存储过程封装调度。

参照(1)中完成的类图,我们采用了规则表在数据清理用户下,将数据查错规则、数据备份规则及数据修改规则保存在一张表中,使用存储过程及函数按一定次序动态调用数据查错规则、数据备份规则及数据修改规则语句;在执行每个规则的过程中,执行结果(成功与否)将保存在同一张日志表中。2.2数据清洗中应用的清洗工具分析

数据清洗工具辅助完成了本系统的错误数据分析、错误数据统计等工作。在对数据清洗工具选择中,我们前期做了比较,结果见表一。通过比较,我们发现Oracle 的WareHouse Builder 因为其支持异构数据库并且免费使用等特性,我们便考虑用它做我们的分析依据。它其中有

一项非常强大的功能即为概要分析,能够全面的帮

助我们分析出各种数据错误的类型、

错误的种类等。3结束语

数据清洗在税务系统中的应用在国内外有很多参考,对原始数据的清洗工作需要长期、反复、渐进的进行,因此要求该系统要有一定的开放性和可维

护性,以保证分析工作不断深入和顺利进行。对手工改动的数据要做到按单位、按地域、按年份进行评估

考核。参考文献

[1]国家税务总局.国家税务总局办公厅关于印发《微观税收分析基本方法》的通知[R].国家税务总

局办公厅,2006年:

国税[2006]26号.[2]国家税务总局.国家税务总局关于印发《税收

分析工作制度》的通知[R].国家税务总局办公厅,2007年:国税[2007]46号.[3]税源监控管理及其数据应用分析编委会.税源监控管理及其数据应用分析(第1版)[M].北京:中国税务出版社,2005.

[4]郭志懋,周傲英.数据质量和数据清洗研究综述[J].软件学报,2002,13(11):2076-2084.

[5]陈传波,唐九飞.信息系统中的数据质量[J].湖北工学院学报,1998,13(3):36-41.

[6]杨辅祥,刘云超,段智华.数据清理综述[J].计算机应用研究,2002,(13):3-5.

作者简介

王时绘(1965—),男,汉族,湖北武汉人,教授,硕士,主要研究方向:信息系统分析与集成;伍江磊(1987—),男,汉族,湖北武汉人,硕士,主要研究方向:信息系统分析与集成。

表一清洗工具对比分析表

ETL

数据清洗技术在税务系统中的应用

67

税务数据安全管理的实践与思考

税务数据安全管理的实践与思考 云计算、大数据、移动互联网、社交是当前世界信息化发展的四大热词。而其中对于税务机关密切关联的是大数据,大数据位于这四个关键词之首。进入大数据时代后,税务机关以风险管理为导向的管理模式,也需要进行超大规模数据的保存、加工、发布,乃至达到基于数据的风险管理的税源管理方式。在这个过程中,如何保证数据安全,确保类似“棱镜门事件”的不再发生,成为地税部门关注的焦点。 一、信息化发展对税务系统数据安全管理的新要求 从国外来看,各税务机关对信息安全和数据保护十分重视,设立了专门的机构来管理。如美国国内收入局设立有信息保护和数据安全管理中心,负责防范数据丢失和泄露。从我国税务系统管理模式和信息化建设发展历程来看,正在逐步进入大数据时代,税务行业的需求会发生两方面变化。一是税务系统需要分析所有数据,其中包括结构化和非结构化的、内部和外部的数据,税务系统需要了解数据的来龙去脉,以便建立数字资产;二是税务系统会采取更加全面的方法取代特定任务的完成,如恶意的软件拦截等,这是一种风险和法规与安全管理系统间的互动,进而提高平台和系统的动态性及情景识别能力。 第一,数据可视化变得越来越重要。领导进行决策不再依靠单一来源事件,而是众多来源事件。可视化对信息和数据的抓取与分析,管控变得尤为重要。掌握了税务数据,才能够掌控税务管理。 第二身份认证变得复杂多变。多终端接入、数据的集中管理,使税务业务环境下的管理技术难度加大。 第三,涉税数据使用不方便。既然已进入大数据时代,就要能有技术手段可以管控涉税数据(纳税人递交的资质影印数据等)的合理使用和不被非法泄露,既能保障纳税人的敏感数据不被泄露,又能提高工作效率。 第四,大批量数据窃取时间越来越多。在这种形式下,需要共同协作才能找到欺诈的源头,因此可准确而完整审计有(或无)意税务数据泄露行为的系统是迫切需要的,因为安全是无边界的,但数据泄露安全防护是有边界的。 二、税务系统数据安全管理的积极探索 根据税务征收管理法和国家税务总局税务工作秘密管理暂行规定的要求,税务机关应当依法为纳税人、扣缴义务人的情况保密。但由于税务业务系统的开发本身缺乏对业务数据泄露防护的功能,很多涉税数据无法有效共享,成为公共政府建设的有效组成部分。因此,急需一套数据防泄露安全管控平台进行有效支撑,来弥补业务系统数据使用过程中的缺陷。管

对加强税收数据分析应用的思考

关于加强税收数据分析应用工作的思考 摘要:开展税收数据分析应用工作,可以为领导决策和强化征管提供科学依据。在新形势下有效地税收数据分析应用是实现税收征管“科学化、精细化”的关键所在,如何结合税收征管实际来加强税收数据分析应用工作,从而更好地为组织税收收入、加强税收征管、提高纳税服务水平服务,这是我们值得深刻思考的问题。 关键词:税收信息化数据分析应用 近年来,随着应用系统整合力度的加大,数据省级集中步伐的加快,为税收数据分析应用提供了良好的平台和载体。各地都在探索开展税收数据分析应用工作,为领导决策和强化征管发挥了积极的作用。不过我们应清醒地看到,当前税收数据分析应用工作中还存在一些问题,不同程度地制约了税收数据分析应用的深入开展。在新形势下有效地税收数据分析应用是实现税收征管“科学化、精细化”的关键所在,如何结合税收征管实际来加强税收数据分析应用工作,从而更好地为组织税收收入、加强税收征管、提高纳税服务水平服务,这是我们值得深刻思考的问题。 一、目前税收数据分析应用工作存在的主要问题 随着综合征管软件的推行、主体软件的整合和辅助软件的上线,各地都从基础性工作入手,把数据分析应用与税收管理结合起来,在一定程度上提高了征管质量和效率。但是,我们也要清醒地看到,数据分析应用工作还存在诸多问题,主要有:

(一)数据不够全面准确,征管基础不实和税源管理薄弱的问题在一些地方还不同程度地存在。征管基础和税源管理是整个税收征管的基础和核心,是反映税收征管水平的重要方面,也是实现“科学化、精细化”管理的出发点和落脚点。对于税务部门来说,纳入系统管理的纳税户数与实际管户相符,税务登记数据全面完整,申报征收数据真实准确,是确保信息数据全面准确最基本的要求,但在实践工作中要完全达到这一要求是十分困难的。同时,企业的财务数据、相关部门与税收管理密切相关的数据、宏观经济数据等也需要采集和处理,这就对数据采集工作提出更高的要求。 (二)税收数据分析选题实用性不强。目前一些基层单位的税收数据分析多限于常规分析,专题分析较少,而对本区域经济税收有针对性和指导性的分析更是少之又少,不能根据一段时间内的工作重点、政策变动、税制改革等影响进行有针对性的税收数据处理分析。还没有完全建立起税收分析、纳税评估、税源监控、税务稽查“四位一体”的良性互动机制,数据信息的深度利用在指导税源管理、税务稽查和领导决策等方面的作用还有待进一步提高。 (三)数据集中度有待进一步提高。由于税收信息化进程在开始阶段没有按照“一体化”要求进行建设,各类税收应用软件各自为政,没有统一的标准和接口,后来虽进行了多次整合和集中,但长期形成的分散、独立的信息资源依然存在。这些信息数据分散在各级税务机关、各个应用软件中,数据共享度较低,开展数据分析应用工作难度较大。一些基层单位从纳税人或其他部门采集的一些数据也没有统一的存储标准,造成数据资源的浪费。

税务系统数据利用存在的问题及解决方案修改

税务系统数据利用存在的问题及解决 方法 中国加入世界贸易组织对政府部门的职能提出了严峻挑战。虽然目前我国在税务机关信息化方面发展较晚。但是,也不要觉得税务机关很落后,还处于“手工查账”时代。细心的人可能会发现,税务机关正在逐渐全面信息化。 一、税务信息化是新时代的需要 众所周知,税务系统是具有共同税收目标又相互关联的各税务机构所组成的有机整体。税务机关是关系国计民生的一个重要的管理机构,从组织结构的角度分析,一个税务机关可以看成一个税收系统。它所属的各职能部门如基层征收机构,以及人事、票证、会计、统计和计划等就是组成税务机关系统的部分,它们共同的目标就是完成税收任务。税务系统与企业的发展息息相关,每一个企业发生的业务都会在税务系统数据库中留下记录。若能正确地挖掘与分析隐含这些数据中的知识,就能更好地向企业提供服务或支持,能够更好地决策当前政策。因此,数据挖掘和利用在我国税收中的研究有着十分重要的应用价值。 实现税务系统信息化是当前税务部门急待解决的问题,而数据挖掘和利用是实现信息化的充分条件。如今,虽然我国已经迈入信息化管理阶段,但我国税务系统大部分仅为地方部门内部的数据共享,并不能实现全国数据共享,甚至部门省市当地国地税均无法实现信息共享。我国和许多其他国家一样都面临着一个严峻形式,那就是每年都会因为纳税人的偷税、逃税、漏税等问题而损失大量的财政收入, 有关税务部门一直以来都致力于解决这方面的问题。通过税务信息化的发展,将全国税务系统打通,及时掌握纳税人经济业务和税收的来龙去脉,把企业、个人偷税逃税行为扼杀在摇篮之中,是新时代考验下比较有限的途径。此外在信息化道路上,我国税务机关从未停下探索、开发前沿技术的脚步,比如"金税工程"三期。 二、税务系统数据利用的问题 在税务系统中,由于规模宏大的企业都会留下税务数据。所以税务系统数据库中积累了大量的企业数据,而这些数据都记录了企业的经营情况,收益情况, 纳税情况等等。因此税务系统数据库中积累了大量的企业数据。这就形成了税务大数据。而税务大数据带给税务系统数据利用方面,有机遇也有挑战。就挑战方面而言,大量的税务数据加剧了征纳双方的信息不对称,其数据体量、复杂性远超过传统数据;而且税务数据信息过于庞大不好掌控,因此纳税人报送信息、税务机关掌握信息、其他平台方涉及信息等安全性存在较大隐患。此外,税务部门需要处理大量的税务数据,这对数据处理人才方面需求很多,如今这类人才的稀

关于税收数据信息分析与应用的几点建议(精)

88 305期 ◆郑东霞 随着税收信息化建设进程的不断推进,来自税收管理工作中的各类数据越来越多,为了对这些税收数据信息进行有效的分析, 为领导决策提供可靠的依据, 使这些数据及其分析有利于规范税收执法行为、有利于税收征管质量的提高,笔者提出以下几点建议: 一、建立税收数据分析制度 目前, 税收数据分析与应用工作已经引起了各级税务机关的高度重视, 但如何对税收数据信息进行分析和应用, 尚没有一套完整的税收数据信息分析与应用制度来准确界定。为适应信息技术的快速发展, 盘活有关企业税收数据, 使基层税务部门税收数据分析有一整套机制,应尽快建立税收数据分析与应用制度。通过出台税收分析与应用制度, 对内外部数据来源、采集方式、数据分析适用范围等提出明确要求, 对日常税收数据分析工作按照不同类别和主题制定相应的具体指标、统一标准和操作流程, 从制度层面上增强数据分析与应用的刚性, 盘活基层税务部门的数据资源, 为日常税收征管提供数据分析应用机制及科学的计算方法,充分发挥税收数据信息分析的作用, 满足日常征收、管理和稽查工作的需要, 便于基层税务人员在采集和应用数据方面知道应该做什么、不应该做什么,便于基层税务人员有效的规避执法风险。 二、完善综合数据分析系统 目前, CTAIS已经实现了数据大集中, 对征收、管理、稽查实现了全程管理, 为税务部门提供了直观的数据。但该系统还存在一些“短板” ,例如不能分税种、分税务所查询税收收入完成情况等, 而且, 该系统与出口退税系统、车购税系统等分别独立运行, 系统之间存在数据不兼容现象。建议在 CTAIS 系统基础

关于税收数据信息分析与应用的几点建议 上, 进行系统整合、数据兼容和程序研发工作, 建立统一的税收数据来源、查询、分析、决策平台。新平台应具备税收分析、监控预警和纳税评估等功能。 以所得税为例, 新平台应该便于税务部门按照不同口径自动查询分析连续三年亏损企业、扭亏为盈企业, 以 及企业所得税年度申报率、零申报率、有税率、① 入 库率、盈利面、亏损面变化等情况, 而不需要手工逐项计算, 使一线税收征管人员从繁重的统计分析工作中解放出来。同时在预警功能中, 对企业预警指标异 常的给予提示, 及时开展纳税评估工作, 从中查找和发现企业经营和纳税存在的异常,及时进行评估辅导,有效堵塞征管工作中的漏洞。 三、建立税收数据资源共享平台 目前, 外部渠道获取的税收数据信息, 主要来源于地方税务局、工商、技术监督和民政等政府职能部门,通过与这些部门召开定期联席会议、电话沟通、联合发文等形式, 对部分数据资源进行电子或纸质资料的交换和资源共享, 但这些远远满 足不了需要, 外部数据的采集缺乏一个共同适用的共享平台, 不能做到随用随取。建议利用网络建立数据资源共享平台, 分别在两个或两个以上部门之间实现数据资源共享, 根据需求互通、互换涉税数据, 实现数据交换的电子化,使各类数据实现点对点“对接” ,从而保证数据 资源交换的准确性和及时性,有效提高工作效率。 四、提高“信息管税”水平 目前电子通讯技术和互联网迅猛发展, 但由于地理位置、经济发展水平、企 业人员素质等诸多因素的影响, 企业的税收数据采集方式, 既有网上的, 也有IC卡的, 还有手工操作的, 税务机关为纳税人提供的软件和硬件

智慧税务局大数据云平台整体解决方案

智慧税务局大数据云平台 解 决 方

第一章总体业务需求分析和整体架构概览 (7) 1.1 智慧税务管理要求 (7) 1.1.1服务优化 (7) 1.1.2以风险管理为主线 (7) 1.1.3数据实现省市县分级分类管理 (7) 1.1.4强化税源专业化管理,探索“两个转变” (8) 1.2 智慧税务建设目标 (9) 1.2.1结合大数据分析技术,让纳税评估更为准确 (9) 1.2.2融合第三方涉税数据,提高税法遵从度和税收征收率 (10) 1.2.3尝试业务系统变革,进一步防范涉税风险,提高税收征收率 (11) 1.2.4防控廉政,防范内部违法风险 (11) 1.2.5通过纳税人画像,辅助管理 (12) 1.2.6建立风险特征库,自动预警防控 (12) 1.3 税务行业信息化建设现状 (13) 1.3.1数据杂乱 (14) 1.3.2系统各自为政 (15) 1.3.3关联复杂 (15) 1.4 大数据服务平台整体架构概览 (15) 1.4.1”数据管税“业务应用体系(大数据应用体系) (16) 1.4.2税务大数据服务平台 (18) 第二章数据治理之需求和技术分析 (19) 2.1 数据治理综述 (19) 2.2 定义业务问题,以指导方向 (22) 2.3 获得管理层支持,以获得组织和资源保障 (23) 2.3.1成立数据治理工作组 (24) 2.3.2获得相关方高层的支持 (24) 2.3.3确定数据治理的负责人 (24) 2.4 执行成熟度评估,以了解现状和确定将来所达目标 (25) 2.4.1成果 (25) 2.4.2促成要素 (26) 2.4.3核心准则 (26) 2.4.4支撑准则 (26) 2.5 创建数据治理路线图 (27) 2.5.1总结数据治理成熟度评估的结果 (27) 2.5.2列出填补评估中强调的差距所需关键人员、流程和技术计划 (28) 2.5.3基于关键计划的优先级创建路线图 (28) 2.6 建立数据治理组织蓝图 (29) 2.7 创建数据字典/业务术语库 (30) 2.8 理解业务和数据 (33) 2.9 创建元数据存储库 (35)

某省地方税务局大数据应用平台建设案例

某省地方税务局大数据应用平台建设案例 发布源:北京北大软件工程股份有限公司 一、建设背景 随着税务信息化建设“后金三”时代的到来,围绕着国税总局提出税收现代化改革理念,信息化建设的核心任务就是深入应用与不断完善金税三期系统工程,基于互联网+税务进行纳税服务升级,对全面的涉税信息进行整合、利用、共享,基于大数据、云计算来对数据进行深化应用实施管理创新。省地税局启动了基于大数据的技术体系,对全省范围税收业务数据进行整合,形成全省范围的数据资源平台,为税收治理提供有效的支撑。 二、提升客户价值 通过本次创新应用的建设,不断驱动大数据资源平台在数据整合、数据供应、数据治理上不断完善与提升。对数据深度分析来展示全省信息化建设成果、更加有效的识别纳税人风险、发现纳税人之间的各类关系,更加便捷的支撑各级税务人员对税源深入管理,更好的支撑更多的创新应用建设。增加各类有价值的创新应用,从而形成一个真正满足业务处室需要的、繁荣的数据应用生态。 三、建设内容 1. 借鉴国税总局大数据云平台项目、其他省局大数据建设成果的各类经验、成果,在省大数据资源平台之上,构建大数据创新应用平台。 2. 基于图表结合,建设涵盖收入、管户、税源、个税、风险等等业务主题的智慧税务监控大屏,也可以将重大时政的影响变化、重大税种的专项监控,动态的集成到监控大屏。 3. 借助电子商务领域“数据业务化”的思想------标签与画像,来构建税务体系的纳税人标签库,以画像技术来为全省纳税人提供多角度的单体画像,通过群体画像来动态圈选符合特征的纳税人群体,有效识别纳税人风险。方便税务人员进行有效的风险管理。 4. 梳理与整合纳税人的各类关系,通过可视化的关系展示与分析界面,为每

关于税收数据信息分析与应用的几点建议

88 《税务研究》2010.10 总第305期 ◆ 郑东霞 随着税收信息化建设进程的不断推进,来自税收管理工作中的各类数据越来越多,为了对这些税收数据信息进行有效的分析,为领导决策提供可靠的依据,使这些数据及其分析有利于规范税收执法行为、有利于税收征管质量的提高,笔者提出以下几点建议: 一、建立税收数据分析制度 目前,税收数据分析与应用工作已经引起了各级税务机关的高度重视,但如何对税收数据信息进行分析和应用,尚没有一套完整的税收数据信息分析与应用制度来准确界定。为适应信息技术的快速发展,盘活有关企业税收数据,使基层税务部门税收数据分析有一整套机制,应尽快建立税收数据分析与应用制度。通过出台税收分析与应用制度,对内外部数据来源、采集方式、数据分析适用范围等提出明确要求,对日常税收数据分析工作按照不同类别和主题制定相应的具体指标、统一标准和操作流程,从制度层面上增强数据分析与应用的刚性,盘活基层税务部门的数据资源,为日常税收征管提供数据分析应用机制及科学的计算方法,充分发挥税收数据信息分析的作用,满足日常征收、管理和稽查工作的需要,便于基层税务人员在采集和应用数据方面知道应该做什么、不应该做什么,便于基层税务人员有效的规避执法风险。 二、完善综合数据分析系统 目前,CTAIS已经实现了数据大集中,对征收、管理、稽查实现了全程管理,为税务部门提供了直观的数据。但该系统还存在一些“短板”,例如不能分税种、分税务所查询税收收入完成情况等,而且,该系统与出口退税系统、车购税系统等分别独立运行,系统之间存在数据不兼容现象。建议在CTAIS系统基础 关于税收数据信息分析与应用的几点建议 上,进行系统整合、数据兼容和程序研发工作,建立统一的税收数据来源、查询、分析、决策平台。新平台应具备税收分析、监控预警和纳税评估等功能。以所得税为例,新平台应该便于税务部门按照不同口径自动查询分析连续三年亏损企业、扭亏为盈企业,以 及企业所得税年度申报率、零申报率、有税率、① 入 库率、盈利面、亏损面变化等情况,而不需要手工逐项计算,使一线税收征管人员从繁重的统计分析工作中解放出来。同时在预警功能中,对企业预警指标异常的给予提示,及时开展纳税评估工作,从中查找和发现企业经营和纳税存在的异常,及时进行评估辅导,有效堵塞征管工作中的漏洞。 三、建立税收数据资源共享平台 目前,外部渠道获取的税收数据信息,主要来源于地方税务局、工商、技术监督和民政等政府职能部门,通过与这些部门召开定期联席会议、电话沟通、联合发文等形式,对部分数据资源进行电子或纸质资料的交换和资源共享,但这些远远满足不了需要,外部数据的采集缺乏一个共同适用的共享平台,不能做到随用随取。建议利用网络建立数据资源共享平台,分别在两个或两个以上部门之间实现数据资源共享,根据需求互通、互换涉税数据,实现数据交换的电子化,使各类数据实现点对点“对接”,从而保证数据 资源交换的准确性和及时性,有效提高工作效率。 四、提高“信息管税”水平 目前电子通讯技术和互联网迅猛发展,但由于地理位置、经济发展水平、企业人员素质等诸多因素的影响,企业的税收数据采集方式,既有网上的,也有IC卡的,还有手工操作的,税务机关为纳税人提供的软件和硬件 ① 有税率是指纳税企业户数占已申报户数的比例。 工作探索 Surveys and Thoughts

ETL中数据清洗技术在税务系统中的应用

0引言 税务系统由于有复杂的财务关系、财务流程等,不可避免在事物扭转等过程中会产生错误数据。贵州省地税局九个市(州、地)的数据已经集中到市(州、地),但是由于地税局的相关业务系统经过多次改版和升级等原因,造成了很多数据不一致等数据质量问题,并且各市(州、地)的数据质量参差不齐,对省级数据集中和在省级数据集中基础上的其它应用都会带来很大的麻烦和困难。因此对九个市(州、地)的原始数据进行数据质量监控与分析,保证原始数据的数据质量就显得非常重要,也是省局通知中规定的八个目标之一。因此,数据质量监控与分析系统作为贵州省地税局省级数据集中项目中的一个子系统,肩负着其它目标实现质量好坏的基础性任务。1数据清洗错误数据产生原因 在税务系统中,“脏数据”产生的原因主要如下:(1)MIS系统数据的迁移(从03版到06版,再从06版到09版MIS数据的两次迁移)。 (2)人工不合法的操作,主要涉及应用层和数据库层两个方面。其中应用层人工的不合法操作主要原因是因为软件本身存在的漏洞,数据库层主要原因是操作人员直接修改数据库中的数据。 ETL中数据清洗技术在税务系统中的应用 Data Cleaning Technology of ETL Tax System in the Application 王时绘1伍江磊2 Wang Shihui Wu Jianglei (1.湖北大学数学与计算机学院软件研究所,湖北武汉430062;2.湖北大学数学与计算机学院, 湖北武汉430062) (1.Mathematics and Computer College Software Institute,Hubei University,Hubei Wuhan430062; 2.Mathematics and Computer College,Hubei University,Hubei Wuhan430062) 摘要:ETL即数据抽取、转换、装载的过程,它是构建数据仓库的重要环节,而数据仓库是面向主题的、集成的、稳定的且随时间不断变化的数据集合。数据清洗是一个减少错误和不一致性、解决对象识别的过程,目前有很多数据清洗研究和ETL研究,但是如何在ETL过程中进行有效的数据清洗,此方面研究不多。本文将以此为问题出发点,探讨ETL中的数据清洗技术在税务系统(贵州省省直属局和九个地市州的原始数据)中的应用。 关键词:ETL;中间数据库;目标数据库;MIS系统(管理信息系统) 中图分类号:TP311文献标识码:A文章编号:1671-4792-(2011)11-0065-03 Abstract:ETL namely data extraction,conversion,loading process.It is the building the important link of the data warehouse.The data warehouse is the theme for,integrated,stable and the changed with time data set. Data cleaning is a reducing errors and inconsistencies,and solve the object recognition process.At present there are many data cleaning research and study,but how to ETL ETL process of effective data cleaning,this research is not much.This paper will be based on the starting point,this paper discusses the problem of cleaning technology in data ETL tax system(guizhou province ZhiShuJu and nine cities and states of the original data)application. Keywords:Extraction-Transformation-Loading;Staging Database;Target Database;Management Informa-tion System ETL 中 数据 清洗技术在税务系统中的应用 65

第五部分税收数据分析应用

第五部分税收数据分析应用 第六章税收数据质量管理 数据是现代管理的灵魂,是进行科学管理、分析、决策的基础。随着税收管理科学化、精细化、信息化的不断深入,税收征管、纳税评估、税收分析等各项工作对数据质量提出了新要求。数据质量不仅是税收执法质量和税收征管质量的具体体现, 还成为保障税收数据分析的基础, 数据质量管理工作不到位必然影响税收工作的质量, 而由于数据的不真实、不准确、不完整、不一致所带来的数据质量问题也成为制约数据分析应用的瓶颈。 第一节数据质量的概念和特点 1.1 数据质量的概念 狭义来说, 数据是进行各种统计、计算、科学研究或技术设计等所依据的数值。而本章要讨论的是在税收征管信息系统中定义的各种类型数据, 除了可用于计算的数值型数据外, 也包含以字符表示的文本和非结构化的图像数据。以纳税人登记资料为例, 涉及到的基本情况包括名称、地址、注册资本、营业执照电子扫描件等,其中注册资本是数值型数据,而名称、地址就是字符型数据,营业执照电子扫描件就是图像数据。 数据本身并不存在真假、质量高低的问题, 而将其置于一定的关联关系和生存环境, 赋予一定的条件和意思表达, 则就要求数据能准确展示对事物的数字维度。所以说,数据质量是基于事物事实,能准确表示事物的数字语言,对其数字真实性、完整性、自洽性的量度。 真实性即真实反映事物本来面目, 完整性是说数据是充分的, 任何有关操作的数据都没有被遗漏, 自洽性即数据并不是孤立存在的, 数据之间往往存在着各种各样的约束,这种约束描述了数据的关联关系, 数据必须能够满足这种数据之间的关联关系, 而不能够相互矛盾。数据的真实性、完备性、自洽性是数据本身应具有的属性,称为数据的绝对质量,是保证数据质量的基础。

税务系统数据管理的调研报告

税务系统数据管理的调研报告免费 文秘网免费公文网 税务系统数据管理的调研报告2010-06-29 19:01:29免费文秘网免费公文网税务系统数据管理的调研报告税务系统数据管理的调研报告(2)随着计算机技术的广泛应用,依靠计算机进行数据管理,已被愈来愈多地运用到社会各个领域。计算机处理数据的准确快捷,不仅使人们在工作中节省了大量的人力和时间,而且为人们生活、社会经济和管理带来了难以估量的巨大效益,信息数据已经成为21世纪第四大资源。计算机数据管理在国税系统同样发挥着主要作用。以中国税务征收管理信息系统的推广为标志,计算机数据管理已渗透到税务工作的各个环节。从纳税人进行税

务登记,到录入纳税申报信息进行收入汇总统计,到计会部门税票核销、金库对账,到税收会计账,不难看出各项业务工作已越来越离不开计算机系统中的数据信息。税务系统数据管理工作中对数据信息这一宝贵资源的利用方面还存在不少问题亟待解决。笔者就此类问题结合工作实际谈几点看法。 一、数据管理的概念及当前税务系统数据管理工作中存在的问题 数据管理是指通过对数据的采集、审核、调整、存储、传输、发布等过程进行合理有效的计划、组织、协调和监督,以保证数据的质量与时效,提高数据利用效率的一种职能活动。根据税务部门目前工作的实际情况,数据管理的对象是税收业务数据及相关数据。数据管理工作与当前税务系统设置的数据处理中心的工作存在明显的不同:数据处理中心的工作是解决如何对数据进行加工和整理的问题,强调对具体数据操作行为的规范。它是税收整体业务流

程的一部分,它的工作目的是满足各类工作需要;而数据管理工作是对数据操作行为实施的管理,强调对数据操作过程的控制与监督,它的工作目的是保证数据的质量的时效。以某税务分局为例,该局的计算机系统运行以来,各项基础工作尚十分薄弱,特别是各级税务干部对数据信息的重要性认识不足,没有为计算机系统提供配套的数据管理组织机构和管理措施,导致基础信息长期不准确、错误率较高。各科室的相关统计表长期以来严重不准确。通过调查分析,笔者认为造成基础数据不准确的原因主要有以下两点: (一)税务系统没有为税务管理信息系统配备相应的数据管理机构,各科没有配备相应的数据管理人员。没有数据管理人员审核录入质量,各科室又需要计算机部门的技术人员帮助查询,而计算机部门的技术人员因为有自己的日常工作也不可能经常性地帮助其进行数据查询。同时计算机管理部门作为一个

SPSS在税务系统中的研究应用

SPSS在税务系统中的研究应用 内容提要:随着信息化的发展,税务系统内已经累计了大量的涉税数据,如何从海量数据中发现有价值的信息,为税收管理工作服务,已经成为一个重要课题。这些年来,国家税务总局高度重视对涉税数据的应用,多次发文对数据分析应用工作提出具体要求。本文对焦作市局当前数据分析应用工作的现状、存在的问题进行系统阐述与分析,最后提出SPSS这个有效的数据分析软件,通过SPSS中的因子分析方法,及时发现税收征管薄弱环节,全面提升税收管理的科学化、精细化、规范化水平。 关键词:税务数据分析SPSS主要因子 近年来,各地税务机关在加强数据管理、深化数据分析应用、探索信息化支持决策与管理模式等方面,做了很多有益的探索,取得了一定成效。但如何有效地进行税收数据分析应用,提高税收管理的整体水平,为加强征收管理提供依托,已经迫在眉睫。 现阶段我们理解的税收数据分析应用是指基于特定的目的,按照一定的规则,运用科学的方法,对采集的税收数据进行提取、查询和加工、处理,挖掘有价值的信息,找出内在规律,通过一定格式展现并最终形成《税收数据分析报告》的过程。那么,目前各级税务机关税收数据分析应用工作的现状如何?制约税收数据分析应用工作的主要因 素有哪些?提高税务数据分析水平,我们更需要关注什么?目前在税务系统内部使用的数据分析管理平台、软件也很多,本文将主要研究SPSS数据分析软件,运用其中的因子分析法对工业企业进行纳税评

估,从而全面提升税收管理的科学化、精细化、规范化水平。 一、税收数据分析应用探索与实践 伴随着数据的集中,全国各级税务机关对涉税数据的利用与分析一直没有停止探索与实践,通过对各类涉税数据的利用、分析,发现了一些税收管理工作上的漏洞,并采取了针对性措施,使税收信息化对税收工作的支撑作用得到了一定程度的发挥。近些年来,焦作市地方税务局对数据分析应用工作也在进行着一些有益的探索与实践。2010年,焦作市局将征管系统数据质量分析作为开展税务分析的切入点,结合工作实际进行数据分析指标选择,把当前税收征管工作的重点、难点、热点优先列入选题范围,并选择纳税人管理、申报征收率、征收入库差、欠税金额等作为主要分析指标,以图形和文字的方式对比分析、逻辑关系分和波动分析,为领导决策提供了参考,效果明显。以开展欠税情况分析为例,通过合理安排会计记账时间、调取数据核实调整虚欠等措施,仅解放区局欠税额由最初的651.40万元下降到0.5万元。2011年,为进一步深化数据挖掘与分析,焦作市局以“加强税源分析和监控,堵塞征管漏洞,实现税收征管科学化、精细化管理”为目标,积极开展数据挖掘与分析工作。严格制定《2011年数据挖掘与分析工作项目登记表》,全市共立项14个,其中包含有管理类、征收入库类、单行业单税种分析,纳税服务类等,为顺利完成数据挖掘与分析奠定了基础。 从目前来看,焦作市局无论是在数据应用的深度和广度上,这些实践和探索大多数是停留在浅层次、低水平应用阶段,数据分析应用对税

税务系统设计方案总体设计说明

税务行业信息化建设解决方案 第一章系统概述 1.1 概述 信息技术的进步与网络经济的兴起为我国各区域、各行业调整产业结构,利用后发优势实现跨越式发展提供了机遇,同时,信息技术在行业的应用已得到IT界广泛认可,政府上网工程、企业上网工程、家庭上网工程已是信息化发展的重点。 在政府上网工程中,“金税工程”被誉为增值税的“生命线”,它的建设也成为国民经济信息化的重点之一。随着覆盖全国税务系统的计算机网络在全国围建立,科技兴税开始初见成效。传统业务受到了很大的限制,如果不利用信息手段加速信息化的进程,不但新业务的发展变得很困难,而且也很可能会失去本身具有优势的业务。因此,面对现状及自身的行业特点,国家及地方税务部门开展信息化建设势在必行。 1.2 税务系统信息工程概述 本着“科技加管理”的工作思路,运用信息技术手段,实现中国税务管理信息化。税务系统希望通过加强信息化建设,强化各级信合机构的经营管理,实现管理与效益的相互推动和转化,加快信息一体化进程,从管理和技术手段上防和化解税务系统风险。为此,建设和利用税务系统特点的信息系统,将从整体上提高企业的经营管理水平,建立一套快速反应和响应机制。 上图为税务系统信息化工程整体结构图:

目前税务系统信息化工程一般分为三个部分:外部信息交换、税务核心业务,税务办公。 外部信息交换系统一般来讲包括外部信息门户,以及和工商、银行、审计单位的联系接口。信息门户一般来讲主要负责进行税务相关信息发布,提供一个窗口面向广大群众,提供各类新闻、法规、指南等,实现信息宣传,政务公开化,透明化。还可以提供网上信息申报的入口,最终和核心业务系统进行联系,协助完成税收工作。和工商、银行、审计单位的联系接口是为了实现电子检查,电子税收等功能,实现信息共享,协同办公。 税务核心业务系统主要涉及税收、管理、稽核、检查、实施等方面,是税收征管业务的主体。 税务办公系统,实现目标是以公文管理、档案管理、个人工具、后勤管理作为核心,实现税务系统部办公管理自动化以及文档一体化,提高税务系统的办公效率、节约成本、提升企业竞争力的目标。最终使办公系统成为税务系统用户进行日常办公和相关业务处理、查询的统一系统。 外部信息交换系统、税务核心业务系统、税务办公系统三者均互为独立的系统,但又相互联系,在支撑平台的信息数据流管理下实现信息共享。其中外部信息交换系统、税务办公系统对税务核心业务系统提供支持。决策支持系统和以上三部分均有接口,通过各种分析方法实现对不同数据的信息,提供决策信息。 1.3 朝华瑞尊税务系统信息化建设方案的定位 朝华瑞尊税务系统的信息化建设方案主要针对外部信息门户和税务办公系统,配合税务核心业务系统,逐步实现中国税务信息化工程的建设。 1.3.1 税务信息门户的定位 在网上建立起税务系统与公众之间相互交流的桥梁,实现网上信息发布,部办公系统,收集相关群众意见,不但为公众与税务系统各级构打交道提供方便,而且对于体现税务系统行业特色,树立税务系统窗口形象也极具重要的意义。 的总体建设是一个渐进的过程,为了适应税务系统的行业特点,总体建设中我们可以选择分两步进行: 1) 初期以为纳税人服务,宣传业务法规,树立企业形象为主要目标,奠定基础为目标; 2) 建立全面的网上业务、电子税务,包括:网上申报,网上纳税,实时数据查询等业务,实现和银行、商检系统的连接,实现协同办公。 1.3.2 部办公系统的定位 部办公系统是税务系统实现信息化的重要容,首先,通过部办公系统,要实现日常办公事务处理的电子化,即综合办公事务应用系统。主要实现税务系统部之间的、信息上报、公文收发、工作简报、公共信息发布等相关辅助办公管理和相关部门信息传递的功能,并且实现了办公的流程化,动态化,极大的方

浅谈税务数据分析工作中业务分析模型的应用

论文编号:5D37110001 浅谈税务数据分析工作中业务分析模型的应用 白乃安 内容提要: 本文通过对“业务分析模型”和“税务数据分析”这两个概念的解释,阐述了在税务数据分析工作中应用业务分析模型的理由和意义,然后在此基础上详细说明了如何在税务数据分析工作中创建和应用业务分析模型,从而更好地利用税务部门积累的大量有价值信息,推进“信息管税”。 关键词:税务数据分析分析主题业务分析模型 一、引言 税务系统信息化工作的不断发展和大量有价值信息的积累,为加强税务数据分析、推进“信息管税”提供了坚实的基础。如何才能更好地进行税务数据分析呢?总结这几年的工作经验,笔者认为采用业务分析模型进行税务数据分析可以极大的促进这项工作,下面来看一下如何在税务数据分析工作中应用业务分析模型。 二、业务分析模型和税务数据分析的概念 要想研究如何在税务数据分析工作中应用业务分析模型,首先要搞清楚本文所称的“业务分析模型”和“税务数据分析”分别是什么? (一)什么是业务分析模型 1、定义 模型是指客观事物的抽象表达形式,一般表现为设计图、计算机程序、计算公式或是一个无二义性的概念描述等。业务分析模型是关于如何取得分析主题的结论而建立的模型,它有四个要素:分析主

题、所属业务对象、对象属性、结论算法,其中分析主题、所属业务对象和结论算法有且只有一个,对象属性可以有一个或多个。业务分析模型结构如图1。 图1:业务分析模型结构图 分析主题用来说明业务分析模型能够解决什么问题,是业务分析模型的核心,其它要素都是围绕分析主题设立的。所属业务对象用来说明分析工作所面对的客体,是一个客观事物对象。结论算法用来说明业务分析模型如何解决问题,它的质量决定着整个业务分析模型的质量,是业务分析模型的关键,用公式表示是:R = F(O1,O2,……,O n),R表示得出的分析结论,F表示结论算法,O1,到O n 表示n个对象属性,基于数据库分析的结论算法就是一个SQL语句。对象属性一般就是结论算法中出现的参数,如果某个对象属性的过滤条件不为空,则表示该对象属性会限定所分析的业务对象范围。 2、与数据模型的区别 业务分析模型不同于计算机系统开发领域内的数据模型,二者的区别如图2:

大数据背景下的税务管理探讨论文

大数据背景下的税务管理探讨论文大数据背景下的税务管理探讨论文预读: 摘要:摘要:随着技术的进步,我国逐渐步入了大数据时代,经济、社会随之发生了深刻变革.为适应新形势的变化,传统的税务管理也应及时从税务管理体系优化、税收风险控制、微观税收数据体系变更等方面进行相应的改革.关键词:大数据;税务管理;改革一、背景介绍随着现代网络技术、云存储、云计算技术的不断深入发展,大数据,这个新名词,正逐步走上了经济社会发展的舞台中央,成为了各行各业竞相发展的新潮流,我们也渐渐步入了一个全新的时代———大数据时代.税务管理,一个古老而又历久弥新的概念.从古代的征纳赋税、徭役开始,就出现了税务管理的雏形.工业革命以来,随着社会化大生产的形成,近代化的税务管理也逐步诞生.第三次科技革命之后,随着信息化大潮的来临,税务管理更是与时俱进,跨入到了现代化、信息化的时代.但是无论时代怎样发展变化、技术如何革新,税务管理,作为一个国家进行税收组织、征收、调节的基本手段,始终有着一个基本框架———国家依靠税务部门、人员,依据相关法律法规,凭借一定技术手段,对税收收入进行全面管理.大数据时代下的税务管理,代表着税务管理这个传统的范畴纳入到了大数据时代这个最新的科技浪潮之下;代表着传统的税务管理技术手段面临全面更新换代;代表着税务部门、人员也要随着时代的变革而进行部门调整、知识技能的与时俱进;代表着相关的税务法律法规也要随着经济社会的变迁而进行相应更改;代表着由大数据时代税务管理所带来的更精准、更海量的税务信息;代表着依靠这些精准、海量税务信息所做出的更贴近于实际的税务决策;代表着更多更深远的变革.二、税务管理的改革方向大数据时代下的税务管理,作为一个传统领域与新时代背景的交叉部分,其改革进程仍处于萌芽阶段,主要有以下三个改革方向:1.大数据时代下税务管理体系的优化税务管理体系,是一国进行税务管理所倚仗的基本体系,是税务管理的核心和主干.其包含的要素主要有部门

数据挖掘技术在税务系统中的深度应用

数据挖掘技术在税务系统中的深度应用

数据挖掘技术在税务系统中的深度应用 随着计算机技术的发展和数据挖掘应用的逐渐成熟,数据挖掘技术引起了越来越多的行业的重视。在国外,政府应用数据挖掘技术发现欺诈行为已经有了30多年的历史,如今,中国的各类政府机关在信息化的进程中也都不约而同的将数据挖掘应用提到了议事日程上来。税务征管需要以更新、更便捷、更有效的方法,对大量的征管数据进行分析、提取、挖掘其隐藏信息数据中的潜能。本文着重介绍了通过数据挖掘技术如何实现纳税评估选案,从而降低征管成本,提高管理效果。 一、税务征管发展基本状况 我国和许多起他国家一样每年都会因为纳税人的偷漏税问题而损失大量的财政收入,有关税务部门一直以来都致力于解决这方面的问题。但是在没有引进计算机工具和数据挖掘工具技术之前,这方面的工作在很大程度上,是依赖专业的人员根据以往的工作经验和某些直觉上的判断来圈定那些不法纳税人的特征,虽然这在初期可能会有很大的帮助,但是随着税务体制的改革,经济的发展,自然而然的引起的税源的增加,税种的增加,这时,政府的税务管理部门在使用以往总结的凭经验和直觉判断的方法,去区分判断那些违法的纳税人,势必会导致产生以下问题:征管人员的增

长期以来,税收工作中数据利用比较常见的形式有:报表浏览、简单查询、复杂查询、税源分析、税负分析、收入预测、过程监控等,多数专家认为,目前税务数据应用的一般特征是基于汇总、分类、简单计算基础之上的原始税收数据的“复制式”展现和对税收现象的“陈列式”描述。 随着经济、社会的发展,税收数据的一般利用已经不能满足税收信息化深化和税收管理现代化的内在需求,为了加强税收征管、规范税收秩序,国务院于1994年开始实施“金税工程”。“金税工程”初期以“增值税监管”为主要目标;二期时,内容已拓宽为增值税防伪税控开票系统、防伪税控认证系统、增值税计算机交叉稽核系统、发票协查信息管理系统的四个系统;到了三期,其目标已经成为:在二期基础上,建立七个子系统(管理子系统、征收子系统、稽查子系统、处罚子系统、执行子系统、救济子系统、监控子系统),35个模块。依据美国学者Richard.L-Nolan的理论(对于任何行业,信息化大体要经历初始、蔓延、控制、集成、数据管理和成熟这样几个发展阶段,这是信息化发展的般规律。)和Mische的补充(他认为集成和数据管理是密不可分的,因此信息化发展的必然路径是起步、增长、成熟和更新四个阶段),目前,税务信息化的发展阶段已开始向成熟阶段过渡。

基于大数据背景的税收风险管理

浅析大数据时代的税收风险管理 大数据技术是近年来快速兴起并广泛应用于生产和销售等各个领域的一项数据分析和应用技术。作为一种现代化的生产手段,它的产生实质上是由于生产力的发展而在客观上对生产工具产生的更新换代要求。税务机关的大数据应用,指的是采用新的平台,将申报、征收、金税、退税、登记、票管、情报等信息进行收集汇总,通过数据清洗、去轨迹等操作,使多系统数据进行共享与分析。简而言之,即是对内部管理及外部采集的大数据信息的综合归整和利用。能否对大数据进行处理、分析与整合,将成为税务管理质效的关键。在未来的税收管理工作中,我们需要利用各种大数据分析技术和工具,挖掘和处理涉税大数据,在此基础上预测和分析最佳的税收管理方案,以支持税务机关做出更加合理的决策,提高税收征管质效,加快服务创新步伐,发现和开拓新的税源增长点,促进税收事业更快发展。 一、大数据背景下税收风险管理遇到的问题及原因 大数据时代的到来,为税收征管与科技的有效融合,为税收征管服务一体化开辟了广阔空间,也为税收征管大数据平台准备了充足的技术条件,更为深化税收风险管理提供了技术支撑。但是,大数据背景下的税收风险管理不是简单地应用信息技术手段实现工作流程的计算机化,而是涉及税收管理理念、业务流程、制度机制、资源配置等方面重大、深刻的变革,必将给税收工作发展带来深远的影响。税收风险管理在大数据背景下遇到的一系列问题亟待解决。这些问题有: (一)涉税数据质量和更新速度有待提高 税务管理各个环节,包括税务登记、纳税申报、税款征收、发票管理、纳税评估、税务稽查等产生的涉税信息资源,构成了税务机关征管系统的主体数据。近年来,各地税务机关通过设立数据审计规则、错误数据推送、初始数据校验、发布数据质量通报等措施,使征管系统数据质量有了较为明显的改善。但由于采集方式多以手工录入为主,数据在质量上,特别是在完整性、准确性、规范性、逻辑性等方面,依然难以满足税收风险管理的需要。另外,不同纳税人的名称、生产经营地、法人、财务负责人、经营范围经常变化,使税务机关征管系统的数据很难做到随时更新,也给税收风险管理带来难题。 (二)第三方数据采集缺乏制度保障和先进技术手段 第三方数据的采集为税收风险管理的开展提供了广阔的空间,但从目前情况看,少数政府部门、社会团体、协会组织等仍以自身利益、商业秘密为由,对第三方数据交换不支持、不配合,不愿意或不提供纳税人涉税信息。第三方数据采集工作难以有效开展的主要原因是缺乏法律法规层面的制度保障。《税收征管法》及其实施细则仅规定政府各有关部门和单位应当支持、协助税务机关依法履行职责,但对具体采取的方式和程序、违反规定应如何追究和处罚等均没有具体规定。另外,第三方数据采集缺乏先进的技术手段,大多以人工搜索和拷贝网上信息为主,通过搭建信息化平台,运用科技手段实现采集自动化的程度还不高,使信息采集工作耗时较长,数据采集的精度有偏差。 (三)数据接口标准有待进一步统一 当前,同一主体多个代码共存现象较为普遍,影响信息比对,降低行政效率。我国现有机构代码分为原始码和衍生码两类。前者主要包括工商部门的工商注册号、机构编制部门的机关及事业单位证书号、民政部门的社会组织登记证号等。后者主要包括组织机构代码管理部门的组织机构代码、人民银行的机构信用代码、国家税务总局的纳税人识别号等。2015 年6 月份,国务院下发《法人和其他组织统一社会信用代码制度建设总体方案》,规范统一国务院部门制定政务数据的接口标准,建立覆盖全面、稳定且唯一的以组织机构代码为基础的法人和其他组织统一社会信用代码制度,为税收风险管理数据拓展利用建立了坚实的基础。尽管上述文件从源头上达到了“书同文,车同轨”的效果,但不可否认的是,自然人以身份证号或社会保障号作为唯一的识别码,在税收领域的全覆盖还应引起政府的足够重视。

相关文档
最新文档