贴心的人力服务管家
微信热线153-8231-2506
小服人力
企业微信
北京 上海 广州 深圳 武汉 沈阳 四川 重庆 浙江 江苏 天津 陕西 湖南 云南 厦门 青岛 河南 安徽 福建 苏州 山东 珠海 大连 江西 更多>>

浅谈税务数据仓库的构建

   日期:2018-12-12     浏览:563979    评论:0    
核心提示:  摘要:本文介绍了数据仓库的概念。浅析了税务信息化的现状和存在的问题、如何建立税务数据仓库。    关键词:税收;数据仓库


     摘要:本文介绍了数据仓库的概念。浅析了税务信息化的现状和存在的问题、如何建立税务数据仓库。    关键词:税收;数据仓库 
  
   一、前言 
   税收是国家财政收入的主要来源,是维护国家机器正常运转的源动力之一,对国民经济健康、持续发展起着重要的促进、调节作用。税务部门是进行政府信息化建设进行较早的部门之一,各种税收应用系统成为保证税收工作顺利完成的重要工具。 
   二、税务数据仓库的构建 
   20世纪90年代初期,著名的数据仓库专家W.H.Inmon首先提出数据仓库的概念:数据仓库DW是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合, 用于支持管理决策。 
   (一)数据仓库的体系结构 
   数据仓库的设计主要包括两个部分:与操作型系统接口的设计和数据仓库本身的设计。前者的设计主要指ETL组件的设计,ETL组件通过对源数据进行清洗、转换、加载,把事务数据转换成数据仓库中的数据;后者的主要设计问题是:粒度、分区和适当设计。 
   (二)数据仓库主题分析设计 
   数据仓库的设计,在表现形式上必须满足数据分析和决策支持的需要,根据税务业务对税务数据仓库进行主题设计,以征收税款主题为例,介绍分析具体内容。 
   1.税款在时间维度上的变化情况,包括各种在各维的动态变化情况。 
   2.税款在行业、注册类型、主管税务机构等多个维度上的分布。 
   3.纳税人和税款之间的相关分析,对重点税源户税款的分布、比重、结构进行分析。 
   4.税款与申报行为的相关分析,研究申报对税款的影响。 
   5.税款与征收成本的相关分析,研究税收成本对税款的影响。 
   6.税款与稽查案件处理的相关分析,研究稽查对税款的影响。 
   7.税款总量的预测分析及收入预警。 
   8.税款和社会经济指标、产业结构的相关分析,为地方政府决策服务。 
   9.与国税征收税款的对比分析,发现偷漏税线索及相关信息。 
   (三)税务数据仓库的概念模型 
   税务数据仓库系统的概念模型设计是对税收征收、管理、稽查、评估等业务的理解。根据税务部门业务分析可知,税务部门的领导者主要关注的分析主题有纳税人管理、税款征收、稽查案件、发票管理、执法考核等。按照“全局规划、增量实施”的原则,分主题对税务数据仓库进行设计,下面以税务局比较关注的纳税人主题进行介绍。 
   纳税人主题分析: 
   1.纳税人数量在行业、注册类型、主管税务机关等多个维度的分布以及多维组合的分布,用于分析纳税人在某一时点的静态分布情况; 
   2.纳税人数量在时间维度上的变化情况,包括各维度上的动态变化情况,总结纳税人变化规律; 
   3.纳税人和税款之间的相关分析,对重点税源的纳税人实现动态管理; 
   4.纳税人和税务机关之间的相关分析,对比各单位的征管能力、管理区域分析; 
   5.根据纳税人变化的历史情况预测未来纳税人结构状况(结合当地经济状况); 
   6.对纳税人状态变化的跟踪分析,查找专管员管理过程中的薄弱环节; 
   7.和外部信息(如银行、国税等)对比分析系统管户的薄弱环节; 
   8.纳税人结构和地方经济产业结构的相关分析,为地方政府决策服务; 
   (四)税务数据仓库的逻辑模型 
   每个数据仓库都包括一个或多个事实数据表。星型架构的中心是一个事实数据表,用以捕获衡量单位业务运作的数据。事实数据表中包含的数据随着时间的推移会变得十分庞大,是数据分析的中心。 
   维度表与事实数据表相比是一个小得多的实体,它包含描述事实数据表中的事实记录的特性。有些特性提供描述性信息,有些特性则用于指定如何汇总事实数据表数据以便为分析者提供有用的信息。维度表包含帮助汇总数据的特性的层次结构。 
   (五)税务数据仓库的物理模型 
   数据仓库的物理模型是逻辑模型在数据仓库中的实现模式。该阶段的主要任务是确定数据的存储结构、存储策略、数据存放位置、存储分配。在使用数据库管理系统构建数据仓库时,必须全面了解所选用的数据库管理系统,特别是存储结构和存取方法,了解数据环境、数据的使用频度、使用方式、数据规模以及响应时间要求等。这些是对时间和空间效率进行平衡和优化的重要依据,了解外部存储设备的特性,例如分块原则、块大小的规定、设备的I/O特性。 
   1.确定数据结构的类型 
   数据仓库中的数据类型有:概括数据、细节数据、外部数据、多维数据、数据子集、复制数据和存档数据。为此,需要确定符合设计目标的数据结构类型。 
   2.确定数据的存储结构 
   在选择合适的存储结构时应权衡:存取时间、存储空间利用率和维护成本。 
   3.数据仓库索引的创建 
   主题数据仓库中的数据存储量较大,但更新频率较低,一般采用定期导入新数据的方法。为了有效地提高数据仓库的运行效率,可在对常见查询请求所访问的数据进行分析的基础上,设计建立比较复杂的索引策略。 
   4.确定数据的存放位置 
   数据仓库的内容是按主题组织存放的,可根据各主题的重要程度、数据访问频率、数据大小等特点进行分类,将不同类的数据存储在不同的存储设备中。重要的、经常存取并对响应时间要求高的数据存放在高速存储设备上,存储频率低或对响应时间要求低的数据则可以存放在低速存储设备上。 
   三、结论与展望 
   本文在税收业务和现有税务管理信息系统的基础上,探讨在税务部门建设税务数据仓库的方法和步骤,设计了税务数据仓库的数据模型和体系结构。基于数据仓库,实现辅助税务行业决策支持的构想, 将数据仓库技术、联机分析处理、数据挖掘技术引入系统,对于我国税务事业的发展具有重要的意义。 
 
 
更多>同类新闻资讯
0相关评论

推荐图文
推荐新闻资讯
点击排行
友情链接
浙江省人社网
浙江省咨询委员会
浙江省财政厅
浙江省商务厅
浙江省安监局
浙江省卫计委
浙江省府办公厅
浙江省政务公开
浙江省人民政府
宁波市人民政府
浙江政务服务网
宁波人社网
浙江省继续教育网
浙江省公务员局
浙江省医保中心
浙江就业
浙江海外人才网
浙江劳动人事仲裁网
Copyright © 2016-2020 浙江普来久网络科技有限公司
Powered by xiaofuline
经营许可证:浙ICP备16029741号-1
浙公网安备:33010502003879号
微信公众号
小服在线
微信客服:153-8231-2506
地址:浙江省宁波梅山保税港区成海路商务中心1808号