时间:2022-11-23 16:30:01 | 来源:信息时代
时间:2022-11-23 16:30:01 来源:信息时代
税务信息系统数据库 : 税务信息系统中数据、数据管理和处理的数据库应用系统。
1. 系统对数据处理和管理的要求
(1)需要超大型数据库,支持超大规模数据量。税务信息系统的税收业务、外部信息交换和决策支持三大系统主要涉及纳税人信息,其交易量和数据量与纳税人数量增长而增长; 税务行政管理系统以税务机关和税务人员为使用对象,其交易量和数据量与税务人员数量有关。以所得税为主要税种的美国到21世纪初个人所得税纳税人就有2亿多;联邦税务局IRS职员有10多万。在中国同一时期,纳税企业超过3500万户,纳税个人超过3亿; 国家税务局和地方税务局的税务干部超过百万。处理的高度集中与机构的扁平化是当代税务系统的一个发展趋势,要求数据的高度集中,数据处理中心数量大幅度减少,处理的业务类型和范围不断扩大。美国的数据处理中心90年代从10个减少到2~3个;中国的数据处理中心从市级上升到省局和总局。要求超大型数据库支持TB以上级别,甚至PB(Petabyte)以上级别的数据规模。
(2)高效访问、高可用性、容错及容灾。在税务信息系统的数据库中出现超过500万行以上数据表,要求提高其访问效率。为纳税人服务及其他网上业务的开展要求数据库保持高度稳定,不能出现死锁,最小化宕机时间和7(天)×24(小时)的支持能力。要求快速有效的数据备份和恢复能力,联机备份能力,自动错误恢复和容错能力。
(3) 网上客户自助服务的业务处理方式大大增加了并发处理的用户数,能处理数万甚至数十万并发用户数的请求。随着社会与技术的进步这种需求在快速发展。
(4)复杂而庞大的系统,对数据库的性能和数据质量保障有更迫切的要求。
2.数据库的性能保证
(1)数据库性能设计:根据税务信息系统对数据处理和管理的特定要求,在数据库性能设计上采取如下措施,预先发现影响数据库性能的业务模式;及早建立性能测试模型; 建立单独的性能测试数据库; 采用大规模数据库设计原则。大规模数据库设计原则包括: ①大量用户的并发数据处理和业务数据的高可用性; ②数据库服务器高稳定、无死锁;③数据库服务器多线程技术(MTS);④数据库服务器应用集群技术RAC(并行数据库服务器); ⑤超大规模数据量选用超大规模数据库(PB数量级以上); ⑥只读表空间提高查询速度;⑦优化数据表结构设计;⑧大数据表采用分区技术(partition); ⑨建立合适的索引,优化SQL语句,提高查询效率; ⑩优化联机日志文件和回滚段的设计。
(2)数据库的监控与维护:包括:①选择开发数据库,测试数据库,生产数据库之间的同步管理工具,对数据库对象进行版本管理; ②必须有一个完整的数据库监控和管理架构在使用中对数据库对象进行监测,能够定义各种数据库内部事件的临界点,在事件到达或超过临界点时进行报警或执行某种任务,这些监测包括关键性监测、日常例行监测与实时性能监测; ③对数据库使用容量趋势分析来预测将来的资源需求。将以上的监测和其他各种事件和对象的监测结果自动记录到历史数据库,并按照时间绘出曲线。
3. 数据质量保障
(1)元数据及其管理:元数据的生成与运用贯穿于税务信息系统的规划、设计、实现、运行的全过程,元数据是税务系统信息化的核心资源,元数据的管理是数据质量保障的关键。税务元数据划分为两种,应用元数据和平台元数据。平台元数据也称技术元数据,在税务信息系统有ORACLE平台元数据、OLAP平台元数据、J2EE平台元数据等。税务系统的应用元数据是税务数据质量的指标体系,包括税务业务词汇——税务业务的概念、指标、口径;业务模型、数据模型、系统目标、系统功能模型、数据库的概念模型与逻辑模型、各种代码库等的规范化表示。上述内容表达了税务信息系统数据的来源、标准、清单、结构、数据生成与其变化,及其使用的权限和操作步骤等。应用元数据由系统统一管理,平台元数据分布在相应技术平台管理。元数据的统一管理是税务信息系统实施质量管理的技术基础。
(2)数据质量管理:一是原始文档的数据输入和校验,关键在于减少人工输入数据的工作量; 二是单个系统的数据存储和组织,确保数据存储的正确与完整; 三是多个系统的数据传输和合并,确保数据传输以后的一致性; 四是数据应用与维护,确保查询和分析的结果是可信的。
(3)可采取的8个基本策略:①使用自动的智能化ETL工具或EAI代理以及其他的数据清理工具;②使用批量处理的方式(清理大量的现存数据)和使用持续的实时方式(保证长期的数据质量);③建立全局的数据清理和匹配程序,保证其兼容采用多种方式存储的各种语言: ④使用外部参考信息,通过将客户数据同可以公开获得的姓名和地址数据进行匹配来保证其完整性和一致性; ⑤开发足够灵活的规则,以便灵活地决定可用于匹配的最主要的数据域;⑥建立常见的数据错误和失配处理流程; ⑦将重复的输入集成起来,并根据需要删除过时的数据; ⑧保证在获取后对数据进行标准化,标准化后的数据可以和原始数据一同存放。
(4)建立持续的数据质量改进流程与岗责任体系: 主要的岗位是数据检查岗、数据修改岗和系统管理岗。其流程是: 数据检查岗定期检查数据,确定问题,初步给出错误可能的范围,按照制度提交检查问题清册; 数据修改岗根据问题清册,按照问题的严重程度和优先级别、按照规定操作办法、并且根据业务经验、元数据管理平台与ETL管理平台等判断出问题所在并且给出修改或者重新生成数据的方法; 系统管理岗根据修改岗提出的问题和处理方法,进行合理的操作,对于业务规则或程序算法的问题按照流程提交给开发部门进行确认和修正。所有的操作过程都应可跟踪、有确认,对关键操作需作好备份。