巴西税务局:整合功能模块 加强大数据的分析应用
2024年03月12日版次:06
近年来,巴西联邦税务局依托多年来数据建设成果,开发了RECEITA DATA系统,归集了不同阶段开发的不同功能模块,实现了数据的收集、存储、流转、分析,发掘出大数据潜在价值。
大数据系统不是一蹴而就
据了解,RECEITA DATA系统的发展可分为四个阶段。在第一阶段,为提升征管电子化水平,巴西联邦税务局于2001年建立“数据仓库”,从不同系统广泛收集数据,便于后期检索,为数据分析打下基础。在第二阶段,在前期“数据仓库”建设的基础上,该局于2007年开发“敏捷会计”系统,用以处理、更正会计信息,并便捷抓取、监控数据。如“会计流程图”功能支持用户将数据以图表形式可视化,“动态分析模型”功能支持用户交叉引用多种数据资源完成分析报告。数据来源除会计账目外,还包括发票、工资单、银行对账单、对外贸易单据等。在第三阶段,该局于2007年开发了公共电子记账系统,明确了电子数据具备法律效力,确立了会计账目、电子发票、纳税清单、金融交易等项目的电子化样式。该系统实现数据标准化处理,提高了数据可用度。在第四阶段,该局集合上述建设成果在内的多个子系统,于2018年推出RECEITA DATA系统。该系统目前是数据分析和整合的主要平台,基于“HADOOP”技术的云平台,分布在数百台机器组成的集群中,采用分布式架构,支持增加集群容量,具备大内存、高性能、大容量等特点。
RECEITA DATA系统提供数据存储、运行、检索等功能。在该系统中,各子系统在税收数字化中分工协同,“数据仓库”提供可扩展架构,建设基础设施;公共电子记账系统收集数据资源;“敏捷会计”系统提升数据可视化水平。
该系统用户量较大,为有效管控合规风险,巴西联邦税务局引入数据治理概念,确定数据治理的三个模块,即数据治理政策制定、数据目录和元数据管理、分析项目目录管理等。该系统还确立了数据操作标准、最佳使用案例、分析开发流程、分析团队管理等四个工作流程。同时,根据数据的成熟度不同,该系统
