河南地稅數(shù)據(jù)管理系統(tǒng)以“聚合數(shù)據(jù)、統(tǒng)一平臺(tái)、開放服務(wù)、智能應(yīng)用”為目標(biāo),以“一套標(biāo)準(zhǔn)、一個(gè)倉(cāng)庫(kù)、三個(gè)中心”為主要建設(shè)內(nèi)容。建立統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),搭建混合架構(gòu)的數(shù)據(jù)倉(cāng)庫(kù),實(shí)現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)治理、數(shù)據(jù)開放和數(shù)據(jù)應(yīng)用等全生命周期的數(shù)據(jù)管理和應(yīng)用。助力河南地稅實(shí)現(xiàn)數(shù)據(jù)管理、數(shù)據(jù)服務(wù)和數(shù)據(jù)決策。
2015年,為了順利推動(dòng)征管改革實(shí)施,河南地稅提出了數(shù)據(jù)管理、數(shù)據(jù)服務(wù)、數(shù)據(jù)決策的管理理念,為此,提出利用大數(shù)據(jù)技術(shù),解決多方數(shù)據(jù)融合、雜亂數(shù)據(jù)治理、數(shù)據(jù)開放共享、沉睡數(shù)據(jù)喚醒等問題,建設(shè)數(shù)據(jù)管理系統(tǒng),推動(dòng)河南地稅稅收管理和服務(wù)的持續(xù)創(chuàng)新。
浪潮為河南地稅規(guī)劃建設(shè)了全局型的數(shù)據(jù)管理系統(tǒng),該系統(tǒng)以“聚合數(shù)據(jù)、統(tǒng)一平臺(tái)、開放服務(wù)、智能應(yīng)用”為目標(biāo),以“一套標(biāo)準(zhǔn)、一個(gè)倉(cāng)庫(kù)、三個(gè)中心”為主要建設(shè)內(nèi)容。
——一套標(biāo)準(zhǔn)建設(shè)
統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范是數(shù)據(jù)管理工作的基礎(chǔ)和前提,浪潮在執(zhí)行總局標(biāo)準(zhǔn)的基礎(chǔ)上,為河南地稅補(bǔ)充制定了基礎(chǔ)數(shù)據(jù)規(guī)范、數(shù)據(jù)集成規(guī)范、數(shù)據(jù)模型規(guī)范、數(shù)據(jù)服務(wù)規(guī)范以及數(shù)據(jù)治理規(guī)范等5大類25個(gè)標(biāo)準(zhǔn)規(guī)范,夯實(shí)了數(shù)據(jù)管理工作的基礎(chǔ)。
——一個(gè)倉(cāng)庫(kù)建設(shè)
數(shù)據(jù)倉(cāng)庫(kù)采用“Hadoop+MPP+RDB”的分布式數(shù)據(jù)庫(kù)與傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)相結(jié)合的混合架構(gòu),基于 Hadoop實(shí)現(xiàn)海量結(jié)構(gòu)化和非結(jié)構(gòu)化涉稅數(shù)據(jù)的全量存儲(chǔ)和批量離線計(jì)算,基于MPP數(shù)據(jù)庫(kù)實(shí)現(xiàn)海量結(jié)構(gòu)化數(shù)據(jù)的深度加工和復(fù)雜關(guān)聯(lián)查詢,基于傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)實(shí)現(xiàn)數(shù)據(jù)集市高并發(fā)的交互式查詢。
數(shù)據(jù)倉(cāng)庫(kù)在統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范的基礎(chǔ)上,將稅務(wù)部門業(yè)務(wù)系統(tǒng)數(shù)據(jù)、第三方涉稅數(shù)據(jù)、日常管理情報(bào)數(shù)據(jù)、互聯(lián)網(wǎng)涉稅數(shù)據(jù)以及其他來(lái)源的各類結(jié)構(gòu)化和非結(jié)構(gòu)化的涉稅數(shù)據(jù)進(jìn)行整合,形成全局統(tǒng)一的數(shù)據(jù)資產(chǎn),并按照業(yè)務(wù)域?qū)?shù)據(jù)進(jìn)行分主題建模,浪潮特別針對(duì)自然人的稅收管理為河南地稅建設(shè)了自然人主題庫(kù),涵蓋自然人的基礎(chǔ)類、資產(chǎn)類、收入類、支出類、稅務(wù)類、社會(huì)統(tǒng)籌類等六大類信息。
同時(shí),依托MapReduce、Spark分布式計(jì)算引擎、Storm流式計(jì)算引擎以及MLlib機(jī)器學(xué)習(xí)庫(kù)等大數(shù)據(jù)組件,為數(shù)據(jù)倉(cāng)庫(kù)提供強(qiáng)大的數(shù)據(jù)挖掘與分析能力。
——三個(gè)中心建設(shè)
在一個(gè)數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)上,浪潮為河南地稅建設(shè)了數(shù)據(jù)管理系統(tǒng)的三個(gè)中心,即:數(shù)據(jù)治理中心、數(shù)據(jù)開放服務(wù)中心以及數(shù)據(jù)應(yīng)用創(chuàng)新中心。
數(shù)據(jù)治理中心將數(shù)據(jù)治理過(guò)程流程化、可視化和體系化,建設(shè)完成數(shù)據(jù)標(biāo)準(zhǔn)管理、采集管理、加工管理、存儲(chǔ)管理、質(zhì)量管理、應(yīng)用管理、知識(shí)管理、元數(shù)據(jù)管理、安全管理和運(yùn)維監(jiān)控管理等十大功能,固化了數(shù)據(jù)治理的工作流程和崗責(zé)體系,實(shí)現(xiàn)了數(shù)據(jù)全生命周期的管理。
數(shù)據(jù)開放服務(wù)中心,采用微服務(wù)架構(gòu),將數(shù)據(jù)管理系統(tǒng)中的數(shù)據(jù)資源、計(jì)算資源和存儲(chǔ)資源進(jìn)行服務(wù)化封裝,基于用戶認(rèn)證和授權(quán)體系,通過(guò)OpenAPI的方式實(shí)現(xiàn)資源的開放共享,以滿足稅局內(nèi)部、第三方系統(tǒng)的各類數(shù)據(jù)服務(wù)需求。
數(shù)據(jù)應(yīng)用創(chuàng)新中心在開放數(shù)據(jù)服務(wù)的基礎(chǔ)上,構(gòu)建納稅人畫像、基因圖譜、稅務(wù)搜索、查詢統(tǒng)計(jì)、模型評(píng)估等大數(shù)據(jù)創(chuàng)新應(yīng)用,實(shí)現(xiàn)數(shù)據(jù)深層價(jià)值的挖掘。
1、實(shí)現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)加工、數(shù)據(jù)挖掘、數(shù)據(jù)應(yīng)用到數(shù)據(jù)共享的全流程管理。
2、通過(guò)閉環(huán)的數(shù)據(jù)質(zhì)量管理,河南地稅數(shù)據(jù)質(zhì)量穩(wěn)步提升,在總局?jǐn)?shù)據(jù)質(zhì)量治理評(píng)比中,一直名列前茅。
3、通過(guò)數(shù)據(jù)融合挖掘,實(shí)現(xiàn)稅款增收38.9億。