為保障這一機(jī)制的高效運(yùn)轉(zhuǎn),浪潮歷時近三年時間從需求調(diào)研到規(guī)劃設(shè)計,再到落地實(shí)施,為河南地稅規(guī)劃建設(shè)了全局型的數(shù)據(jù)管理系統(tǒng),該系統(tǒng)以“聚合數(shù)據(jù)、統(tǒng)一平臺、開放服務(wù)、智能應(yīng)用”為目標(biāo),以“一套標(biāo)準(zhǔn)、一個倉庫、三個中心”為主要建設(shè)內(nèi)容,充分利用大數(shù)據(jù)技術(shù),解決多方數(shù)據(jù)融合、雜亂數(shù)據(jù)治理、數(shù)據(jù)開放共享、沉睡數(shù)據(jù)喚醒等問題,推動了河南地稅稅收管理和服務(wù)的持續(xù)創(chuàng)新。
隨著云計算、大數(shù)據(jù)、移動互聯(lián)網(wǎng)的飛速發(fā)展,信息化建設(shè)的重心從IT時代的管理與控制為主轉(zhuǎn)變?yōu)镈T時代的服務(wù)與激發(fā)生產(chǎn)力為主。大數(shù)據(jù)開啟了這次重大的時代轉(zhuǎn)型,就像望遠(yuǎn)鏡讓我們能夠感受宇宙,顯微鏡讓我們能夠觀測微生物一樣,大數(shù)據(jù)正在改變我們的生活以及理解世界的方式,成為新發(fā)明和新服務(wù)的源泉。
——一套標(biāo)準(zhǔn)建設(shè)
統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范是數(shù)據(jù)管理工作的基礎(chǔ)和前提,浪潮在執(zhí)行總局標(biāo)準(zhǔn)的基礎(chǔ)上,為河南地稅補(bǔ)充制定了基礎(chǔ)數(shù)據(jù)規(guī)范、數(shù)據(jù)集成規(guī)范、數(shù)據(jù)模型規(guī)范、數(shù)據(jù)服務(wù)規(guī)范以及數(shù)據(jù)治理規(guī)范等5大類25個標(biāo)準(zhǔn)規(guī)范,夯實(shí)了數(shù)據(jù)管理工作的基礎(chǔ)。
——一個倉庫建設(shè)
數(shù)據(jù)倉庫采用“Hadoop+MPP+RDB”的分布式數(shù)據(jù)庫與傳統(tǒng)關(guān)系數(shù)據(jù)庫相結(jié)合的混合架構(gòu),基于 Hadoop實(shí)現(xiàn)海量結(jié)構(gòu)化和非結(jié)構(gòu)化涉稅數(shù)據(jù)的全量存儲和批量離線計算,基于MPP數(shù)據(jù)庫實(shí)現(xiàn)海量結(jié)構(gòu)化數(shù)據(jù)的深度加工和復(fù)雜關(guān)聯(lián)查詢,基于傳統(tǒng)關(guān)系數(shù)據(jù)庫實(shí)現(xiàn)數(shù)據(jù)集市高并發(fā)的交互式查詢。
數(shù)據(jù)倉庫在統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)與規(guī)范的基礎(chǔ)上,將稅務(wù)部門業(yè)務(wù)系統(tǒng)數(shù)據(jù)、第三方涉稅數(shù)據(jù)、日常管理情報數(shù)據(jù)、互聯(lián)網(wǎng)涉稅數(shù)據(jù)以及其他來源的各類結(jié)構(gòu)化和非結(jié)構(gòu)化的涉稅數(shù)據(jù)進(jìn)行整合,形成全局統(tǒng)一的數(shù)據(jù)資產(chǎn),并按照業(yè)務(wù)域?qū)?shù)據(jù)進(jìn)行分主題建模,浪潮特別針對自然人的稅收管理為河南地稅建設(shè)了自然人主題庫,涵蓋自然人的基礎(chǔ)類、資產(chǎn)類、收入類、支出類、稅務(wù)類、社會統(tǒng)籌類等六大類信息。
同時,依托MapReduce、Spark分布式計算引擎、Storm流式計算引擎以及MLlib機(jī)器學(xué)習(xí)庫等大數(shù)據(jù)組件,為數(shù)據(jù)倉庫提供強(qiáng)大的數(shù)據(jù)挖掘與分析能力。
——三個中心建設(shè)
在一個數(shù)據(jù)倉庫的基礎(chǔ)上,浪潮為河南地稅建設(shè)了數(shù)據(jù)管理系統(tǒng)的三個中心,即:數(shù)據(jù)治理中心、數(shù)據(jù)開放服務(wù)中心以及數(shù)據(jù)應(yīng)用創(chuàng)新中心。
數(shù)據(jù)治理中心將數(shù)據(jù)治理過程流程化、可視化和體系化,建設(shè)完成數(shù)據(jù)標(biāo)準(zhǔn)管理、采集管理、加工管理、存儲管理、質(zhì)量管理、應(yīng)用管理、知識管理、元數(shù)據(jù)管理、安全管理和運(yùn)維監(jiān)控管理等十大功能,固化了數(shù)據(jù)治理的工作流程和崗責(zé)體系,實(shí)現(xiàn)了數(shù)據(jù)全生命周期的管理。
數(shù)據(jù)開放服務(wù)中心,采用微服務(wù)架構(gòu),將數(shù)據(jù)管理系統(tǒng)中的數(shù)據(jù)資源、計算資源和存儲資源進(jìn)行服務(wù)化封裝,基于用戶認(rèn)證和授權(quán)體系,通過OpenAPI的方式實(shí)現(xiàn)資源的開放共享,以滿足稅局內(nèi)部、第三方系統(tǒng)的各類數(shù)據(jù)服務(wù)需求。
數(shù)據(jù)應(yīng)用創(chuàng)新中心在開放數(shù)據(jù)服務(wù)的基礎(chǔ)上,構(gòu)建納稅人畫像、基因圖譜、稅務(wù)搜索、查詢統(tǒng)計、模型評估等大數(shù)據(jù)創(chuàng)新應(yīng)用,實(shí)現(xiàn)數(shù)據(jù)深層價值的挖掘。
浪潮在河南地稅數(shù)據(jù)管理系統(tǒng)建設(shè)過程中,依托移動互聯(lián)技術(shù),將數(shù)據(jù)管理工作逐步向移動智能終端延伸,拓展了數(shù)據(jù)管理工作的時間和空間。