新_代稅務行業大數據服務平臺支撐數據管稅解決方案_v12(DOC53頁).docx_第1頁
新_代稅務行業大數據服務平臺支撐數據管稅解決方案_v12(DOC53頁).docx_第2頁
新_代稅務行業大數據服務平臺支撐數據管稅解決方案_v12(DOC53頁).docx_第3頁
新_代稅務行業大數據服務平臺支撐數據管稅解決方案_v12(DOC53頁).docx_第4頁
新_代稅務行業大數據服務平臺支撐數據管稅解決方案_v12(DOC53頁).docx_第5頁
已閱讀5頁,還剩48頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

新一代稅務行業大數據服務平臺支撐數據管稅解決方案文檔名稱新一代稅務行業大數據服務平臺支撐數據管稅解決方案作者 郵箱版本V1.0變更記錄2016/7/21 V1.02016/7/24 V1.2目 錄1總體業務需求分析和整體架構概覽31.1新時代的稅務管理要求31.2稅務行業信息化建設現狀51.3大數據服務平臺整體架構概覽62理論指導數據治理之需求和技術分析92.1數據治理綜述92.2定義業務問題,以指導方向112.3獲得管理層支持,以獲得組織和資源保障122.4執行成熟度評估,以了解現狀和確定將來所達目標122.5創建數據治理路線圖142.6建立數據治理組織藍圖152.7創建數據字典/業務術語庫162.8理解業務和數據172.9創建元數據存儲庫182.10定義度量指標202.11主數據治理212.12治理分析222.13管理安全和隱私232.14數據生命周期治理242.15度量結果243理論指導大數據服務平臺建設之需求和技術分析253.1數據對數據管稅的價值253.1.1數據對稅務的價值分析253.1.2稅務數據價值實現分析263.2數據挖掘方法論指導大數據服務平臺建設273.3按業務主題和規則采集、加工數據以打好數據基礎313.3.1數據采集平臺323.3.2數據加工平臺343.4合理利用各種報表工具,實現報表展現服務373.4.1固定報表實現分析383.4.2臨時報表實現分析393.4.3報表展示與可視化分析403.5靈活使用數據,實現多維分析和微創新能力423.5.1多維分析技術設計423.5.2標簽體系設計443.5.3微創新系統設計463.6對內對外更好的數據共享和交換,擴充能力473.6.1打破條線壁壘,實現數據共享483.6.2實現數據流通,打通上下級和稅務與其他部門的數據聯系493.7提供更好的開發模式,加速數據管稅能力的提升49 1 總體業務需求分析和整體架構概覽1.1 新時代的稅務管理要求新一代稅務行業大數據服務平臺的總體目標是實現“數據管稅”。新時代的稅務管理要求是,以稅收風險管理為主線,以現代信息化先進技術為依托,加強業務和技術的融合,優化資源配置和稅源管理體系,優化服務,規范執法,不斷提高稅法遵從度和稅收征收率,形成新一代稅收征管新管理方式:1) 服務優化:稅務管理部門的定位要從企業稅務管理角色向企業稅務服務角色轉變,要利用現代化手段進行稅務管理工作,在減少對企業日常經營的干擾情況下,保證稅務管理工作的有效進行,成為納稅人與國家連接的橋梁;2) 以風險管理為主線:結合先進技術和創新管理手段,降低和防范稅收風險,做到事前重點防控潛在稅收征管風險,事中降低稅收征管風險,事后具備有效手段,查處偷漏稅,營私舞弊等違法行為;3) 數據實現省市縣分級分類管理:將數據情報管理、稅收風險分析、風險應對任務管理、大企業和跨境稅源風險應對等重要管理事項集中調整到省局層面;市、縣稅務機關精簡行政管理職責,主要承擔直接面向納稅人提供納稅服務、實施風險應對的職責;4) 強化稅源專業化管理,探索“兩個轉變”:屬地固定管戶制到非固定管戶制的轉變,以及無差別管理到差別化管理的轉變。在新時代的稅務管理要求下,不能繼續采用原來傳統方式解決問題,要采用新的技術來解決;國家稅務總局局長王軍指出:“大數據時代,誰能掌握好數據、誰能利用好數據,誰就能提高洞察力、占領制高點。”大數據最重要的作用是提供了實現稅務管理由“稅管員管”向“大數據管”轉變的技術基礎。過去,由于受到技術、思維等多方面等的限制,人類在采集和使用數據時為了節約時間,增加準確性,更多采用了隨機采樣法,這個時代被稱為“小數據時代”。小數據時代的特點是:樣本隨機性、數據精確、因果關系論、結果群體化。在大數據時代,數據收集、存儲和分析工具極大提升,這使得“樣本=總體”的全數據模式得以實現,數據處理的總體特點變為:要全體不要抽樣,要效率不要精確,要相關不要因果。這顛覆了千百年來人類的思維慣例,對人類認知和與世界交流的方式提出了全新的挑戰。大數據時代中的稅收管理也應當順應時勢變化,及時轉變思維,提出創新舉措。目前,大數據技術主要應用在電子商務、金融、零售等領域,在實現“通過數據尋找到更多合適的客戶、以及給客戶推薦合適的產品,實現精準營銷,從而給企業帶來更多的收入和利潤”上已取得長足有效的成績; 稅務行業的大數據所需要達到的業務戰略目標與其他行業企業(例如電子商務、金融、零售等)是有比較大的差異,對于稅務來說,大數據所需要達到的目標的第一重點是“根據企業的生產經營活動等各種數據,防止企業通過非法途徑進行偷稅漏稅的風險管控,以及通過相應的數據,防止稅務業務人員內部腐敗的內部風險管控”,通過這個目標來實現數據管稅,以達到國家所需要進行稅務改革的這個戰略目標。用大數據強化稅收分析,對稅收數據的分析應用將成為稅務系統一項常規的重要工作,數據管稅需要達到以下目標:(一)結合風險管理和大數據理念,將大數據稅收征管模式與先進的管理理念相結合,利用大數據技術和現有數據,對稅務工作進行更好的風險管理: 1)結合大數據分析技術,讓納稅評估更為準確:面對企業越來越復雜的經濟業務,數量有限的稅務工作人員無法投入太多的精力去詳細了解每一家企業的生產流程,通過對海量數據開展分析,探尋,發現、理解信息內容及信息與信息之間的關系,結合對企業的規模大小、對生產經營活動成本、利潤和稅負率等指標的分析,對企業財務核算和納稅申報質量作出評判。例如:在對納稅人、對稅源的評估過程中,通過對納稅人或者稅源長期的登記信息、歷史交易記錄、海關進出口信息、水電繳費以及銀行借貸記錄等多種信息與特征測試的數據匯總,來進行信用評級,從而使納稅評估更為準確;例如:比對分析納稅人稅收資質、應納稅(費)種的條件符合性、存在的風險疑點,跟蹤分析后續動態變化,對風險疑點進行評估處理,并依法據實認定、調整或取消納稅人的稅收資質、應納稅(費)種;2)融合第三方涉稅數據,提高稅法遵從度和稅收征收率:結合納稅人登記信息,申報信息、第三方涉稅信息等數據,以大數據技術為基礎,開展分析比對、風險識別、排序推送、風險應對,加強業務內控和遵從風險防范。例如,將從工商、銀行和統計等部門,以及互聯網爬蟲等途徑獲取的外部數據與納稅人申報數據作比對分析,從而更為準確地判斷稅源狀況,進一步通過稅源監控、稅收分析、納稅評估和稅務稽查等質量控制手段,達到堵塞漏洞、糾正偏差和提高稅收質量的目的。例如:在納稅人申報房產、土地明細時,利用房管、土管等部門信息進行比對,推進“以房控稅”、“以地控稅”、 “車船稅聯網征收”等工作;3)嘗試業務系統變革,進一步防范涉稅風險,提高稅收征收率:如將納稅人申報繳稅系統、收入系統、金融管理系統和財產系統等都納入公民誠信系統,通過各個信息的比對,數據的分析,管控納稅人的資金流、信息流、貨物流和生產經營信息,形成以數據質量管理為基礎的風險識別、等級排序、風險應對和績效評價的閉環風險管理體系,進一步防范涉稅風險,提高稅收征收率。4)防控廉政,防范內部違法風險:通過優化流程、節點控制和全程操作數據留痕,實現稅收執法權的透明操作、規范運行,從源頭上防控廉政和執法風險。5)通過納稅人畫像,輔助管理:采集、處理、評價納稅人的信用信息,建立納稅人畫像,建立納稅信用體系,據此實施分類服務、管理,輔助數據情報管理、稅收風險分析、風險應對任務管理、大企業和跨境稅源風險應對,同時還可以實現信用信息的共享。例如:對信用好、無風險的納稅人不打擾,對低風險的納稅人予以提醒,對嚴重失信、高風險的納稅人實施重點監管;例如:對于異地稅務機關評價的納稅高信用等級納稅人,本地稅務機關予以認可,與本地高信用等級納稅人企業享同等待遇;對于有違法記錄的低信用等級納稅人企業,,本地同等監管。6)建立風險特征庫,自動預警防控:通過風險特征庫和風險監控規則建立,預警預防偷漏稅風險;例如:將 “一址多照”、“一照多址”的納稅人列入重點關注對象,設計風險觸發規則,防范其虛開增值稅專用發票、 騙取出口退稅等風險。(二):充分利用廣泛的數據開展稅源分析,用數據說話、用數據改進管理、用數據推動創新,不斷提高運用大數據的技術和分析大數據的能力,解決工作中的新情況和新問題,提高稅收工作的針對性和有效性。例如:實現根據相應企業所需要的稅務管理和稅務服務類型,來進行相應的稅務業務人員任務分配;達到簡單的稅務業務由辦事大廳(例如實體的辦事大廳、電子稅務局)進行支撐,復雜的稅務管理和稅務服務業務有專業的稅務業務人員進行支撐,即實現由數據來給不同的稅務業務人員分配相應的、合適合理的任務。(三)加強宏觀、行業和微觀稅負數據分析,加強稅收政策、經濟和稅收關系分析,進一步發現稅收與經濟之間的關系,從而更好地預測稅收走勢,科學估算收入規模,增強組織收入工作的預見性。1.2 稅務行業信息化建設現狀稅務行業的信息化建設(金稅工程)已經有近二十年的歷史,因為技術發展的現實問題,同時由于稅務組織機構職能、業務管理、規范、流程等的復雜性(其復雜性遠遠超過電子商務,甚至超過金融領域在信貸、風險、杠桿等三大核心要素所需要組織機構職能、業務管理、規范、流程等),稅務信息化系統不可避免的存在較為嚴重的零碎化、數據孤島、應用煙囪等現象,特別是建立在全國稅收征管規范基礎之上的核心征管系統以及其他各種生產業務系統, 存在如下圖所示例的一系列問題:稅務系統信息化建設中,最為突出和典型的問題包括以下三個方面:1) 數據雜亂:隨著經濟和技術的發展,出現越來越多的系統和數據。包括新建業務系統產生的數據、隨著云計算和數據中心建設出現在稅務系統中的外部交換數據、傳統系統歷史積累的數據等等。這些系統由于種種歷史建設原因,存在采用的信息化建設規范不統一、數據格式不一致、數據表達不連貫等種種問題。這些問題導致每個業務系統在建設過程中,不信任已有的其他系統的數據分析結果,而選擇從生產庫直接獲取原始數據進行分析和加工。這導致了大量的業務系統在建設過程中“干重復活”、“走重復路”、“做重復事”。嚴重影響地稅工作效率。2) 系統各自為政:在江蘇省地稅信息化建設過程中,各業務系統由不同的承建單位進行建設,缺乏統籌規劃,系統之間的打通困難,數據缺乏交互碰撞。“煙囪式”系統仍然普遍存在。業務人員面對多樣的系統,需要從不同的業務系統中找到描述一個業務情形的不同闡述角度的數據,以全面、客觀地分析業務問題。這極大地影響了業務人員的工作效率。3) 關聯復雜:地稅行業涉及數據眾多,各地市具體情況又不完全相同,各地市依賴于省廳提供標準數據和業務模型,但在處理本地業務時會加入地方性特征的數據并對模型進行修正。這造成大量的相似但是有區別的數據,使得開發人員在進行數據開發時陷入判斷相似數據準確性的困惑中,影響數據的可運維性和二次開發。1.3 大數據服務平臺整體架構概覽在當前信息化現狀的基礎上,要達到數據管稅的戰略目標,需要建立以數據為核心,以大數據技術為支撐的精確管理體系;基于稅務組織機構職能、業務管理、規范、流程等的復雜性,我們必須要通過進行前瞻性的研究,形成相應符合稅務行業所需要的數據治理、數據分析挖掘所需要的方法論體系,從而形成符合稅務行業所需要的大數據平臺,從而讓稅務行業沉睡的數據蘇醒過來、發揮價值、產生效益。因此,對新一代稅務行業大數據服務平臺,整體架構概覽如下圖所示:一、”數據管稅“業務應用體系(大數據應用體系) 稅務人員工作流程和效率優化:稅務改革以前是一個人管N多企業所有的事情,稅務改革之初很多人不知道干什么事情,所以需要通過大數據應用來給合適的人安排合適的事情 發票分析:發票數據的應用分 析,通過分析發票的數據信息,準確 查找發票管理存在的問題風險,有針對性的制定征管應對措施,準確打擊 發票使用中的不法行為,切實促進發 票管理的遵從,實現以票管稅、信息 管稅的目標 納稅人信用評估:在稅務大數據服務平臺提供的數據以及在數據衍生出來的法人畫像、自然人畫像等能力的基礎之上,評價納稅人的信用信息,得出納稅信用評價結果,據此實施分類服務和管理。并且與地方政府及相關單位征信平臺 對接,實現納稅人信用信息在各部門間的共享利用 納稅人服務流程優化:稅務改革以前是一個人管N多企業所有的事情,企業沒得選;但是現在針對一個納稅人服務有很多環節,不同環節對應的是不同稅務工作人員;所以我們需要根據數據來給企業在不同環節中提供合適的、專業的稅務人員提供服務,從而讓企業滿意讓國家滿意 納稅人風險管控:通過相應的納稅人畫像以及相應的其他數據,來防止企業通過非法手段進行偷稅漏稅等,并且可以起到警示作用 稅務人員操作性風險管控:通過相應的數據能夠抓出內部的腐敗份子給國家所帶來的損失和傷害,并且可以起到警示作用 收入和稅源分析:通過相應的數據分析能力,從而讓國家的稅收任務更好的完成并且對企業不會產生更大的干擾。 其他:泛指各類沒有說明的稅務大數據分析應用。二、稅務大數據服務平臺 稅務大數據服務平臺不是一個技術平臺、更不是一個只具有一個技術功能點集合的平臺,此平臺是一個大數據應用支撐平臺,即需要加速稅務數據管稅所需要的各個大數據應用能力的開發效率、開發質量的平臺,也是一個能夠沉淀出稅務行業所需要的各個大數據業務應用所需要的各個能力資產以形成能力中心的平臺。2 理論指導數據治理之需求和技術分析2.1 數據治理綜述隨著稅務信息化建設的深入和大數據技術的不斷進步,我們需要讓沉睡在各個業務系統中數據發揮出更多的價值、讓數據說話以實現數據管稅;并且我們已經深刻地認識到我們的稅務數據我們稅務關鍵的資產之一,就類似于對于企業中的最關鍵資產是人力、資金、物資(工廠、設備)等一樣。將數據視為戰略性稅務資產,意味著我們的組織需要建立其現有數據的清單,就像建立物理資產的清單一樣。而數據治理是以企業資產的形式對數據進行優化、保護和利用。數據是稅務最大的價值來源也可能會是最大的風險來源。糟糕的數據治理常常意味著糟糕的業務決策和提供給違規(內部稅務工作人員的違規,外部企業逃稅的違規)更大的暴露面,我們必然需要通過良好的數據治理來提高數據質量(例如提高數據的可信度、完整度、可用度等),從而提供較好的業務決策和減少、控制違規等。數據治理注定會是一項復雜的工作,涉及到對組織內的人員、流程、技術和策略的編排,從一開始,數據治理就在協調不同的、孤立的且常常沖突的策略(可能導致數據異常)的過程中扮演著重要角色。在這么多年的信息化建設中,我們發現數據質量問題主要受“業務、管理、技術”這三個方面的影響,并且主要由以下幾大影響因素所決定: 缺乏科學、規范、完整的數據質量標準,并且在系統開發和實施過程中忽視數據質量:對于這方面的問題,我們必須建立全局數據模型(包括數據源視圖和數據流視圖)、統一的數據標準和數據口徑,從而供各個應用開發團隊在工作中遵循和參考、且讓各個應用開發團隊對稅務信息系統有一個整體認識,以減少數據源調用錯誤和建立重復數據源的情況發生,影響數據的一致性。如下圖所示例:企業數據模型到某應用級的數據模型 缺乏統一和全面的納稅人數據 數據多頭重復采集、沒有統一規范檢驗 缺乏系統的數據質量管理機制以及監控管理工具和手段:在這方面,除了技術原因外,很多是業務、管理方面的問題,所以我們在業務、管理方面制定相應的流程,即需要采用較為成熟的閉環的數據質量管理方法以及相應配套的數據治理軟件平臺,對數據的質量進行持續的監控和管理,及時地清除系統中的垃圾數據,減少隱患的產生。綜上所述,數據治理是大數據服務平臺建設成功的核心基礎和因素,沒有好的數據治理會使我們的大數據成為空談。所以我們需要形成相應的數據治理參考流程來指導我們稅務數據治理的建設,從而給大數據服務平臺的建設打下一個成功的基石。數據治理建議參考流程如下圖所示,并且這個數據治理流程是一個閉環、不斷優化的流程。2.2 定義業務問題,以指導方向 數據治理是我們大數據服務平臺建設是否成功的關鍵因素之一,數據治理失敗的根源是缺乏與業務價值的鏈接,以及通常單純的把數據治理當作是IT部門的事等因素。所以為了保障我們稅務的數據治理能夠比較成功,我們必須保證:數據治理要能支持“數據管稅”這個戰略目標實現業務價值和解決業務問題,并需要制定以下所建議的準則: 1) 數據治理必須由業務部門所需要的業務價值和效益為驅動;2) 數據治理必須由業務部門、信息科技部門、第三方廠商和應用開發商等多方參與;3) 數據治理必須獲得江蘇地稅管理層的支持,任命首席數據治理官;首席數據治理官負責統一管理和協調多方(業務部門、信息科技部門、第三方廠商和應用開發商等)力量進行數據治理工作,以保證支撐“數據管稅”實現的各種業務能力所依賴的數據是“可信、可用、完整”等。4) 數據治理是一個工程項目,需要一個專業的業務人員、專業的技術人員組成的團隊,根據所需要解決的業務問題及從實現相應的業務價值出發,借助對業務的理解分析和對技術的理解分析,并在專業的產品支撐下,例如數據集成平臺(采集、ETL等)、數據治理平臺(元數據管理、主數據管理等等),才能夠做好數據治理的相關工作。5) 數據治理是一個長期計劃,而不是一個短期目標;我們是需要不斷地投入相應地金錢、人力資源才能夠完成以及不斷的演講和優化。2.3 獲得管理層支持,以獲得組織和資源保障 數據治理的最終目的是為了提升數據質量,讓數據變得更加“可信、可用、完整”;只有較高質量的數據才能讓數據說話,以達到稅務管理和稅務改革所需要“數據管稅”這個目標;所以數據治理是牽涉到稅務各個業務部門、信息科技部門、以及各個業務系統的應用開發商和產商的事情。這就使得獲得稅務管理層的支持是一個非常關鍵核心的因素。要保障數據治理工作的順利開展,稅務管理層需要給予以下組織和資源保障:1、成立數據治理工作組 此虛擬組織的成員需要有來自稅務相關業務部門(例如征管和科技發展處、規劃財務處、數據管理處、納稅服務處等)、核心業務應用系統的開發商(例如征管系統的開發商、發票管理系統的開發商、電子稅務局系統的開發商等)、大數據服務平臺的開發商等相關的業務人員和技術人員組成2、獲得相關方高層的支持需要獲得稅務局管理層、相關業務部門的管理層、相關應用開發商和產商的高層支持;特別是稅務局管理層的支持。3、確定數據治理的負責人 設立首席數據治理官,此職務需要在稅務管理層的支持下進行任命;由他來統一管理和協調多方(業務部門、信息科技部門、第三方廠商和應用開發商等)力量進行相應地數據治理,以提高支撐“數據管稅”實現的各種業務能力所依賴的數據是“可信、可用、完整”等2.4 執行成熟度評估,以了解現狀和確定將來所達目標如圖是數據治理成熟度評估模型,按照如圖所示的類別,對當前的稅務數據治理成熟度進行評估,從而得出我們稅務數據質量的當前所處狀態,以及期望通過專業數據治理后需要達到的狀態。這11個數據治理類別可以分成4個相互關聯的組:1、成果: 數據治理計劃的預期結果。 即在數據風險管理和合規,以及價值創建方面需要達到相應的目標,并為“數據管稅”所需要的數據能力提供“可信、可用、完整”的高質量數據支持。2、促成要素:數據治理需要合適的策略、合適的數據照管(即首席數據治理官所帶領的團隊所發揮的作用)、良好的組織結構(數據治理工作組)和認知(數據治理工作組對數據治理要做的事情和所能體現出的業務價值有共同的認知)。3、核心準則:一個能達到相應業務價值的成功數據治理,必然需要實現一個滿足業務要求、技術要求的數據質量管理、數據生命周期管理、數據安全和隱私等方面所需要的軟件產品以及相應的經驗能力。4、支撐準則: 要進行數據治理,我們必須建立一個較為合適、完整、可用的數據架構體系用來指導數據治理和相應的數據應用的設計和開發,并且需要建立相應的分類和元數據以及相應的審計數據日志和報告。我們對上述4個相互關聯的組中的11個數據治理類別,定義相應的能力成熟度模型(參考CMM),即現在的能力成熟度,通過這次的大數據服務平臺的長期數據治理建設后,所需要達到的能力成熟度模型。下圖是我們的一個建議:上圖闡述了當前(2016年)對稅務數據治理在11個類別中所處的狀態,以及經過1年(12個月/18個月)數據治理后所需要達到的狀態;并且在后續不斷的數據治理過程中最終達到第五級。2.5 創建數據治理路線圖數據治理路線圖的開發主要通過以下三方面來進行 1、總結數據治理成熟度評估的結果即在執行成熟度評估,以了解現狀和確定將來所達目標 此章節所做的事情的產出的基礎上,業務部門、信息科技部門、第三方(信息科技技術產商、應用開發商)在首席數據治理官的統籌安排下進行相應的評估,即對當前狀態的評估以及將來想要達到狀態的評估,以及當前狀態與將來想要達到狀態之間的偏差等;通過評估來決定后續的工作。2、列出填補評估中強調的差距所需關鍵人員、流程和技術計劃 這個環節非常關鍵,為了說明這個,我們通過下面的例子說明。3 基于關鍵計劃的優先級創建路線圖基于上面所示的內容制定一個時間周期為12-18個月的數據治理計劃路線圖,并在過程中對相應的數據治理效果和相應的能力進行監控。l 一般來說必須先進行數據治理工作組的成立,以及相關人員的進入,然后任命首席數據治理官。l 建立數據治理領域所需要牽涉到”原則、策略、規程、業務規則和度量指標“等完整的工作流程。l 確定數據治理所需要的研發團隊、服務團隊的人員、技能、工作內容、開發和實現計劃等完整的工作流程。l 選取相應的業務案例來驗證數據治理的合理性以及定義關鍵度量指標來監控數據治理計劃的執行。l 實現數據治理平臺和數據集成平臺,并利用機器學習和可視化能力來提升數據治理平臺和數據集成平臺的能力和質量、效率等。2.6 建立數據治理組織藍圖建立數據治理組織藍圖主要由以下幾大部分組成1、定義數據治理章程數據治理章程類似于企業的公司條例。該章程闡明數據治理的主要目標、及其關鍵利益相關者(例如各個業務部門、稅務管理層等)。2、定義數據治理的組織結構,并建立數據治理委員會、數據治理工作組、數據治理開發和服務組數據治理的最優組織結構是一種 3 層結構。數據治理委員會,位于組織的頂點,包含高層利益相關者。下面的一層是數據治理工作組,由負責定期治理數據的成員組成。最后,數據治理開發和服務組負責每天實際處理數據。 3、舉行數據治理委員會和工作組定期會議 數據治理委員會舉行會議來設置數據治理策略,跟蹤數據治理計劃的所產生的業務價值和效果。該委員會(包括高層領導)定期會面,但不一定是經常會面。典型的會議安排為每月或每季度舉行一次,持續一兩個小時。 2.7 創建數據字典/業務術語庫不同應用開發商或者不同的業務人員都會對相同意思的詞語產生不同的描述詞,例如對于性別的描述,有些應用開發商在系統中定義為”男“、”女“、”未知“,而有些應用開發商在系統中定義為”1“、”0“,”-1“;對于客戶的描述,有些業務人員認為是“企業”,有些業務人員認為是“自然人”;對于納稅人信用等級A的描述,不同業務人員的理解都會是不一樣的等等。所以我們必須進行統一的數據標準和數據口徑,即我們需要建立數據字典,實現業務元數據與業務詞匯的定義相關聯;數據字典(或業務術語庫)是一個存儲庫且是一個系統(包含了相應的批量導入、錄入、修改等能力),包含將業務和 IT 的共同定義集中在一起的關鍵詞匯的定義。稅務必須部署數據字典來確保業務詞匯在上下文內良好定義,從而可以讓我們的數據加工、數據的挖掘和分析、數據的展現變得更加可信、完整、全面、一致,只有這樣才能更好的支撐數據管稅。數據字典的創建牽涉到以下幾個重要的步驟和相應的核心能力:1、選擇一個數據領域。我們必須挑選一個領域,例如針對風險管理所牽涉到的法人、自然人、發票、稅務機構等來進行。2、確定相應人員來維護關鍵業務詞匯我們需要選擇相應的業務人員、技術人員來維護關鍵業務詞匯。3、識別關鍵數據元素這方面的工作我們必須要讓業務專家/業務架構師幫助我們找出關鍵數據元素4、創建、填充和豐富數據字典如果我們已經有了相應部分的詞匯術語表的話,則把這些輸入或者導入到數據字典中。如果沒有的話我們需要進行相應的手工錄入。5、鏈接業務詞匯與技術組件我們就業務詞匯達成一致后,我們需要由相應的以數據架構師為Lead的技術團隊建立相應業務詞匯與技術組件(例如數據庫的某張表和列)。這樣的話業務人員就可以通過業務詞匯來下鉆尋找相應的技術數據源以及數據,因為我們一定要牢記一點就是業務人員只關注業務詞匯,他是不懂什么數據庫的表名和列名的。6、支持數據治理審計、報告和日志需求。 業務術語總是容易變化。今天的“納稅信用等級A”的定義可能在明天又不同。隨著業務需求不斷演化,一個詞匯的可接受定義也會變化。能夠了解更改歷史、更改的內容和執行更改的人,這與更改本身一樣重要。7、 整合數據字典與相關的數據應用和業務應用業務人員在操作一個數據應用或者業務應用的時候,遇到了一個含義模糊的詞匯或短語。他不確定這個詞匯是如何在稅務組織內定義或使用的。所以我們必須使數據字典能夠提供一個非常容易的訪問入口,讓業務人員能夠快速的查找該業務詞匯是如何定義或使用的。2.8 理解業務和數據 對于業務理解,我們需要站在稅務業務的角度,去比較深入的理解全國稅務征管規范所介紹的“稅務登記、認定管理、申報納稅、稅收優惠、稅額確認、稅款追征、稅務檢查、違法處置、爭議處理、憑證管理、信息披露”等業務核心生產環節中所牽涉到的服務對象、所需要輸入的數據、輸出的數據、所要實現的邏輯等等;并且我們還非常需要借助對稅務整體業務現狀和將來稅務改革所帶來的業務變化具有很好理解,且具有前瞻性的稅務專家和稅務業務架構師的幫助。只有通過這些,我們才能對稅務的整體業務流程中的關鍵環節、關鍵問題、關鍵訴求、關鍵數據有一個全局性、前瞻性的理解,并且使我們對于擁有哪些數據,它們位于何處,以及它們在系統之間如何關聯等,會有比較深的理解,并且也能給出需要新增哪些關聯的建議,來幫助建設以“數據為核心”的整個大數據體系對業務發揮出價值和效益,最終達到“數據管稅”這個目標。 對于理解數據,我們需要進行以下的幾個主要步驟和提供相應的能力:1、數據源管理功能即:理解我們所需要的每一個數據源,并且需要對這些數據源都要管理起來,對于每個所需要理解的數據源,我們需要實現以下的幾個能力:1) 執行列和表級別分析:對于表級別分析,需要從數據源中相關表的主外鍵的關系,找出表與表之間的關系(即可以生成ER圖);列級別分析包括有關數據源中每一列的基本統計數據,例如自動生成統計數據,比如隱含的數據類型、模式頻率、值頻率、長度頻率、比例、格式、基數、空計數、最小值、最大值、長度和精度等;2) 識別每個數據源中的關鍵數據元素,關鍵數據元素是建立跨所有數據源構造一個大數據服務平臺的統一數據模式的不錯起點;3) 識別每個數據源中的敏感數據元素,敏感數據元素是我們建設數據安全和隱私的一個不錯起點。2、理解數據源之間的關系理解一個數據在從一個來源傳輸到另一個來源的數據血緣(或者地圖)的聯系非常重要:1) 理解關鍵數據元素在各個數據源之間的數據重疊 :這個是保證數據一致性、可用性非常關鍵的一點;2) 發現數據相應的數據血緣和復雜轉換邏輯;3) 發現數據不一致性和異常。2.9 創建元數據存儲庫元數據是描述數據的數據(Data about Data),可理解為比一般意義的數據范疇更加廣泛的數據,不僅表示數據的類型、名稱、值等信息,還提供了數據的上下文描述信息,比如數據的所屬域、取值范圍、數據間的關系、業務規則,甚至是數據的來源等。元數據可以幫助管理員和開發人員非常方便地找到他們所關心的數據,元數據是描述分析型應用內數據的結構、建立方法及流程的數據。 舉個例子來說明,如果沒有合適的元數據,我們將無法證明,數據分析報告,或數據可視化展示的內容,或數據報表中的特定字段源于一個特定的數據集市,該數據集市又來自企業數據倉庫,最終來自一組后端數據源,以及證明它們之間的所有數據轉換;如果我們不知道業務報表和數據分析報告中看到的信息是如何集中在一起,通常不敢對業務報表和數據分析報告中的結果產生信任;也就是說,如果沒有合適的元數據,我們的數據資產可能無法識別、不受信任以及甚至不適用。而通過元數據這種實現記錄數據轉換的過程的數據,記錄數據來源的數據,讓我們的數據資產可被識別,被信任。所以,我們必須要建立元數據存儲庫以及元數據管理系統,對元數據進行規定和管理。在大數據服務平臺項目中,可將其按用途的不同分為三類:技術元數據(Technical Metadata)、 業務元數據(Business Metadata)和 管理元數據(Management Metadata)。l 技術元數據:技術元數據是描述數據分析中技術領域相關概念、關系和規則的數據,主要包括對數據結構、數據處理方面的特征描述,覆蓋數據分析過程中涉及到的數據源、數據倉庫與數據集市、ETL、OLAP、數據封裝和前端、可視化展現等全部數據處理環節;技術元數據對技術人員進行數據分析型應用的開發能發揮重大的作用;l 業務元數據:業務元數據是描述數據分析中業務領域相關概念、關系和規則的數據,主要包括業務術語、信息分類、指標定義和業務規則等信息;這方面是用來支撐主數據管理,核心應用系統建設的關鍵。業務元數據主要從數據字典中生成。l 管理元數據:管理元數據是描述數據分析中管理領域相關概念、關系和規則的數據,主要包括人員角色、崗位職責和管理流程等信息。元數據管理系統需要根據以下步驟,具備以下相應的能力:1、鏈接業務元數據和技術元數據在元數據管理中,需要實現相應業務元數據(主要從數據字典中生成)管理和技術元數據管理; 業務元數據和技術元數據的分離會讓業務團隊和技術團隊產生巨大的隔閡,所以我們必須要實現業務元數據和技術元數據的鏈接甚至合并。2、實現以元數據驅動的數據地圖數據風險管理需求和合規性需求影響著稅務組織管理它們數據的方式,例如一個稅源分析報告中,我們需要證明數據的來源,它流經何處,以及它在稅務相應的環節中傳輸時經過了何種轉變,這樣才能證明數據是可信的、可用的,也證明這個分析報告也是可信可用的。所以我們要建立一種以元數據驅動的數據地圖來回答“此數據來自何處?”、“此數據去向何處?”和“在此過程中它發生了什么?”等基本問題 。3、實現和執行“影響分析 ”理解對一種數據的更改對其他數據有何影響的能力稱為“影響分析”。數據治理需要確保業務人員、技術人員能夠檢查與一個對象(例如一個納稅人分析報告)相關的所有關系,進而在創建任何更改之前,評估和減輕更改帶來的風險。考慮到在開發生命周期中不可避免地會引入更改,所以“影響分析”的能力將幫助稅務能更有效地治理數據。 4、實現技術元數據之操作性元數據管理在我們實現的大數據服務平臺中,將會存在大量的數據計算任務(如離線計算任務、流計算任務等),來完成相應的數據加工(例如ETL)、數據挖掘(例如機器學習)等,從數據治理角度,我們必須要知道這些數據計算任務在哪個環節失敗、重試次數、某些數據行丟失、何時開始何時結束等等。所以,我們需要通過實現技術元數據的操作性元數據管理來實現管理。2.10 定義度量指標 數據治理的工作主要集中在人員、流程和所采取的技術上,幾者都是無形的。因此,擁有協商一致的度量指標或關鍵績效指標 (KPI) 集對于度量和監控數據治理計劃的進度很重要。定義相應的度量指標主要有以下幾個主要步驟和所需要實現的能力1、理解業務的整體 KPI 理解業務整體KPI至關重要,江蘇地稅整體的KPI以及地稅各個業務部門(例如數據管理處、征管科技處、納稅服務處等)的KPI是不同的;這種KPI的理解和定義是業務強相關的。2、定義數據治理的業務驅動KPI 數據治理的成功體現就是是否能夠符合業務部門所需要的業務價值,所以需要根據江蘇地稅整體的業務目標以及各個業務部門的業務目標來定義數據治理相應的業務驅動KPI。3、定義數據治理的技術KPI數據治理的技術KPI,用于度量數據治理技術工作方面的進度, 例如元數據、歸檔、大數據應用能力中心、安全和隱私、數據審計等。4、實現數據治理成熟度評估的儀表盤 此儀表盤一個數據可視化界面,直觀顯示執行成熟度評估,以了解現狀和確定將來所達目標 所描述的11個數據治理成熟度類別的每一個的實際評分、目標評分和偏差等。通過數據治理成熟度評估的儀表盤,直觀度量和監控數據治理計劃的進度,并能根據實際情況,進行適當的數據治理計劃修正或調整。2.11 主數據治理主數據是在多個稅務系統之間共享的基礎數據,如:法人、自然人、稅務機構、法規等。目前這些基礎數據,每一類數據大多都同時分布在多個應用系統當中,數據由各個應用系統獨自維護和控制,這樣就容易造成了系統之間基礎數據的不完整、不一致,甚至不準確的情況。而且系統之間基礎數據的同步機制也不完善,同步不及時、同步的過程無法監控,出現問題難以發現。由此引發數據不可信,以及數據分析不可信的結果。為此,必須要建立一個統一主數據管理系統,實現: 主數據集中存儲:對分布在各個系統中的基礎數據進行集中存儲; 數據同步機制:建立系統之間基礎數據的同步機制,保證各個系統之間的數據變化能被及時的跟蹤和記錄,保證這些基礎數據在生成、傳遞、變更、存儲、利用過程中的唯一性、完整性、準確性、及時性; 統一管理:通過一個統一的主數據管理平臺,實現數據統一入口、統一校驗、統一存儲、統一分發的主數據管理模式; 提高數據及數據分析準確性和可信性:主數據的準確性可以極大的提高,同時提高相關的業務數據分析的準確性、可信性和一致性。主數據管理系統的主要建設內容應包含: 主數據所依賴的數據字典 主數據模型建設:概念主數據模型建設、邏輯主數據模型建設、物理主數據模型建設。 主數據所依賴的元數據建設:主要是業務元數據的建設、包含部分的系統元數據建設(例如技術元數據建設、管理元數據建設)。 主數據形成建設:在主數據模型和元數據的基礎上,通過相應的數據集成平臺(例如采集和ETL)或相應的人工方式,從各個系統中采集、轉換數據,形成相應的主數據。 主數據服務建設:根據主數據模型所覆蓋的主題域(如法人、自然人、稅務機構、法規等),形成主數據服務,供相應的數據應用或者業務應用使用(使用方式包括直接查詢、主數據同步分發等)。 稅務納稅人主數據所包含的主要內容如下表簡要示例所示:類別數據內容納稅人基本信息納稅人識別號、納稅人名稱、登記注冊類型等納稅人基礎狀態信息納稅人登記狀態、增值稅一般納稅人資格、納稅人信用等級、防偽稅控納稅人資格、出口退稅納稅人資格、是否具有其他資格、定期定額征收、減免優惠標志、稽查案件未結、違法違章未處理等共享代碼 2.12 治理分析 各個業務部門使用了不一致的數據,創建了業務分析報告和各種報表,但是信息科技部門、業務人員、應用開發商并不總是知道來自數據倉庫的數據是如何使用和加工的。所以我們通過大數據應用能力中心 (BigData CC) 來解決這些挑戰。 下述是與治理分析相關的一些任務步驟和一些所需要具備的能力:1、定義大數據應用能力中心的目標 盡管技術(例如大數據技術),總是具有驅動業務轉型(例如驅動稅務改革)的潛力,但純粹從技術能力去驅動的話,將會受到組織內部、應用開發商、業務流程等各種障礙。組織、業務的復雜性、和需要實現的功能的緊急性等,導致了現在在稅務中實施商業智能 (BI)、績效管理和數據倉庫解決方案基本上是煙囪式實現。此情形已導致整個解決方案的管理、交付和履行中的技能零散化和總體不一致性。 所以我們需要站在能夠幫助到業務部門實現業務價值,從而達到數據管稅的目標這個角度去來定義大數據應用能力中心的目標,讓業務部門能夠體會到大數據技術是實實在在地能幫助到他們的,而不是讓業務部門對大數據技術產生一個“空中樓閣”、“忽悠”的印象。大數據應用能力中心需要具備哪些具體的能力,需要由業務部門和信息科技部門以及第三方技術和應用提供商一起討論和確定,通過這些能力的確定,來決定我們到底需要哪些大數據技術以及確定對數據治理所能帶來的價值的一個治理分析。2、準備驗證大數據應用能力中心的業務案例做好數據治理,以打下良好的數據基礎,從而支撐大數據服務平臺和相應大數據應用,是一個長期過程,一般情況下,管理層迫切需要在較短的周期內,就想看到投入大量的金錢能帶來回報,所以我們需要從業務需求角度,梳理出合適的業務案例,通過這些業務案例,分析出具備共性的大數據應用能力中心的相關能力,這些能力能夠被注冊以被共享;從而可以被相應的業務人員進行訂閱使用,這必然將提高業務人員的采用率、滿意率以及業務人員的創新意識。3、確定大數據應用能力中心的組織結構大數據應用能力中心的能力是需要能夠被各個業務部門所共享、不斷演化創新進步的,所以大數據應用能力中心是需要得到各個業務部門領導和與各個業務部門所需要的數據應用的支持的,這樣大數據應用能力中心才能變得越來越強大,也驅動著數據治理的不斷優化、演進。4、協商大數據應用能力中心的關鍵功能 需要各個業務部門、信息科技部門、第三方技術和應用提供商等進行協商和分析,來確定出大數據應用能力中心所需要具備的關鍵功能,以及大數據應用能力中心所需要的咨詢建議、溝通和推廣措施、大數據技術架構、業務和支持能力、對數據治理的調整等等。2.13 管理安全和隱私管理安全和隱私是數據治理中非常重要的環節,它主要包含以下幾個重要的關鍵任務步驟和能力:1、與關鍵利益者協調一致:關鍵利益者主要包括相應的管理層、業務部門相關領導和業務人員、相關的技術團隊(例如數據架構師、安全架構師等等)人員;2、建立稅務數據安全和隱私架構藍圖: 這個藍圖的建立需要業務人員和技術團隊,特別是數據架構師、安全架構師從對業務的理解,以及從數據存儲、處理、流轉等流程的角度去考慮、分析、設計和實現;3、加強數據變更控制:主要是記錄下相應的線索,通過對線索數據的分析,以識別未被授權的數據變更行為活動;4、定義、發現、分類和標記敏感數據;5、加密敏感數據: 要求傳輸中的敏感數據需要被加密,以防止被網絡竊聽;根據業務場景的要求,決定是否需要對敏感數據的存儲進行加密。6、保護非生產環境中的敏感數據:如果在測試、開發、培訓環境中包含了稅務方面的敏感數據的話,這將會帶來一定的數據風險管理和合規性問題,所以我們需要相應的數據脫敏能力,使得在測試、開發、培訓環境中的敏感數據都是經過脫敏處理的;7、防止惡意者對數據的攻擊:例如現在的SQL注入、撞庫等手段都是為了盜取相應的數據,我們需要相應的安全手段去防止惡意者對數據的攻擊。2.14 數據生命周期治理數據生命周期治理指的是一種基于策略的數據架構、分類、收集、使用、存檔、保留和刪除方法,使我們能夠控制和管理數據的壽命,實現數據從產生到銷毀的全過程規范管理。數據生命周期治理的目標主要需要達成以下幾個:1、通過規范數據的生命周期,提高數據的整體管理水平2、優化數據存儲結構,有效控制在線數據規模和降低成本,提高主要和核心業務分析能力的效率3、提高系統資源使用效率,確保系統安全、穩定、高效運行4、做好歷史數據管理,為全生命周期(即企業的完整生命周期的數據全保留等)的數據進行全數據的挖掘提供數據支撐2.15 度量結果 依據預先定義的 KPI 度量指標,參考定義度量指標 章節內容,確保數據治理計劃繼續催生業務價值。這些結果需要定期傳達給數據治理委員會和高層管理人員。相應的度量結果將讓管理層對數據治理計劃的進行持續支持和資金支助,從而讓數據治理不斷的演進和進步,使大數據發揮出更大的業務價值。 3 理論指導大數據服務平臺建設之需求和技術分析3.1 數據對數據管稅的價值3.1.1 數據對稅務的價值分析數據收集、加工工作的目標是整理數據,而發揮出數據管稅的價值,則可以從多個方面體現:1、通過數據分析盡可能多地暴露征管對象在經濟活動中的行為問題,提高稅務執法部門發現風險、響應處理、風險評估、執法控制等諸多方面的能力,從而降低風險(稅務外部風險),同時,通過數據管稅避免業務執行人員主觀意愿干涉稅務工作,避免內部操作性風險(稅務內部風險)2、通過加快數據流轉,匯總分析各個維度數據,全面完善納稅人畫像,提高稅務人員服務能力,滿足不同納稅者不同的需求,更好地為納稅人提供服務為了說明如何通過數據在風險控制過程中發揮作用,以企業稅務風險評估業務為例進行說明企業稅務風險評估是一整套系統工程,一般有如下幾個步驟,這幾個步驟都和數據有十分緊密的聯系,想要提高風險控制的水平,就需要提高對數據管理和使用的要求。1) 獲取和維護風險控制數據風險控制的依據是納稅人在商業行為中紀錄的數據,風險控制管理的第一步就是收集、存儲、整理、關聯和改進相關數據,這些數據的來源包括電子報稅表、紙質報稅表及相關掃描數據、公開年報、納稅機關的檢查數據等。這些數據有的是稅務機關自有,有的需要從第三方機構中獲取。通過數據治理工作,收集、存儲、整理、關聯相關工作大都可以完成,在數據治理完成后,需要不斷持續做維護工作,保證收集的數據被正確處理,才能保證系統長期正確運行。2) 檢測報稅層面風險報稅層面風險評估的目標是系統評估一份具體報稅表內包含由查稅員發現重大錯誤的可能性,當風險較高時,需要指派報稅員進行處理。稅務機關業務人員通常會使用專用風險模型來對報稅表進行評分。這種風險模型是稅務業務人員通過該企業歷史數據中的報稅表和查稅結果進行分析計算得出的,符合企業特點。3) 風險評級根據模型計算出評分后,根據得分對風險進行評級。評級標準和采用的應對行為建議根據每個報稅單的資產規模的不同而區別對待。每個不同級別的資產規模都有相應的風險評估標準。在企業

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論