數據當中蘊含價值。隨著客戶數據規模的持續增長,相關保護工作也變得更具挑戰性,同時越來越多企業開始尋求新型數據治理策略以管理如此龐大同時與企業命脈怎么樣的重要信息。毫無疑問,數據已經成為信息經濟體系中的原始素材,而數據治理也在戰略層面上成為亟待解決的當務之急。
在昨近期麻省理工學院首席數據官論壇的theCUBE研討環節上,SAP公司美國分部全球運營副總裁Tina Rosario表示,數據治理正隨著數據分布化趨勢的不斷增長而獲得愈發重要的地位。“如今的數據不再局限于內部環境或者員工的個人筆記本,”她解釋稱。“時至今日,數據的載體可以是iPad或者其它任何設備類型。其分布式特性如此顯著,因此需要卓越的治理手段加以配合。”
數據治理到底是怎么一回事?
Wikibon公司分析師Jeff Kelly詢問Rosario如何對數據治理概念加以定義,對方的回答是:數據治理可以被劃分為四大主要因素——良好的組織、執行流程、維護以及技術性解決方案。
“第一項重點在于良好的組織,也就是圍繞數據治理開展的實踐活動——包括規則、標準以及政策等等,”Rosario指出。“其次,我們會尋求正確的執行流程以簡化、創建、更新并維護數據。我們還會從持續維護的角度出發對數據中以審視,例如借助理想的執行方式與工具實現數據的自動化維護——因為我們很清楚,數據價值一直處于衰減當中。”
很多朋友可能在接觸SAP的數據治理方案時,第一反應是將其視為勞動力型任務來看待——這非常正常。不過實際情況并非如此,因為Rosario的團隊一直努力避免就數據本身進行過多討論。“我們致力于將其加以拆分,并幫助客戶弄清楚企業需要什么、哪部分信息對于業務運營流程最為關鍵——這才是大家真正關心且能夠理解的部分。”她解釋道。“我們將關注重點放在這些方面,并高度重視相關核心信息,這才是我們需要加以治理的內容。”
Rosario認為,獲得成功的關鍵因素在于從使用者的角度出發考量數據治理方案。她表示,可能沒人會想到數據本身會存在問題,但人們在實際使用時會發現他們所需要的某些信息無法訪問或者發現自己無法完全信任這部分數據結論。“我們努力從這些角度審視數據內容,并考慮自己能通過哪些手段幫助客戶獲得更為高效的業務執行流程,”她指出。“我們該如何更快從數據中獲取分析結論,并保證所交付內容的正確性。”
從另一個角度看,確保數據治理團隊擁有理想的協作關系同樣非常重要,只有這樣其對數據的分析結果才能真正成為推進業務目標的動力。正如她向Jeff Kelly作出的解釋,數據治理團隊的工作之一在于確保企業用戶的數據具備正確的質量與標準水平,這樣分析人士才能對其進行訪問且不必把時間浪費在構建目標關系身上。
“分析人士會對我們提出要求,”Rosario球。“他們會走過來直言‘我們打算運行這套報告機制、我們需要這一級別的數據,你們能幫助確保我們從正確的來源獲取到具備正確質量水平的數據、并能夠切實對其加以訪問嗎?這是我們之間緊密共生關系的一種縮影。”
這種關系同時也是雙向起效的,因為數據治理團隊的一部分工作在于分析數據質量水平,為了完成這項任務他們需要參考來自分析人士的專業意見。“我們彼此之間擁有良好的合作關系,他們為我們提供實現上述目標所必需的工具以及分析機制,”她指出。
云環境帶來的復雜性
通過Rosario的講解,大家可能認為數據治理并不是什么難事,但他們在SAP的實際工作中實際面臨著眾多阻礙。Dave Vellante問到她的團隊在處理任務時遵循怎樣的優先級考量,她表示目前最大的挑戰來自云環境給數據治理帶來的復雜性。
“SAP希望轉型為一家云服務企業,為了實現這一目標、他們需要將一部分云機制引入內部環境,那么我們該如何對云當中的數據進行治理?”她提出了一直困擾著團隊的難題。
最大的難關之一在于SAP數據的分布式特性。該公司以混合型環境為運作基礎,其中一部分數據處于內部環境、一部分處于云環境中,而且目前有越來越多的數據開始以云作為載體。她的團隊在探尋此類條件下的數據治理方案時遇到了一系列挑戰。
“分布式特性正變得愈發顯著,很多人會單純將其視為復雜性的提升、但我卻同時將其作為重要的發展機遇,并希望借此構建起更多治理手段與傳播渠道,”Rosario表示。