Skip to main content

有了資料治理計畫後,就得考慮執行面,實際執行需要投入各類資源以及擬定詳細步驟,並面對不可控的變化因素,在從孫子兵法中,談到了資源管理、時間控制與風險管理,能夠提高大大小小戰役的勝利機會。

在《孫子兵法》的「作戰篇」中,孫子討論了戰爭的成本和時間對結果的影響。他強調「速戰速決」的重要性,並警告長期戰爭會耗費國家的資源,削弱士兵的士氣和戰鬥力。

同樣的道理可以應用到資料治理上,特別是在資源分配和治理策略的效率上。

資料治理與作戰第二

1. 速戰速決:資料治理中的效率與資源管理

孫子指出,長期戰爭會導致軍隊疲憊,資源耗盡,這與資料治理中的「效率」密切相關。資料治理需要有效率的策略來避免長時間的資源浪費。

  • 資料治理的資源分配:治理的計劃必須快速而有效,從小專案出發,可以快速取得成果,進而獲得更多的資源,相較於一開始就定下一個大目標,導致過多的討論與不可預測的結果。
  • 避免資料治理的拖延:長期無效的資料治理會導致資料質量下降、資料利用效率低下,最終損害業務運作。就像戰爭拖延會削弱國力,資料治理的拖延同樣會耗盡企業的數據資產價值。

2. 控制成本:資料治理中的成本控制

孫子強調戰爭中的高昂成本,尤其是後勤供應。在資料治理中,成本管理也非常關鍵:

  • 技術成本:資料治理涉及到存儲、處理和保護資料的基礎設施,這些都會產生大量的成本。企業應該確保治理策略不會導致技術成本的無限增長,而是能在最小化成本的同時達到治理效果。
  • 人力與運營成本:就像孫子說「糧不三載,取用於國」,資料治理也應該能靈活利用現有的資源,而不是不斷增加額外的投入。這意味著治理策略應該充分利用現有的基礎設施和數據團隊,而不是每次新挑戰都需要增加額外的資源,例如混合雲,能將部分工作負載交給地端處理,進而降低雲端成本。

3. 外部資源的利用:借力打力

孫子提倡善用敵方的資源,以減少自己國家的負擔。在 AI 時代更是如此,這可以轉化為:

  • 利用外部技術與資源:企業可以利用現成雲端服務、第三方資料平台或外部技術合作夥伴來支援資料治理,這樣可以減少內部基礎設施與人力成本的壓力。
  • 合作夥伴與知識共享:像孫子提到的「因糧於敵」,企業可以利用合作夥伴的資源來補充自身所需,避免完全只依賴內部,團進團出打群架,在現今時代隨處可見,如 AI 模型版本,可以任意切換,即使你用了 GCP 基礎建設,選擇了 Gemini 進行產品自動貼標,你同時也可以選擇 Claude 作為聊天機器人的模型。

4. 資料治理中的風險控制

孫子警告說,長期作戰會削弱國家的實力,使得其他諸侯國趁機崛起。同樣,在資料治理中,風險控制至關重要:

  • 資料安全與隱私風險:如果長期無法解決資料治理中的安全問題,外部風險(如黑客攻擊或數據洩露)就會不斷增加,最終可能導致重大損失。
  • 數據品質風險:長期忽視數據治理會導致數據品質下降,最終影響企業的決策和運營。

5. 數據治理的靈活性與可持續性

孫子提倡不重複徵召士兵和運送糧食,主張戰爭資源的高效使用。在資料治理中,這可以理解為:

  • 靈活應變:資料治理策略應該靈活,不僅能處理當前的問題,還應該具備隨著業務需求變化而快速調整的能力,若你有一個大目標,可以先透過小專案完成部分架構,不求一次到位。
  • 長期可持續性:資料治理應該具有長期可持續的特性,而不是依賴臨時的或一次性的策略。企業應該建立健全的資料治理策略,固定投入資源,確保長期運作的穩定性和效益。

在真實世界的資料治理作戰

資料管理的範圍很廣,在 DAMA-DMBoK 裡就有 14 個章節,在實際執行則因企業資料治理階段以及企業規模與組織不同以及所面對的問題有所差異,與大大小小的戰役一樣,每一次都要考慮到各個面向;若真要從 DMBoK 14 個章節挑出來的話,以下是我認為最核心的 4 點

  • Data Governance:企業做資料治理的是為了達到特地目,因此必須先整合資源與確定戰略方向。
  • Data Model:資料模型是溝通媒介,在系統內是資料表集,在組織裡則是專案的記憶以及溝通語言,可以說資料模型是一連串資料治理後的產出物。
  • Data Quality:若資料完整、正確與即時到位,你就可以利用資料做出任何資料產品。

我認為除了以上這 3 點,一部分可以用錢解決,像是 Data Architecture,一部分則需要專業人員、應用場景結合與實際落地,像是 AI 與 BI。

最後一點必須單獨拉出來說 — Data Handling Ethics (資料處理倫理)

這最重要,也最難,因為與人的內心有關。

像是,不論資訊安全多嚴格,企業始終內有部分的人,真的有權限可以看到 PII (敏感資料),真要洩露資料的話,即使不透過電子紀錄傳輸,也可以透過腦力硬記下來,而且,並不是去識別化就以為沒事了,當這個人權限夠大,只要把不同資料做結合,就可以得到完整的視野,例如我可以把 member_id 跟 events 裡的 member_id 結合起來,知道誰在什麼時候在哪裡看了什麼。

又例如,金融股市資料,如果真有心,在 streaming pipeline 稍微調整一下,就能夠影響股價。

或者投資項目在報告時調整資料點,只顯現出對專案正向的地方。

甚至是你眼前站了一個資料專業人才,你在考慮要不要錄用他,你如何能夠知道,不論在任何的誘惑下,他都不會外洩企業的資料,或者把做好的資料產品拿出去創業。

結語

資料治理如同戰爭中的每場戰役,需要考慮不同的因素,綜合評估才能成功。從企業的戰略方向,到資料模型的設計,再到資料品質的保證,這些都是資料治理的核心。然而最重要的,莫過於資料處理倫理。無論系統如何安全,最終決定權仍然掌握在人手中。資料治理不僅需要技術和策略,更需要對道德的深刻理解與遵守。

資料治理的戰場上,每一步都至關重要。

如何你有任何關於資料執行面的想法或問題,歡迎與我聯繫。

Damon Liao

嗨,我是大門,我是大朵數位創辦人,我同時擁有網路行銷以及資訊背景,在 2014 年我開始使用 Google Analytics 與 Ads 並且獲得認證證書,在 2015 年我開始使用 Google Tag Manager,在 2017 年我開始使用 BigQuery,每年經手超過千萬預算,規劃商業智慧與行銷自動化應用。