數據品質保證？老司機的資料庫恐怖故事

一個中年工程師的血淚史：為什麼我們的數據這麼準確，其實背後有很多不為人知的故事和無數個深夜的掙扎

阿

阿哈大叔

作者

約 2 分鐘

284 字

2025年8月21日

發布日期

數據品質保證？老司機的資料庫恐怖故事

各位朋友，阿哈大叔又來分享工程師的血淚史了。今天要聊的是數據品質保證，也就是為什麼我們系統的數據這麼準確，以及... 嗯... 為什麼我的頭髮越來越少。

序章：那個讓我心臟病差點發作的夜晚

還記得 2022 年的某個深夜，我正在家裡沙發上追劇，老婆已經睡了，孩子也安靜了，一切都那麼美好。

突然，手機響了。是用戶打來的：「大叔，你們系統台積電的股價怎麼顯示負數？」

我整個人從沙發上彈起來，差點把泡麵打翻。負數？台積電什麼時候變成要給人錢才能買的股票了？

那一夜，我在電腦前坐到天亮，找出了問題：某個第三方數據源的 API 回傳格式改變了，我們的解析程式把百分比當成了股價。

從那天開始，我對數據品質的要求變成了強迫症等級。

數據品質的五大惡魔

經過這些年的折磨... 不對，是磨練，我總結出了數據品質的五大惡魔：

1. 格式惡魔：當數字變成文字

最常見的問題就是數據格式不一致。你以為收到的是數字，結果是字串；你以為是字串，結果是 null。

真實慘案：

// 你以為的數據
price: 123.45

// 實際收到的數據  
price: "$123.45"
price: "123,45"  // 歐洲格式
price: "一二三點四五" // 這個是日本朋友的傑作

我們現在有個專門的數據清理工具，光是處理價格格式就有 27 種不同的規則。

2. 時間惡魔：時區的詛咒

時間處理是工程師的宿敵。不同地區的股市有不同的交易時間，不同的時區，還有夏令時間的鬼東西。

血淚教訓：有一次我們把美國股市的開盤時間搞錯了，結果系統在台灣時間凌晨 3 點發送「美股即將開盤」的通知。

半夜被吵醒的用戶們在群組裡罵翻天，我連續三天不敢看 Telegram。

3. 重複惡魔：一支股票變三支

數據重複也是個大問題。同一支股票可能有不同的代碼、不同的名稱，甚至在不同交易所有不同的表示方式。

實際例子：

台積電：2330.TW, TSM, TSMC, 台灣積體電路
每個都指向同一家公司，但在系統裡可能被當成四支不同的股票

4. 缺失惡魔：數據的黑洞

最讓人頭痛的是數據缺失。股市休市、系統維護、網路問題，都可能造成數據空洞。

用戶不會管你什麼原因，他們只知道：「為什麼昨天的股價沒有？」

5. 延遲惡魔：慢半拍的悲劇

數據延遲在股市是致命的。差個幾分鐘，投資決策就完全不同了。

我們設定了嚴格的延遲監控，超過 5 分鐘沒更新數據，系統就會發警報。半夜被電話吵醒已經是家常便飯。

我們的數據品質防線

第一道防線：多重數據源

我們不會只依賴一個數據源。台股數據來自三個不同的 API，美股數據來自兩個源頭。

就像不會把雞蛋放在同一個籃子裡一樣，數據也要分散風險。

第二道防線：即時驗證

每筆進來的數據都要經過驗證：

價格是否在合理範圍內？
交易量是否異常？
時間戳記是否正確？

驗證規則例子：

// 股價不能是負數（除非是奇怪的金融商品）
if (price < 0) throw new Error('股價不能是負數，這不是比特幣');

// 單日漲跌幅超過 50% 要特別檢查
if (Math.abs(changePercent) > 50) {
  await verifyExtremeMovement(symbol, price, changePercent);
}

第三道防線：異常偵測

我們有個 AI 小助手（其實就是一些統計算法啦），專門偵測異常數據。

如果某支股票的價格突然跳到平常的 10 倍，系統會自動標記並暫停更新，直到人工確認。

第四道防線：數據回溯

每天凌晨，系統會自動檢查過去 24 小時的所有數據，看看有沒有遺漏或錯誤。

發現問題會自動修正，並發送報告給我們。雖然經常是凌晨 4 點收到「數據異常修正報告」，但至少知道系統有在運作。

品質監控儀表板：我的血壓監測器

我們建了一個數據品質監控儀表板，24/7 監控著所有指標：

即時指標

數據新鮮度：最後更新時間
完整性檢查：缺失數據比例
準確性驗證：與基準數據的差異
一致性檢查：不同源頭數據的一致性

歷史趨勢

每日數據品質評分
異常事件時間線
修復時間統計

每天早上第一件事就是看這個儀表板，就像量血壓一樣。綠燈就安心吃早餐，紅燈就準備加班到深夜。

數據清理的那些鳥事

自動清理 vs 人工處理

80% 的數據問題我們已經能自動處理了，但剩下的 20% 還是需要人工介入。

自動處理的例子：

移除價格中的貨幣符號
統一時間格式
處理重複記錄

需要人工處理的情況：

公司名稱變更
股票代碼調整
特殊企業行為（分股、合股等）

週末的「數據大掃除」

每個週末，我們會進行一次深度數據清理：

檢查過去一週的所有異常
修正發現的問題
優化清理規則
準備下週的監控

我老婆常常抱怨：「別人家老公週末都在陪家人，你在陪數據庫。」

沒辦法，數據不會自己變乾淨啊！

用戶回饋：最真實的品質檢驗

那些讓我汗顏的發現

有時候用戶會發現我們沒注意到的問題：

用戶訊息：「大叔，0050 的股息資料好像有問題，我算了一下殖利率不對。」

結果發現是我們把除息日搞錯了。用戶比我們還認真，真的是又感謝又慚愧。

Bug Bounty：用戶當品管

我們現在有個非正式的「找碴獎勵」：用戶發現數據錯誤並回報，我們會送小禮品表示感謝。

沒想到這個機制意外地有效，我們的數據品質因此提升了不少。

技術債的還債之路

歷史包袱

早期系統設計時，我們對數據品質的要求沒這麼嚴格（主要是當時太年輕太天真）。

現在要一邊維持系統運作，一邊慢慢修正這些問題，就像一邊開車一邊換輪胎。

重構 vs 重寫

我們選擇了漸進式重構，而不是推倒重來：

新功能使用新的品質標準
舊模組逐步改善
關鍵路徑優先處理

這樣做雖然慢，但比較安全。畢竟，用戶不會因為你在重構就原諒系統故障。

成本與效益的掙扎

完美主義的代價

數據品質是個無底洞，你永遠可以做得更好，但成本也會無限上升。

我們學會了在「夠好」和「完美」之間找平衡：

核心功能的數據要 99.9% 準確
輔助資訊可以容忍一些小錯誤
即時性和準確性之間的取捨

ROI 的計算

提升數據品質的投資回報怎麼算？

減少客服投訴時間
提高用戶滿意度
避免商業風險
工程師的心理健康（這個很重要！）

給新手工程師的建議

數據品質的三個層次

數據正確性：數據本身沒有錯誤
數據完整性：該有的數據都有，不該有的都沒有
數據及時性：在需要的時候能取得最新數據

建立品質文化

不要把數據品質當成某個人的責任，而是整個團隊的共同目標：

Code Review 要檢查數據處理邏輯
測試用例要包含邊界情況
監控要設定合理的閾值

自動化是王道

能自動化的就不要手工：

自動化測試
自動化驗證
自動化修復（小心使用）
自動化告警

結語：品質是一場永無止境的戰爭

做了這麼多年，我深深體會到：數據品質不是一個終點，而是一個持續改善的過程。

你永遠不可能做到 100% 完美，但你可以讓系統一天比一天更可靠。

重要的是：

承認問題存在 - 不要掩飾或逃避
建立監控機制 - 及早發現問題
快速響應 - 問題發生後盡快處理
從錯誤中學習 - 避免同樣錯誤再次發生

最後，還是要提醒大家：投資有風險，數據也可能有錯誤。不要把任何一個數據源當成絕對真理，多方驗證永遠是對的。

數據品質的路還很長，我們一起努力，讓每個數字都更值得信賴。

阿哈大叔的數據品質血淚史到此告一段落。如果你也是工程師，歡迎在 Telegram 群組裡分享你的數據災難故事，我們一起療癒彼此的心靈創傷！記住，好的數據品質不是意外，是無數個深夜和咖啡換來的！