本文來自 微信公眾號“鳳凰牌老熊”。
可以說,對賬是支付系統最頭疼的事情。每一筆交易,都要做到各參與者的記錄能夠吻合,沒有偏差。對賬系統的工作,是發現有差異的記錄,即軋帳;然后通過人工或者自動的方式,解決這些差異,即平帳。
對電商系統來說,每一筆交易,在所有相關主體側都要能對得上:
-
交易主體,如果發起人是個人,必須能夠從個人交易歷史記錄中找到這筆交易。但大部分人不會保留電子記錄,所以一般是提供可以下載的賬單或交易記錄,讓用戶自己對去。
-
交易對手,一般是商戶。商戶側對賬處理同用戶側,也僅僅提供對賬單。
-
交易渠道側,這是對賬的重點,一是核實交易流水,二是核實交易佣金,畢竟是租用人家通道做結算的。
那有哪些記錄需要對賬? 目前主要是兩個:一個是交易記錄;一個是退款記錄。 這里以交易記錄的處理為例,退款記錄可以類似處理。
一、對賬處理流程
一般來說,對賬流程涉及到如下步驟: 渠道對賬單下載、本地交易記錄准備、軋賬、平賬。
1.1 渠道對賬單下載
銀行,第三方支付,銀聯等,基本都會提供對賬單下載的功能。不過也有少數工作做不到位或者太到位的銀行,只提供賬單查詢后台,不提供對賬單下載功能。 對開發人員來說,這里有幾個坑:
-
對賬單格式不一。文本,XML,csv的都有。為了后續能夠統一處理,在賬單下載完成后,需要進行標准化處理。
-
下載方式不一,HTTP,HTTPS,FTP的,都有。下載程序需要按照渠道的協議來處理。
-
下載時間不一,一般是凌晨1點后,到中午12才能用的也有。如果在預定的時間取不到數據,需要注意重試讀取。
-
穩定性差。FTP服務器出問題那是常有的事。渠道側解決方案往往就是重啟。所以重試機制是必要的。
看一下第三方支付的對賬單情況:
渠道 | 對賬周期 | 賬單提供方式 | 賬單文件格式 |
---|---|---|---|
支付寶 | 每天 2:10 | HTTPS | XML |
支付寶退款 | 每天3:10 | HTTPS | XML |
百付寶 | 每天7:00 | FTP | TXT |
百付寶退款 | 每天7:00 | FTP | TXT |
微信支付 | 每天10:30 | HTTPS | TXT |
微信退款 | 每天10:30 | HTTPS | TXT |
銀行直連的對賬情況
銀行 | 對賬形式 | 對賬周期 | 打款周期 |
---|---|---|---|
交行 | 接口/商戶對賬系統 | 日對賬 | 日結(T+1) |
建行 | 接口 | 日對賬 | 日結(T+1) |
工行 | 登錄網銀的方式手動下載 | 日對賬 | 日結(T+1) |
浦發 | 信用卡登錄自助平台獲取對賬文件, 借記卡通過接口形式提供對賬文件 |
日對賬 | 日結(T+1) |
農行 | 銀行定時推送對賬文件 | 日對賬 | 日結(T+0) |
中行 | 銀行定時推送對賬文件 | 日對賬 | 日結(T+1) |
招行 | 銀行定時推送對賬文件 | 日對賬 | 日結(T+1) |
1.2 渠道對賬單標准化
找個例子大家看看, 比如微信的對賬單,他是csv格式的,包括如下信息:
-
交易時間:這是在微信側的支付完成的時間。 這個時間會成為一個陷阱。
-
公眾賬號ID,商戶號,子商戶號,設備號: 這些信息需要做驗證,確保是自己的單子,不要讓微信把老王家的單子也給發過來了;
-
微信訂單號,商戶訂單號: 這兩個是對單的核心。前者是微信側產生的訂單號,在微信支付接口返回值中有。但是萬一收不到這個返回值,那在本地記錄中可能就空了。 后者是我們發送給微信的訂單號,一般用這個來做對單依據。兩邊的數據中都會有這個值。
-
用戶標識,交易類型,交易狀態,付款銀行,貨幣種類,總金額,企業紅包金額: 這幾個就是對單的核心字段,必須確保雙方是一致的。
-
商品名稱,商戶數據包,手續費,費率:這些是可選驗證。
而某寶的對賬單,是文本格式的,用空格隔開。他們家的就簡單很多,只有商戶訂單號,交易流水號,交易時間,支付時間,付款方,交易金額,交易類型,交易狀態這些字段。
由於每個渠道的賬單格式都不盡相同, 在得到賬單后,下一步是對賬單做標准化處理,這樣軋帳以及后續工作就可以統一處理了。 標准化后的賬單數據可以放在文件系統或者數據庫中。這取決於交易數據量。每天百萬以上的量,還是使用文件系統,比較合適。數據庫操作相對比較慢,也浪費資源。 基於文件系統的標准化涉及如下內容:
文件格式標准化 統一使用csv或者json或者xml格式。如果是使用hadoop或者spark來對賬,使用csv是個不錯的選擇。
文件存儲統一化 文件目錄,文件名都需要遵循統一命名規范。
為了加快處理速度,我們使用hdfs作為文件系統,有利於后續的對賬的處理。
1.3 本地交易記錄准備
本地交易記錄的准備,總的來說有如下方法:
-
啥都不做,直接用原始數據。鑒於大部分系統使用的是mysql,這也意味着在MySQL上做對賬。對賬時需要大量的數據查找工作,必然會影響線上業務。在數據規模較大,比如超過100萬時,就不太合適了。
-
當然,還有一個選擇是使用備庫來執行對賬,這樣既簡單,也不影響線上業務。這是典型的空間換時間的做法。
-
如果業務大到需要分表分庫才能處理,那對賬數據准備也不一樣。使用分庫也不現實,因為分庫一般是按照主體id,而不是渠道id,來分庫,這樣對賬就需要在多個庫上進行,效率反而降低了。而對分表分庫建立從庫也非常耗費資源。這種情況下,需要同步一份數據到(hdfs)文件系統中,或者NOSQL數據庫上。
由於交易記錄是支付系統核心數據,有大量的應用,如信用、風控等,都需要交易記錄數據。這些應用對交易記錄的需求還不完全一致,為了提升性能, 交易記錄會使用異步的方式來將數據投遞給使用方。 交易記錄在入庫時,投遞消息到消息系統中。使用方監聽這個消息,一旦收到新消息,則從交易記錄庫中查詢數據,獲取數據並更新到庫中。關於此類數據同步的文章不少,這里就不詳細介紹。
1.4 軋帳
軋帳是按照客戶訂單號來比較本地交易記錄和渠道交易記錄是否一致。從算法角度,是計算兩個數組的差異。在單機運行時,可以采用的算法不少,這里不詳細介紹。 我們推薦采用mapreduce來軋帳,這有個優勢,可以按照訂單號將渠道提供的記錄和本地記錄shuffle到同一個reduce處理上,這樣就可以很容易進行數據比對。 軋帳中最大的坑,莫過於切分點的問題。比如以整0點為切分點,那存在一個問題,本地23:59發起的交易,到了渠道側,可能會在00:01處理,這一筆交易變成第二天的帳了。實際處理中,一筆交易在渠道側處理,花上幾分鍾都有可能。 對於切分點附近無法確認的帳,做一個時間窗,在時間窗內的數據,留待第二天對賬時繼續處理。
1.5 平帳
發現兩邊不一致的數據,那應該如何處理?數據量不大時,記錄起來,人工甄別就行。但如果數據量很大,每天上千條,人工處理就成本太高了。這個沒有統一的處理方法,需要根據有問題的數據,做個分析,然后做自動處理。 針對交易記錄的對賬的處理,主要有如下情況:
-
長款: 本地未支付,支付渠道已支付。這主要是本地未正確接收到渠道下發的異步通知導致。 一般處理是將本地狀態修改為已支付,並做響應的后續處理,比如通知業務方等。
-
短款:本地已支付,但是支付渠道中無記錄;或者本地無記錄,支付渠道有記錄。在排除跨日因素外,這種情況非常少見,需要了解具體原因后做處理。
-
金額不一致: 本地已支付,支付渠道已支付,但是金額不同,這個需要人工核查。
針對退款的對賬處理,主要有如下情況:
-
本地未退款,支付渠道已退款,則以支付渠道為准,修改本地為已退款狀態,並出發后續處理。
-
本地已退款、支付渠道已退款,但是金額不同,需要人工核查;
-
本地已退款,但是支付渠道無記錄;或者支付渠道有記錄,但是本地沒有。 在排除跨日因素外, 這種情況非常少見,需要了解具體原因后做處理。
二、對賬架構
2.1 對賬單下載
對賬單下載組件每天定時觸發,從支付通道服務器上下載對賬單。 目前主要有HTTP(S)和FTP兩種對賬單下載方式。 技術選型上,HTTP(S)用apache httpclient即可實現鏈接池和斷點續傳, FTP也可以使用Apache Commons Net API。 不管是哪一個,都需要設置重試次數和鏈接超時間。重試次數和間隔的設置需要小心,重試太頻繁,容易把服務器打死.;時間間隔太大,又會阻塞后續處理步驟。5~10分鍾是一個合適的重試間隔區間。鏈接超時指在服務器出現問題時,連接在指定時間內獲取不到數據即自動斷開。這個很容易被忽略。我們有一次系統出問題,是渠道側的FTP假死后重啟,導致我們的客戶端掛住,一直在等待重新鏈接。此外,注意,有些對賬單下載是支持分頁下載的。
2.2 對賬單轉換
將對賬單轉換為標准格式的賬單,為對賬Mapreduce任務執行提供支持。每個渠道的對賬單格式不一,需要分別開發轉換程序。 轉換程序主要就兩個操作: 解析源文件、轉換成標准格式並輸出。
2.3 軋賬MR
如上所述,軋賬MapReduce程序在Hadoop上運行,以交易號為Key,核對渠道訂單和本地交易記錄之間的差異,輸出差異記錄。最后將差異記錄導入到差異表中。
總之,對賬工作,即復雜也不復雜。需要細心,對業務要有深入的了解,並選擇合適的架構。
感謝您對本文的關注,如需要及時收到鳳凰牌老熊的最新作品,或者有相關問題探討,請掃碼關注“鳳凰牌老熊”的微信公眾號,在公眾號里留言或者回復,可以盡快處理,謝謝。