如果一個broker正常退出,是會刪除abort文件的。那么啟動broker的時候發現abort文件還存在,那么說明上次是異常終止,會進入到commit-log的recoverAbnormally邏輯里面,因為所有其他的信息都是從commit-log獲取到的,所以追根溯源只能從commit-log開始着手。
public void recoverAbnormally(long maxPhyOffsetOfConsumeQueue) { // recover by the minimum time stamp boolean checkCRCOnRecover = this.defaultMessageStore.getMessageStoreConfig().isCheckCRCOnRecover(); final List<MappedFile> mappedFiles = this.mappedFileQueue.getMappedFiles(); if (!mappedFiles.isEmpty()) { // Looking beginning to recover from which file int index = mappedFiles.size() - 1; MappedFile mappedFile = null; for (; index >= 0; index--) { mappedFile = mappedFiles.get(index); if (this.isMappedFileMatchedRecover(mappedFile)) { log.info("recover from this mapped file " + mappedFile.getFileName()); break; } }
從最新的mapped文件開始找,直到發現一個有效的mappedfile,對這個mappedfile文件執行操作:
ByteBuffer byteBuffer = mappedFile.sliceByteBuffer();
while (true) { DispatchRequest dispatchRequest = this.checkMessageAndReturnSize(byteBuffer, checkCRCOnRecover); int size = dispatchRequest.getMsgSize(); if (dispatchRequest.isSuccess()) { // Normal data if (size > 0) { mappedFileOffset += size; if (this.defaultMessageStore.getMessageStoreConfig().isDuplicationEnable()) { if (dispatchRequest.getCommitLogOffset() < this.defaultMessageStore.getConfirmOffset()) { this.defaultMessageStore.doDispatch(dispatchRequest); } } else { this.defaultMessageStore.doDispatch(dispatchRequest); } }
checkMessageAndReturnSize的邏輯:
public DispatchRequest checkMessageAndReturnSize(java.nio.ByteBuffer byteBuffer, final boolean checkCRC, final boolean readBody) { try { // 1 TOTAL SIZE int totalSize = byteBuffer.getInt();
通過不變遍歷這個最新的mappedfile的bytebuffer,把他的每一條消息取出來,並且消息一個字段就是total-size,累計求和就可以拿到這個mappedfile上次掛掉的時候到底寫到哪了。對於其他的mappedfile默認認為都是寫滿的。
processOffset += mappedFileOffset; this.mappedFileQueue.setFlushedWhere(processOffset); this.mappedFileQueue.setCommittedWhere(processOffset); this.mappedFileQueue.truncateDirtyFiles(processOffset);
這里已經把commit-log完全恢復了。接下來就是恢復consumequeue、indexfile了。前一節提到生成消息的時候,其實也會同步更新consumeQueue,並且刷盤。
也就是不管是故障恢復還是正常生成消息,都會涉及commit-log、consumeQueue、indexfile的更新、落盤。只不過后面兩個是異步的。
他們都是通過this.defaultMessageStore.doDispatch(dispatchRequest)更新的
另外topicQueueTable完全可以通過consumeQueue得到,因為前者是后者子集:
private void recoverTopicQueueTable() { HashMap<String/* topic-queueid */, Long/* offset */> table = new HashMap<String, Long>(1024); long minPhyOffset = this.commitLog.getMinOffset(); for (ConcurrentMap<Integer, ConsumeQueue> maps : this.consumeQueueTable.values()) { for (ConsumeQueue logic : maps.values()) { String key = logic.getTopic() + "-" + logic.getQueueId(); table.put(key, logic.getMaxOffsetInQueue()); logic.correctMinOffset(minPhyOffset); } } this.commitLog.setTopicQueueTable(table); }