原文:記一次使用tika解析文件文本導致的內存溢出問題

背景 筆者曾供職於某信息安全公司,接到過一個需求,提取文檔中的文本以供后續分析。tika是apache開源的解析文檔內容的組件,應用十分廣泛。tika幾乎支持你能想到的所有文檔格式,docx , pptx , xlsx , pdf, zip , rar , tar 等。 tika本身只是一個門面,不提供文檔解析實現,這有點類似與sl j。例如tika使用pdfbox解析pdf文件,使用poi解析 ...

2021-09-07 22:21 0 201 推薦指數:

查看詳情

一次lettuce導致內存溢出問題

現象 生產環境,程序出現內存溢出。 分析 heap dump文件分析 發現添加了大量的ShutdownHooks。 通過類名“io/lettuce/core/metrics/DefaultCommandLatencyCollector ...

Tue Mar 16 17:45:00 CST 2021 1 793
一次內存溢出問題的排查、分析過程及解決思路

謹以此文獻給自學路上的兄弟 起因 這個測試工具的開發已有一段時間了,由於數據量過大,寫入數據較慢,導致工具執行耗時較長,所以再次優化了實現方案,進行二階段的程序開發。 經優化后,2000 條數據寫入,耗時4秒,個人感覺,快了很多了。 於是,想批量執行下,看下耗時多長。 結果10 ...

Mon Sep 21 02:26:00 CST 2020 0 1644
一次生產線程數耗盡,導致內存溢出(outOfMemoryError)問題及解決

問題:   數據源連接池線程數最大連接數最初設置300,但是一周有2-3發生活躍連接數超過最大線程數,導致線程堵塞,服務查詢等待超時,所以運維將最大線程數調至1500,這樣導致JVM創建的線程數大大增多,原先配置的JVM內存不夠使用導致內存溢出,無法創建線程。 解決:   后將最大線程數 ...

Fri Apr 03 19:55:00 CST 2020 0 2556
一次Orika使用不當導致內存溢出

hprof 文件分析 2021-08-24,訂單中心的一個項目出現了 OOM 異常,使用 MemoryAnalyzer 打開 dump 出來的 hprof 文件,可以看到 91.27% 的內存被一個超大對象javassist.ClassPool占用了。 那么,ClassPool是一個什么樣 ...

Wed Aug 25 22:37:00 CST 2021 0 274
一次內存溢出問題分析——虛擬機優化

打開開發環境服務器(我的服務器應用是單獨部署的,幾乎沒有人訪問),偶然間看到命令窗口報異常,java.lang.OutOfMemoryError:heap space,還包括一大堆的其他錯誤——后面發現其他錯誤都是內存溢出引起的 用jconsole和jvisualvm嘗試打開服務器 ...

Fri Nov 16 18:15:00 CST 2018 0 944
一次內存溢出的分析經歷

說在前面的話 朋友,你經歷過部署好的服務突然內存溢出嗎? 你經歷過沒有看過Java虛擬機,來解決內存溢出的痛苦嗎? 你經歷過一個BUG,百思不得其解,頭發一根一根脫落的煩惱嗎? 我知道,你有過! 但是我還是要來說說我的故事.................. 背景: 有一個 ...

Fri Mar 02 05:55:00 CST 2018 23 10400
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM