原文:记一次使用tika解析文件文本导致的内存溢出问题

背景 笔者曾供职于某信息安全公司,接到过一个需求,提取文档中的文本以供后续分析。tika是apache开源的解析文档内容的组件,应用十分广泛。tika几乎支持你能想到的所有文档格式,docx , pptx , xlsx , pdf, zip , rar , tar 等。 tika本身只是一个门面,不提供文档解析实现,这有点类似与sl j。例如tika使用pdfbox解析pdf文件,使用poi解析 ...

2021-09-07 22:21 0 201 推荐指数:

查看详情

一次lettuce导致内存溢出问题

现象 生产环境,程序出现内存溢出。 分析 heap dump文件分析 发现添加了大量的ShutdownHooks。 通过类名“io/lettuce/core/metrics/DefaultCommandLatencyCollector ...

Tue Mar 16 17:45:00 CST 2021 1 793
一次内存溢出问题的排查、分析过程及解决思路

谨以此文献给自学路上的兄弟 起因 这个测试工具的开发已有一段时间了,由于数据量过大,写入数据较慢,导致工具执行耗时较长,所以再次优化了实现方案,进行二阶段的程序开发。 经优化后,2000 条数据写入,耗时4秒,个人感觉,快了很多了。 于是,想批量执行下,看下耗时多长。 结果10 ...

Mon Sep 21 02:26:00 CST 2020 0 1644
一次生产线程数耗尽,导致内存溢出(outOfMemoryError)问题及解决

问题:   数据源连接池线程数最大连接数最初设置300,但是一周有2-3发生活跃连接数超过最大线程数,导致线程堵塞,服务查询等待超时,所以运维将最大线程数调至1500,这样导致JVM创建的线程数大大增多,原先配置的JVM内存不够使用导致内存溢出,无法创建线程。 解决:   后将最大线程数 ...

Fri Apr 03 19:55:00 CST 2020 0 2556
一次Orika使用不当导致内存溢出

hprof 文件分析 2021-08-24,订单中心的一个项目出现了 OOM 异常,使用 MemoryAnalyzer 打开 dump 出来的 hprof 文件,可以看到 91.27% 的内存被一个超大对象javassist.ClassPool占用了。 那么,ClassPool是一个什么样 ...

Wed Aug 25 22:37:00 CST 2021 0 274
一次内存溢出问题分析——虚拟机优化

打开开发环境服务器(我的服务器应用是单独部署的,几乎没有人访问),偶然间看到命令窗口报异常,java.lang.OutOfMemoryError:heap space,还包括一大堆的其他错误——后面发现其他错误都是内存溢出引起的 用jconsole和jvisualvm尝试打开服务器 ...

Fri Nov 16 18:15:00 CST 2018 0 944
一次内存溢出的分析经历

说在前面的话 朋友,你经历过部署好的服务突然内存溢出吗? 你经历过没有看过Java虚拟机,来解决内存溢出的痛苦吗? 你经历过一个BUG,百思不得其解,头发一根一根脱落的烦恼吗? 我知道,你有过! 但是我还是要来说说我的故事.................. 背景: 有一个 ...

Fri Mar 02 05:55:00 CST 2018 23 10400
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM