我正在尝试使用 tika 包来解析文件。 Tika 已成功安装, tika-server-1.18.jar
使用 cmd 中的代码 Java -jar tika-server-1.18.jar
我在 Jupyter 中的代码是:
Import tika
from tika Import parser
parsed = parser.from_file('')
但是,我收到以下错误:
2018-07-25 10:20:13,325 [MainThread] [WARNI] 无法查看启动日志消息;重试… 2018-07-25 10:20:18,329 [MainThread] [WARNI] 无法查看启动日志消息;重试… 2018-07-25 10:20:23,332 [MainThread] [WARNI] 无法查看启动日志消息;重试… 2018-07-25 10:20:28,340 [MainThread] [错误] 3 次尝试后未收到 Tika 启动日志消息。 2018-07-25 10:20:28,340 [MainThread] [错误] 无法从 startServer 接收启动确认。
运行时错误:无法启动 Tika 服务器。
原文由 Sha Li 发布,翻译遵循 CC BY-SA 4.0 许可协议
根据 Apache Tika 的网站,所有新版本的 tika-server.jar 都需要 Java 8。
tika Python 库的当前过时文档声称需要 Java 7,但现在必须安装 Java 8。这是因为如果在临时文件中找不到当前版本的 tika-server.jar,则会在运行时自动下载。
安装 Java 8 后,我的基本测试代码启动了服务器并正常运行。