PDF2HTMLEX 结构化提取测试

使用Docker版pdf2htmlEX进行结构化PDF解析


使用说明

  1. 确保Python服务正在运行: python3 unstructured-service.py
  2. 选择PDF文件(最大50MB)
  3. 点击“开始提取文本”按钮
  4. 查看提取的文本结果

💡 这个工具专门为日语注音功能设计,重点提取文本内容而非保留复杂布局。