有一个pdf文档,文档里面有一些表格,我现在想从这个pdf文档中将表格数据提取出来,保存成一个xml格式。 我现在使用了xpdf这个开源库,也转换成xml或者html格式,不过我不能根据生成的xml或者html判断出那些数据是之前pdf文档中的表格数据。所以还是不能获取到想要的数据,请问有什么比较好的方法获取这些表格数据吗,mupdf这个开源库可以吗?
xml PDF HTML
怎样让 pdf 文件直接下载而非在浏览器里打开
怎么用xml传输html?
从数据库中提取的带有HTML标签的数据经过XML传输后HTML标签消失了,如何保存用XML传输...
各种标记语言都有关闭标签, 是解析器太弱的原因吗?
在不同浏览器上用svg效果不同,如何解决?
关于xslt+xml ==> html的使用
MDX和MDD文件格式分析和操作