php将pdf转为html,PHP将pdf转成html
最近有个功能需求是: 识别pdf文件转化为html页面形式
解决方式:
方法1:开始是寻找的PHP插件pdfparser,详见github链接: https://github.com/smalot/pdfparser ,官网示例文档:https://www.pdfparser.org/documentation
摘录示例如下
parseFile('document.pdf');
$text = $pdf->getText();
echo $text;
?>
常规的pdf可以进行识别,但是对于里面含有数据表格,就无法识别出里面的表格的样式。推荐程度一般。
方法2:Linux命令,pdf2htmlEX
1, 安装pdf2htmlEX,过程如下:
sudo yum install -y cmake gcc gnu-getopt libpng-devel fontforge-devel cairo-devel poppler-devel libspiro-devel freetype-devel poppler-data libjpeg-turbo-devel git make gcc-c++ pango-devel
sudo yum install -y libjpeg-turbo.x86_64 libjpeg-turbo-devel libjpeg-turbo-devel.x86_64 libtiff.x86_64 libtiff-devel openjpeg-devel.x86_64 openjpeg giflibgiflib-devel libxml2.x86_64 libxml2-devel libspiro.x86_64 libspiro-devel libunin
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
