php解析pdf数据库,PHP生成pdf

如何从php程序读取pdf文档中的文本信息

PHP程序pdf格式文件函数库

创新互联IDC提供业务:光华机房服务器托管,成都服务器租用,光华机房服务器托管,重庆服务器租用等四川省内主机托管与主机租用业务;数据中心含:双线机房,BGP机房,电信机房,移动机房,联通机房。

本函数库共有65个函数

PDF是Adobe所发展的可携式文件格式,它的文件可以在网络上传输、浏览,甚至使用印表机印出,或使用其它输出装置输出,都可以保存原来的文字及图片的编排。详细的信息可以参考 Adobe 的网站。参考其中有关 PDF 或 Acrobat 的部份。

在 UNIX 系统中,可以使用 Thomas Merz 开发的 PDF 函数库。将它编译安装完成后,再编译 PHP 程序方可供 PHP 使用 pdflib。编译时可能要 JPEG library 及 TIFF library。

除了用这个函数库可以建立 PDF 文件外,FastIO 公司发展的产品 ClibPDF 也可以处理 PDF 文件。

以下为处理 PDF 文件的范例,本例对 test.pdf 加工后等待用户读取。

?php

$fp = fopen("test.pdf", "w");

$pdf = PDF_open($fp);

pdf_set_info_author($pdf, "Uwe Steinmann");

PDF_set_info_title($pdf, "Test for PHP wrapper of PDFlib 2.0");

PDF_set_info_author($pdf, "Name of Author");

pdf_set_info_creator($pdf, "See Author");

pdf_set_info_subject($pdf, "Testing");

PDF_begin_page($pdf, 595, 842);

PDF_add_outline($pdf, "Page 1");

pdf_set_font($pdf, "Times-Roman", 30, 4);

pdf_set_text_rendering($pdf, 1);

PDF_show_xy($pdf, "Times Roman outlined", 50, 750);

pdf_moveto($pdf, 50, 740);

pdf_lineto($pdf, 330, 740);

pdf_stroke($pdf);

PDF_end_page($pdf);

PDF_close($pdf);

fclose($fp);

echo "A HREF=getpdf.php3finished/A";

?

上例中的 gettest.php3 可能像下面的样子

?php

$fp = fopen("test.pdf", "r");

header("Content-type: application/pdf");

fpassthru($fp);

fclose($fp);

?

PDF_get_info: 返回文件信息。

PDF_set_info_creator: 配置建档者字符串。

PDF_set_info_title: 配置文件标题。

PDF_set_info_subject: 配置文件主题。

PDF_set_info_keywords: 配置文件的关键字。

PDF_set_info_author: 配置文件作者。

PDF_open: 建立新的 PDF 档。

PDF_close: 关闭 PDF 档。

PDF_begin_page: 启始 PDF 文件页面。

PDF_end_page: 关闭 PDF 文件页面。

PDF_show: 输出字符串到 PDF 文件。

PDF_show_xy: 输出字符串到指定坐标。

PDF_set_font: 配置使用的字型及大小。

PDF_set_leading: 配置行距。

PDF_set_text_rendering: 配置文字表现方式。

PDF_set_horiz_scaling: 配置文字水平间距。

PDF_set_text_rise: 配置文字高度。

PDF_set_text_matrix: 配置文字矩阵。

PDF_set_text_pos: 配置文字位置。

PDF_set_char_spacing: 配置字符间距。

PDF_set_word_spacing: 配置字间距。

PDF_continue_text: 输出文字。

PDF_stringwidth: 计算字符串的宽度。

PDF_save: 储存环境变量。

PDF_restore: 还原环境变量。

PDF_translate: 移动原点。

PDF_scale: 缩放类。

PDF_rotate: 旋转类。

PDF_setflat: 配置平滑值。

PDF_setlinejoin: 配置连接参数。

PDF_setlinecap: 配置 linecap 参数。

PDF_setmiterlimit: 配置斜边界限。

PDF_setlinewidth: 配置线宽。

PDF_setdash: 配置虚线样式。

PDF_moveto: 配置处理的坐标点。

PDF_curveto: 绘贝氏曲线。

PDF_lineto: 绘直线。

PDF_circle: 绘圆。

PDF_arc: 绘弧。

PDF_rect: 绘长方形。

PDF_closepath: 形成封闭的向量形状。

PDF_stroke: 沿向量绘线。

PDF_closepath_stroke: 形成封闭的向量形状并沿向量绘线。

PDF_fill: 填满目前的向量。

PDF_fill_stroke: 填满目前的向量并沿向量绘线。

PDF_closepath_fill_stroke: 形成封闭的向量形状沿向量绘线并填满。

PDF_endpath: 关闭目前向量。

PDF_clip: 组合所有向量。

PDF_setgray_fill: 指定填入的颜色为灰阶。

PDF_setgray_stroke: 指定绘图的颜色为灰阶。

PDF_setgray: 指定绘图的颜色为灰阶并填入。

PDF_setrgbcolor_fill: 指定填入的颜色为彩色。

PDF_setrgbcolor_stroke: 指定绘图的颜色为彩色。

PDF_setrgbcolor: 指定绘图的颜色为彩色并填入。

PDF_add_outline: 目前页面加入书签。

PDF_set_transition: 配置页的转换。

PDF_set_duration: 配置二页的切换时间。

PDF_open_gif: 打开 GIF 图档。

PDF_open_memory_image: 打开内存图档。

PDF_open_jpeg: 打开 JPEG 图档。

PDF_close_image: 关闭图档。

PDF_place_image: 放置图片到 PDF 档指定位置。

PDF_put_image: 放置图片到 PDF 档。

PDF_execute_image: 放置 PDF 档中图片到指定位置。

PDF_add_annotation: 加入注释。

pdf.php文件解密方法

下载不了了,选择最长的stream/endstream中间部分,然后用Zlib解压,通常能看到shellcode,shellcode继续解密就行了

猜的没错的话解出来应该是load.php?id=30

php处理PDF的扩展库如何使用?

使用附件的文件里面的字体fonts,直接解压到tcpdf文件夹下的fonts下,然后使 用$pdf-SetFont("stsongstdlight", "", 12);

就是用stsongstdlight这个字体,就可以显示出来简体、繁体中文了

注意:要显示繁体字,只需将输入法设为繁体即可

注意:

如果:

$pdf = new TCPDF(PDF_PAGE_ORIENTATION, PDF_UNIT, PDF_PAGE_FORMAT, true, 'UTF-8', false);

那么:

页面记得也设为utf-8

输入文字:

单行文本

Cell($w, $h=0, $txt='', $border=0, $ln=0, $align='', $fill=0, $link='', $stretch=0)

Cell(宽, 高, 内容, 边框, 是否换行, 文字对齐, 文字底色,连接, 变宽)

多行文本

MultiCell($w, $h, $txt, $border=0, $align='J', $fill=0, $ln=1, $x='', $y='', $reseth=true, $stretch=0, $ishtml=false, $autopadding=true, $maxh=0)

MultiCell(宽, 高, 内容, 边框,文字对齐, 文字底色, 是否换行, x坐标, y坐标, 变高, 变宽, 是否支持html, 自动填充, 最大高度)

html文字

setHtmlLinksStyle($color=array(0,0,255), $fontstyle='U');

setHtmlLinksStyle(颜色默认蓝色, U有下划线);

addHtmlLink($url, $name, $fill=0, $firstline=false, $color='', $style=-1);

addHtmlLink(超链接地址, 显示文字, 是否有底色, $firstline=false, $color='', $style=-1);

换行

Ln($h='', $cell=false);

Ln(行数, 是否cell);

加密

SetProtection($permissions=array(), $user_pass='', $owner_pass=null);

例如:

$pdf-SetProtection(array('print','modify','copy','annot-forms'), '854230');

图片背景

Image($file, $x, $y, $w, $h, $type, $link, $align, $resize, $dpi, $palign, $ismask, $imgmask, $border);

注意:把图片放语句放在前面,并且使用绝对坐标定位,即可做背景。

输出pdf

$pdf-Output(doc.pdf', 'I');/* 默认是I:在浏览器中打开,D:下载,F:在服务器生成pdf ,S:只返回pdf的字符串,个人感觉无实在意义 */

能用php对pdf文件进行解析吗

$fp = fopen("./static/pdf/pdf/Report.pdf", "r");

header("Content-type: application/pdf");

fpassthru($fp);

fclose($fp);

这样可以直接看,不知道符不符合你的要求。


网站栏目:php解析pdf数据库,PHP生成pdf
URL链接:http://myzitong.com/article/dscjpcc.html