新浪博客

用于移动和嵌入式平台的TET

2022-07-23 11:15阅读:
用于移动和嵌入式平台的TET
PDFlibTET(文本和图像提取工具包)可靠地从PDF文档中提取文本、图像和元数据。TET以Unicode字符串的形式提供PDF的文本内容,以及详细的颜色、字形和字体信息以及页面上的位置。光栅图像以常见的图像格式提取。TET可选择将PDF文档转换为称为TETML的基于XML的格式,其中包含文本和元数据以及资源信息。
TET包含用于确定单词边界、将文本分组到列和删除冗余文本的高级内容分析算法。使用集成的pCOS界面,您可以从PDF中检索任意对象,例如元数据、交互式元素等。
在移动和嵌入式系统上使用TET的示例
由于PDF文件在移动设备上也得到广泛使用,因此TET在移动和嵌入式系统上的使用方式不同。
TET:从PDF文档中提取文本为XML
PDFlibTET 可用于从任何PDF文档中提取文本和图像,并使其可用于重新利用。
电子邮件中的PDF附件
PDFlibTET 可以重新利用PDF附
件的内容。
TET 结合PDFlib PDI:查找文本和更改PDF文档
由于TET从PDF文档中提取文本,它也可用于根据特定关键字进行更改。为此,使用了TET和PDFlib PDI的组合。一旦关键字位于给定PDF中,PDFlib PDI就可以导入该PDF并在TET报告的此特定位置进行一些更改,例如添加书签。然后可以生成新的更改PDF。有关如何执行此操作的示例,请参阅我们的TET食谱。
用于移动和嵌入式平台的TET
公司名称:北京哲想软件有限公司
北京哲想软件官方网站:cogitosoft.com
北京哲想软件微信公众平台账号:cogitosoftware
北京哲想软件微博:哲想软件
北京哲想软件邮箱:sales@ cogitosoft.com
销售(俞先生)联系方式: 86(010)68421378
微信:18610247936 QQ:368531638

我的更多文章

下载客户端阅读体验更佳

APP专享