PDF加工製品
「PDFtoXML」のご紹介
● PDFからデータ抽出してXMLやCSVに!
● ビッグデータ分析のためのテキストデータ化に!
PDFtoXMLの概要
PDFtoXMLは電子文書として一般に利用されているPDF形式の文書から、
必要な情報をXMLフォーマットで抽出できる画期的なツールです。
- ● PDFファイルにタグ情報を設定してXMLデータを抽出することができます。
- ● XMLデータにすることにより、データ自体の軽量化が可能です。
- ● 検索速度が向上します。
- ● 表・定型文書などの異なるタイプのテキスト部データも、XML化が可能です。
- ● 定義ファイルを保存しておけば、同型のPDFファイルからの一括変換が可能です。
主な機能
- ツリー構造でタグの階層を指定し、各タグや属性のテキスト情報を設定可能。
- タグのテキスト情報を座標にて指定可能。
- テキスト・サムネイルの両方が利用できることにより、ビジュアル的にタグの付与が可能。
- 一度タグ情報を設定してしまえば、タグ設定情報ファイルにより、迅速なXML変換が可能。
価格・お見積について
※年間保守費として製品価格総額の20%を頂きます。(初年度必須)
※年間使用権ライセンスでの提供もしております。ご希望があればご相談ください。
見積は「お見積依頼」のページを参照の上営業まで御依頼ください。
対応環境
■対応OS |
Windows 10/11 Pro 64 bit/Pro for Workstation Windows Server 2016/2019/2022 |
---|
パンフレット
|
PDFtoXMLを使用した例です。 |
|
PDFtoXMLパンフレット(520KB) |