HOME > 製品 > 製品一覧 > PDFtoXML

PDF加工製品
「PDFtoXML」のご紹介

● PDFからデータ抽出してXMLやCSVに!
● ビッグデータ分析のためのテキストデータ化に!

 

PDFtoXMLの概要

PDFtoXMLは電子文書として一般に利用されているPDF形式の文書から、
必要な情報をXMLフォーマットで抽出できる画期的なツールです。

PDFtoXML

  1. ● PDFファイルにタグ情報を設定してXMLデータを抽出することができます。
  2. ● XMLデータにすることにより、データ自体の軽量化が可能です。
  3. ● 検索速度が向上します。
  4. ● 表・定型文書などの異なるタイプのテキスト部データも、XML化が可能です。
  5. ● 定義ファイルを保存しておけば、同型のPDFファイルからの一括変換が可能です。

 

主な機能

  1. ツリー構造でタグの階層を指定し、各タグや属性のテキスト情報を設定可能。
  2. タグのテキスト情報を座標にて指定可能。
  3. テキスト・サムネイルの両方が利用できることにより、ビジュアル的にタグの付与が可能。
  4. 一度タグ情報を設定してしまえば、タグ設定情報ファイルにより、迅速なXML変換が可能。

 

価格・お見積について

PDFtoXML オープン価格/1サーバ
※保守費として製品定価総額の15%を頂きます。(初年度必須)
詳しくは営業までお問い合わせください。

見積は「お見積依頼」のページを参照の上営業まで御依頼ください。

 

対応環境

■対応OS Windows 10 Pro
/ Windows 10 Pro for Workstation
Windows Server 2012(R2)/2016/2019

 

パンフレット

PDFtoXMLパンフレットPDF(791KB)