OCR(文字検索)対応

お問い合わせ・ご相談窓口

03-5829-4150 受付時間平日10時〜18時

info@scanspecial.jp 24h受付

お見積もり・お問い合わせ

スキャン専科がおススメするOCRテキスト化サービス

 

1冊700円(税抜き)から品質と価格から選べる4タイプ

OCRテキスト化サービスについて

概要

スキャンして生成されたPDFファイルは画像情報のみです。この画像情報に、市販のOCR(文字認識画像処理)ソフトを使って、画像に埋め込まれた文字情報を抽出・テキスト化した上で、PDFのファイルの画像に埋め込まれた文字の上に、メタ情報として透明化された文字を設置し、容易にコピーや検索がおこなえるようにすることを 一般的にOCR処理と呼びます。

OCRソフトで機械的に処理生成されたテキスト文字が、メタ情報として透明文字化された上でPDFの画像の上に埋め込まれます。機械的な処理のみのため、誤変換や縦書きや横書きなど複雑なレイアウトの読取ミスが多く、あくまでも検索用途にのみおススメします。
商品カタログなどのOCRをご検討の企業様は、レイアウト設定OCR処理がおススメです。

*注意
OCR化サービスは、著作権上問題のない、書類および冊子類に対してのみ提供しております。
市販の書籍の著作権を有していない企業、及び個人様からのご依頼には一切ご対応致しておりません。著作者より許諾を得ている出版社や企業様は、事前にお問い合わせをいただき、許諾証明書などを提出の上、事前に電子化の契約書を締結させて頂きます。

スキャン専科では、上記のようなOCRの現状から、お客様のご利用ニーズに合わせまして、機械的にテキスト化された状態のOCR処理から少しずつ品質を上げた4つのコースをご用意しております。

  1. 機械的なOCR処理
  2. レイアウト設定OCR処理
  3. テキスト文字修正処理
  4. テキスト文字修正後再チェック
機械的なOCR処理 検索用途向け

OCRソフトで機械的に処理生成されたテキスト文字が、メタ情報として透明文字化された上でPDFの画像の上に埋め込まれています。機械的な処理のみのため、誤変換が多く、検索用途にのみおススメします。

対応言語 日本語・英語以外の各種言語でも処理が可能
料金 1冊 700円
納品形式 .pdf ファイルのみに対応しています。
OCR処理費用例 800文字300ページ文庫本タイプ…700円
1800文字2段組み400ページ辞書タイプ…700円
備考 認識後のテキスト文字情報には一切手修正は加えません。網掛け文字や手書き文字などは、誤認識します。
レイアウト設定OCR処理

レイアウト設定OCR処理では、段組みや横書き縦書きの読み込み部分を手動で設定することで、OCRソフトが機械的に処理する際に、横書きの文章を間違えて縦書きで読み取ったり、段落を認識しなかったりという誤認識を回避しようとするコースです。

誤認識の大半を回避できるため、文章情報をある程度まとめてご利用することも可能です。担当者が1ページずつ手動で読み込む箇所 を設定しますので、ノンブルやページ上部や下部などにある章のタイトルをテキスト情報から除くことも出来ます。
カタカナと英数字などが混在している書類などの場合は、誤認識が多く生じてしまいます。事前にご相談サンプル依頼のご連絡を頂けます様お願い致します。

対応言語 日本語・英語以外の各種言語でも処理が可能
料金 1ページのレイアウトが1枠の場合、40円/ページ。
枠が1つ増えるごとに+10円/ページ。
納品形式 .pdf、.txt、.doc ファイルに対応しています。
OCR処理費用例 700文字400ページ文庫本…40円×400ページ=16,000円
1500文字2段組み余白なし400ページ辞書タイプ…50円×400ページ=20,000円
備考 認識後のテキスト文字情報には一切手修正は加えません。網掛け文字や手書き文字などは、誤認識します。
テキスト文字修正処理

レイアウト設定OCR処理をした後、1文字1文字を目視でチェックし、誤変換の文字を修正して、テキスト情報を完成するコースがテキスト文字修正処理です。
大企業様の社史や社内報のデータ化において、大切な希少価値のあるデータのOCRもある程度のクオリティを求められる場合などに有効です。文字精度は、1万字あたり1文字ほどの目視チェック漏れが生じる程度になります。

対応言語 日本語と英語のみ
料金 1ページの文字数が600文字の場合、120円/ページ。
1ページの文字数が1200文字の場合、240円/ページ。
納品形式 誤字のないテキストデータが必要な場合のサービスで、.pdf、.txt、.doc ファイルに対応しています。
OCR処理費用例 500文字300ページ文庫本…120円×300ページ=36,000円
1500文字2段組み余白なし600ページ辞書タイプ…300円×1.3×600ページ=234,000円
テキスト文字修正後再チェック

テキスト文字修正処理後のテキスト情報を別のスタッフが、もう1度、目視チェックします。誤字を出来る限り排した品質レベルのテキスト情報を作成致します。組版前のテキストデータを求められる出版社様や、翻訳会社様向け。ルビ情報を青空文庫の記法に従って手入力するオプション(1個8円)もご用意しております。また、出版社様向けに、改行なども含めたチェックにもご対応が可能で、テキスト情報の改行を原本と同じようになるように改行を入れたり消したりという対応もおこなっております。
各章ごとにテキストファイル化して納品することもご対応しております。

文字精度は、4万字あたり1文字ほどの目視チェック漏れが生じる程度になります。

対応言語 日本語と英語のみ
料金 料金 テキスト文字修正処理の料金+その40%の目視チェック費用
納品形式 .pdf、.txt、.doc ファイルに対応しています。
OCR処理費用例 500文字300ページ文庫本…120円×300ページ×1.8倍=64,800円
1500文字2段組み余白なし600ページ辞書タイプ…300円×1.3×600ページ×1.8倍=421,200円
前処理工程のスキャニングについて

テキスト文字修正処理やその目視チェックコースをご利用の際は、読み取り精度を上げることで目視チェックにかかる負担を軽減するために、600dpi白黒2値でスキャン作業を実施いたします。そのため、OCR料金とは別途、600dpi白黒2値のスキャン料金をご請求いたします。

オプションルビ入力 8円(青空文庫の記法にてルビ入力対応いたします。)
※組版の前作業に、ルビ入力対応を致します。

実際のOCR対応の実績事例一覧はこちら

他社を圧倒する高品質データ 事例一覧はこちら

スキャン専科とは 詳細はこちら

スキャン専科とは

スキャン専科は、東京都に拠点を置く、雲紙舎合同会社が運営する法人向け紙文書電子化サービスです。
会社概要はこちら

2010年よりスキャニング事業を展開しており、これまで延べ1000万ページをスキャンした実績があります。

会社内のキャビネットや倉庫に蓄積された書類が多く保管のためのスペースにコストがかかってしまうため、電子化することでコストをゼロに抑えたいが、電子化する担当者やノウハウがなくて困っている法人様や、業務上紙の書類がどうしても生じてしまい、これらに必要に応じて素早くアクセスする必要性があるが、書類の量が多すぎて実現が出来ず、電子化する担当者やノウハウがなくて困っている法人様向けのサービスです。

初めてご利用のお客様へ詳細はこちら

スキャン専科のご提示する仕様書や見積もりにご納得いただいてからご発注を頂いております。
ご発注後、初回データ確認作業をおこない、その上で、より正確な見積書を作成致します。

初めてご利用のお客様へ

お見積もり

お見積もりは5万円以上から受付致しております。お見積りは無料です、お気軽にお申し込みください。
メールとお電話でお打合せ後、仕様書を作成の段階で正式なお見積りさせていただきます。
お客様にとって、お見積もりが適切でなかった場合でも、お見積もり・問い合わせ後に弊社より適切なプランをご提案申し上げますので、どうぞご安心ください。

まずは、簡単に概算を知りたい。
3分簡単自動見積りはこちら(簡単見積り後に正式見積もりへと移行が可能です)

担当者の方から詳しく説明が欲しい。
正式見積もりはこちら

お問い合わせ

お見積もり概算を知りたいお客様はこちらの3分簡単自動見積りをご利用ください。

スキャン専科のサービス全般に関して、疑問やご意見などがございましたらお気軽にお問い合わせ下さい

お問い合わせ送信後、2日以内(事務局定休の土曜・日曜・祝祭日を除く)にご返信差し上げます。

万が一、お返事が届かない場合は、連絡先情報が誤って入力された可能性があります。

恐れ入りますが、その場合は再度こちらのフォームよりお問い合わせ下さい。

お客様情報
個人情報の取り扱いについて

(利用目的については こちら をご確認ください。)