底本のOCRテキスト化サービス 目視チェック2回、ルビ入力対応事例 I出版社様

案件概要

お客様名・業種 出版社 I出版社様
ご利用サービス内容  OCRテキスト化サービス 目視チェック後再チェックプラン、ルビ入力
電子化の目的  底本からテキスト文字を抜き出し、それを基に組版作業をおこなうため。
入稿方法  データ入稿 e-typistのファイル形式およびPDF
納品方法  ファイル転送サービス
納品形式  テキストファイル

OCRテキスト化サービスのポイント

I出版社様の出版物のテキスト化をご依頼いただきました。ポイントは、e-typistというOCRソフトを利用して目視チェックをおこない、その後、ルビ入力をおこなった点です。読取革命というOCRソフトもあり、どちらを利用するのが、ルビ入力しやすいかを最初検証をおこない、結果的にe-typistを利用することになりました。ただし、読取革命の方がハイパーチェッカーという機能があるため目視チェックはおこないやすいです。市販のソフトを使って、誤字などを細かくチェック出来るスタッフが一字一句チェックをおこないます。機械的なOCR処理と比べて精度ははるかに高いので(目視1回チェックでは1万字に1字程度のミス率)、出版物のテキスト化には丁度良いと思います。今回は、担当スタッフを変えて2度チェックをおこなっています。また、ルビの入力希望もあり、その入力にあたって、いろいろな方法を検討したところ、青空文庫の記法だと組版作業上問題はないことが明らかであったため、青空文庫の記法に従って、ルビの入力をおこなっています。納品は、テキストファイル形式での納品で、章立てごとにテキストファイル化し、納品しています。組版作業にはその方が良いというお客様からのご要望でした。

e-typistというOCRソフトは、少し癖があり、原稿上では次列に改行されていても、OCRされたテキスト文字が改行されていなかったりなど、その確認がとても大変で、納品に少しお時間をいただきましたが、お客様に満足していただける品質で納品できたのではと思っております。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です