私たちが選ばれる理由

1000冊スキャン時に発生するデータ不良の冊数の割合

graph

10冊スキャンをすると、おおよそ9冊には紙粉スジ、 8冊には文章の傾斜、3冊にはゴミ混入、 2冊にはページ折れ、1冊には落丁などの問題が生じます。 特に、紙粉スジが生じるときは1冊の本でも4-5 ページほど紙粉スジによるデータ不良が生じます。 カラー写真のような本の場合はほぼ全ページ紙粉スジ が生じてしまうこともあります。

title_graph_text

1Pスジ、1p剥がれ、177p剥がれ、自動補正999(5-135)

5Pスジ、6p剥がれ、186p剥がれ、371p塗り、自動補正999(5-125)

3Pスジ、3p剥がれ、122p剥がれ、241p塗り、自動補正999(5-121)

1Pスジ、1p剥がれ、121p剥がれ、自動補正999(5-175)

5Pスジ、6p剥がれ、86p剥がれ、51p塗り、自動補正999(5-55)

5Pスジ、8p剥がれ、102p剥がれ、341p塗り、自動補正999(5-132)

ページ折れ検知

書類スキャンの前作業や、書籍スキャンの裁断時に、紙折れなどを目でチェックし正していますが、どうしても漏れが生じてしまいます。

そのため、システム側で、ページ折れの形や折れた箇所の色などの特徴を捕捉する対応をおこなっています

ページ折れ検知

経年の利用や保管による折れ(長年の利用により角が潰れているような)は、修正などの対象外と致しております。

傾斜補正処理

熟練スタッフが目視で検品時、文章に傾斜が見られる紙文書・書類や書籍データに対して傾斜補正処理を実施。PDFデータを一度すべてJPGファイルに変換し、1ページずつ傾きの角度を計算した上で、0.5~2度の範囲で傾きが検知されます。
その際、黄ばみがある紙文書・書類や書籍データに対しては、黄ばみなどのノイズを除去した上で補正処理を実施しています。傾斜補正をおこなったファイルは、誤認識により傾かなくて良いページで傾きなどが生じてしまうため、再度全ページ目視で検品をおこなっています。

傾斜補正処理

傾斜補正は、活字中心の紙文書・書類や書籍のみが対象です。漫画や、図柄や画像の多い紙文書・書類や書籍ではおこなっておりません。
傾斜補正は黄ばみなどのノイズを除去しておこなっておりますが、傾斜補正後のデータには黄ばみなどのノイズはそのまま残っております。ノイズ除去はあくまでも角度計算を正確におこなうためにおこなっております。

Hough変換処理

スキャンして作成したデータには、紙粉の影響により赤色や黄色などのスジがどうしても生じてしまいます。
このスジは、スキャン時に機器から発する光が紙粉にあたることで、黄・赤・緑・青など多様な色になります。

通常は目視による検品でスジを補足していますが、薄い色になると目視検品のスピードも早いため、どうしても見落としが生じてしまいがちでしたが、Hough変換処理を施すことで、目視で補足しづらいスジなども事前に検知することができるようになりました。

Hough変換処理

活字の書籍に非常に有効。漫画や写真などでは目視のみで対応しています。

ページサイズ異常値検出

スキャンの工程では、データ不良の原因となる重送や滑り、読み取りガラスの汚れなどが生じます。これらの原因が生じないように対策すると同時に、データ不良を確実に検知していくことが大切です そこで私達は、スキャンして作成したデータの全ページの縦と横の長さをシステムで計測することにしました。計測後、他のページと比較することで、異常値を検出し、目視で見落としがちなデータ不良をできる限り補足しています。

ページサイズ異常値検出

自社開発の目視検品システム

熟練スタッフによる目視検品をおこなうシステムで、チェック項目は、全部で14項目。落丁、ページ折れ、ゴミ混入(髪の毛や付箋など)、傾き、歪み、破れ、紙粉スジ、サイズ異常、ページ順番、上下逆、スキャンモード、奥付け、中表紙、ブックカバー。
検品するスタッフの選考は、スキャンや修正作業などを6ヶ月以上おこなっていて、検品者として相応しいかどうかを試験したのち決定されます、つまり、仕事をもっとも深く理解している人材が検品作業に従事しています、検品作業は、誰にでも簡単に出来る作業ではないのです。

自社開発の目視検品システム