« (思い出す本 忘れない本)『三四郎』 | トップページ | 内田康夫【箱庭】 »

2013.09.16

作業工程

読取革命


昨日、道尾本と東野本が届いた。

東野本はTRCの情報が未だなので仮の書誌にしておいて(表には出ない)、道尾本から取りかかる。
中身を見ずして、解体する。但し、自炊ではない。

まず、カッターでカバーと本体に切れ目を入れてグイッと外側へ曲げる。そして、そろそろと取り外しにかかる。
中身だけになったものを、さらに少しずつわけて、カッターで端を揃える。勿論この場合のカッターとは、ナイフではなく裁断機のこと。

端っこがきれいに揃ったら、今度はドキュメントスキャナーにかける。要するに、手順としては自炊と同じだ。
が、ここからが多少違う。

スキャンしたものはPDFである。これを「読取革命」に読み込んで、テキストを抽出する。「読取革命」にはハイパーチェッカーという機能があって、原本(画像)と抽出したテキスト文字を並べて見比べることが出来る。ここでしっかり(誤認識を)修正しておくと、あとあとが楽である。

あらかじめメモ帳にはページ数を記載しておいて、チェックを追えたテキストを入れ込む。ここで再度文字を確認しながら、改行を外して一つの段落を一本の縄のようにしていく。また、ルビを《》に入れ込む。

ここまでが、かなり地味な作業。あとは専用ソフトを使ってデイジー形式に仕上げていく。


今年入った新人で、非常に戦力になる人がいて、楽しみである。それも、先走るのではなく一つ一つ確認を求めてくるので、応え甲斐がある。

「読む」という仕事は年期がいるし、一朝一夕には出来ない。だが、テキスト文字の校正というのは、PCさえあれば特別なソフトがなくても出来る。現在、その状態を楽しんでいるメンバーもいて、心強い。


画像は、「読取革命」の画面。


|

« (思い出す本 忘れない本)『三四郎』 | トップページ | 内田康夫【箱庭】 »

パソコン・インターネット」カテゴリの記事

書籍・雑誌」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



« (思い出す本 忘れない本)『三四郎』 | トップページ | 内田康夫【箱庭】 »