OCRソフトを使う

紙で受け取った文書をコンピュータにスキャナーで取り込み,ワープロソフトで読めるように変換するのがOCRソフトです.以下では,OCRソフトe.Typist 2.0の使い方を説明します.スキャナーはScanJet3Cを利用します.

●日本語原稿の場合
1 e.Typistを起動します.

2 スキャナ ScanJet 3C に原稿を裏返して載せます.

3 オートツールの左の三角マークをクリックして,スキャンする原稿に合わせて,設定を変えます.
例えば,横段組かどうか.段組原稿でない場合は初期設定のままで結構です.
初期設定:枠:「デフォルト」,種別:「文章」.レイアウト設定:「段組自動」,認識言語:「日本語認識」,改行出力:「ブロック改行」,文字種指定は全部チェックを入れます.

4 e.Typist のツールメニューから「スキャナ」をクリックします.

5 プレスキャンで読み取る範囲を選択します.

6 スキャンで本スキャンが始まります.終わると,終了をクリックします.

7 認識ツールをクリック
認識ツールでは,スキャン画像を元にして,日本語への変換作業が開始します.このとき少し時間がかかります.変換作業が終わると,画面の下半分に変換したテキストウインドーが,上半分にはスキャン画像ウインドーが現れます.ここで完全に変換できていれば,以下の8と9の作業は不要です.通常はこの段階で100%正しく変換されていることはありません.95%ぐらいは正しく変換されているでしょう.

8 解析メニューから「全文解析」を選びます

全文解析は変換したテキストをチェックします.正しく変換したとソフトが認識した部分は青色,変換が正しくないと認識した部分は赤色に表示されます.

9 誤変換の修正

方法1:テキストウインドーの誤変換の文字を消して,正しい文字をタイプします.
方法2:誤変換文字の部分をコマンドキーを押しながら,マウスを押し続けると,正しい候補の漢字一覧が現れるので,そこから選びます.
方法1の方が簡単です.なお,テキストウインドーの文字を選ぶと,スキャン画像のその部分に相当する部分が表示されるようになっています.

(注意)青色部分にも誤って変換されている部分があるのでチェックすることが必要です.

(ヒント)段組の原稿の場合は,認識設定のところで,必ず段組の設定と「毎行改行」を選ぶこと.自動判別ではうまくいきません.

10 チェックし終わったらテキストの保存
ファイルメニューから「別名で保存」を選びます.テキストはe.Typistの「テキストフォルダ」の中に保存されます.スキャンした原稿は同じく「画像フォルダ」の中に保存されています.

(注意)スキャン画像は,e.Typistの画像フォルダに自動的に保存されます.

●手書き原稿の場合

よほどきれいに清書していないと,解析は事実上無理です.手書き原稿は使わない方がよいでしょう.

●英文のスキャン
1 英文原稿をスキャンする場合は,オートツールの設定のところで,認識言語:「英語認識」を選びます.
2 段組の原稿の場合は,オートツールの設定のレイアウト設定で「横多段」を選びます.
3 プレスキャンを実行.これから以下の作業は日本語の場合と同じです.

[top] [マッキントッシュ使いこなし自由自在に戻る]


Mail to: sasayama@kumagaku.ac.jp
Copyright(C) Kumamoto Gakuen University