2010年11月5日金曜日

タイ語、ドイツ語などOCRソフト FineReader10 Pro メモ

タイ、ドイツ出張のため、PDF文書の機械翻訳は、FineReader9のテスト使用で取り敢えず乗り越えたが、試用期限が切れてしまった。
FineReader10がリリースされているので、Ver9はアンインストールして、Ver10をインストールしてみることに・・・
ダウンロードはこちらから・・・
http://finereader.abbyy.com/
手順
1.画面右横の「Try」からダウンロード
2.名前と、E-Mailアドレス入力を要求される
3.入力したメールアドレスに、ダウンロード先のURLが届く
4.https://・・・ のところクリックすると ダウンロードができる
5.fr10pe.exe という374MBytesのファイルを約4minでダウンロード完了(100M回線)
6.ダウンロードしたファイルを右クリック、「管理者として実行」
※Vista,7の場合
7.インストール先はデフォルトのまま
8.言語セットアップは、Englishのまま (※Japaneseは選択肢なし)
9.Acceptして、Nextへ
10.SetupTypeは、Typical選択
11.Ready to  Install Programでは、Run・・、I agree・・とも、チェックオフ
※テスト使用なので特にいらないか・・・という判断
12.インストールが始まる ・・・結構長いです。
アップデートを含めて、約1時間弱かかる。気長に待ち

<起動>
起動すると下記の画面
テスト使用なので、右下の「Run」を選択
タイ語、ドイツ語など、飛行機会社などの現地語表示のホームページをクリップしてテストするので、Other で、ファイルから読み込みを選択
クリップして、jpgファイルに落としたファイルを、右下にある「Open」で開く。
開くとこんな感じ
タイ語の認識は設定してないので、右側は 右側はぐちゃぐちゃですね。
タイ語の認識設定・・・More languageを選択

 Languages with dictionary suppotを選択






ずら~っと出てきた言語の中からThai を選択
OK で言語選択完了
左上のところに、 Document Language:Japanese Thai と出てくる。
ファイルの再認識(読み取り)をしよう。

左に表示されているドキュメントを右クリック。Read Pageをクリックして言語再認識。


これで、タイ語認識で変換される。


うーん、やっぱり、タイ語の認識率は悪いなぁ。後は、必要部分の文字を拡大して画像クリップし、テストしましょう(*^_^*)

ついでに、ドイツ語の場合は、左上のDocument Language選択で、「German」を選択して読み込み、または再読み込みさせる。
こちらは比較的認識率が高い。


読み込んで認識したものは、上、真ん中あたりにあるWordをクリックして、docファイルに変換。Wordファイルを開いて、文字をクリップにコピーし、Google 翻訳に突っ込む。
インターネットのブラウザーでコピーして、Google 翻訳に突っ込んだものと比較。

というパターンでテストする。

0 件のコメント:

コメントを投稿