デジカメで撮影した中国語(簡体字・繁体字)画像を無料でOCRするには

2009年3月14日土曜日

OCRと言えば一般的にはスキャナ使用ですが、デジカメでも可能です。ここでは中国語文字認識フリーソフト「尚書七号OCR」を使用して、小樽市指定歴史的建造物の案内板に書かれている中国語(繁体字、台湾)でやって見ます。
なお、この中国語OCRソフトはWindows XPでは正常に動作しますが、Wondows Vistaで行なうと文字認識の段階でエラーが置きてしまいます。従って、Windows Vistaで使おうとしたら、VMware Player等のバーチャルマシンでゲストOSにWindows XPをインストールする必要があります。
主な手順:
(1)Windows XPの「スタート メニュー/Microsoft AppLocale」内の尚書七号OCRを起動
(2)尚書七号OCRが起動し、デジカメを画像を読み込んだら範囲選択
(3)「文字認識」の言語を「簡繁混合」にします。
image
(4)範囲選択
image 
(5)「文字認識」をクリック
image
(6)RTFで保存
image
(6)保存したファイルをワードパットで起動
(Word 2003で開くと行内でなくテキストボックス内に入る)
image
(7)範囲選択し「コピー」
image
(8)ワード等のワープロに貼り付け
image 
(9)校正
数字、句読点の誤認識が多いのと、「設計」と言った漢字にも間違いがあるので直します。
image 
image
中国語(繁体字、台湾)IMEのSymbolを起動
ソフトキーボード上の,や。をクリックして正しい句読点に置き換えます。

image 
Word 2003を使用して完成した文書 
 image 
※関連ページ
Bloggerで作成した小樽歴史的建造物
VMware PlayerのゲストOSにWindows XPをインストール方法
中国語の簡体字・繁体字OCRフリーソフト「尚書七号OCR」の使い方
Microsoft AppLocale Utilityをインストールしてフリー中国語OCRソフトを使う

0 コメント: