デジカメで写した中国語文字をフリー中国語OCRでテキスト化

2008年5月27日火曜日

デジカメで写した中国語繁体字をテキスト化したい時、中国語を知らなくても日本語とフリーの中国語文字認識ソフトCOCR2を使うと、可能になります。その過程を大まかに記すと

(1)デジカメで写した小樽市指定歴史的建造物「旧大家倉庫」
image 
(2)テキスト化したい所をPicasa2でトリミング
image
(3)Picasa2で傾き調整
image
(4)Picasa2でコピーしJtrimで貼り付け
image

(5)「カラー/グレイスケール変換」
image
(7)「カラーネガポジ変換」
image
(8)「カラー/明るさ・コントラスト」で背景のグレイが消えるまでコントラストを強くする。
image

image
(9)これをCOCR2に貼り付け
image
(10)右側のエリアをクリックしフォントをMingLiu等の繁体字文字にする。
image
(11)候補に出た文字をクリック
image
(11)日本語文字と同じ所は日本語IMEで変換、読めない所はCOCR2でと言う様に変換していく。
image 
image
テキストで表すと
為石川縣出身的海產商人一大家七平(Ohie Shichihei)所建造的,與建築物垂直的牆壁上有(山七)的印記.外牆採用札幌軟石,高出的小屋頂和入口部分的雙層拱門為其特徵.建造物的宏偉和其獨特的外貌,成為運河地區石造倉的代表之一,2002年,曾進行外牆和屋頂瓦部分等的維修. 小樽市

※関連ページ
中文画像を中国語OCRでテキスト化する方法
・Googleのデジカメ編集フリーソフト「Picasa2の使い方
・フリー画像編集ソフト「JTrimの使い方
小樽観光(冬の小樽、春から秋へ、回転寿司、駐車場)

0 コメント: