【無料】OCR なら Google ドライブ!

最終更新日

ここ最近、Google ドライブで OCR をやってもらっていました。
ようやくなんとなく使い勝手がわかってきたので、ここでまとめます。

…いやー、無料でここまでできるって、本当にすごいですね…。

いいじゃないか! ただ だし。

そればっか…。

はじめにまとめ

Google ドライブの OCR は、Google アカウントさえあれば無料でできます。
対応しているファイルのフォーマットは

  • JPEG
  • PNG
  • GIF
  • PDF (複数ページ対応)

です。特に、PDF が便利!

基本的に、本の1ページ相当分くらいなら1分もあればできてしまいます。
やり方は超カンタン。

  1. Google ドライブにテキストの入った画像ファイルをアップロード
  2. 画像ファイルを右クリック → アプリで開く → Google ドキュメント を選択
  3. 数分待てば完成

で終了です。
そして、精度はバツグンです。

しかも無料ですよ!

OCR ってなに!?

まぁ、やり方を見に来た方がほとんどだと思いますので、さらっとだけ紹介すると、

OCR (Optical Character Recognition/Reader、光学的文字認識)
手書きや印刷された文字を画像として読み取り、
それを文字情報に変換する技術のこと

画像として持っている本のデータとかを、テキストデータに文字起こししてくれる技術です。
以前は OCR も専用のソフトを購入したり、
スキャナを買ったときに同梱されているソフトを使ったりしないとできなかったんですが、
今はこんな感じで手軽にできてしまいます。

今回紹介する Google ドライブの他には、

  • LINE で文字情報のある写真を撮ると、OCR してくれる
  • (Google ドライブと同様に) OneDrive に画像ファイルをアップすると
    OCR してくれる

なんかがあります。
手軽にパシャっとできるのは LINE ですかね。

なんでそんなことするの?

今回、文字情報がたくさん入った画像を OCR したかったからいろいろ試していました。
なぜかというと、本を読み上げしてほしかったからです。
読みたいと思った本が、Kindle で発売していなかったんですね…。

Kindle で発売、さらに TTS: 有効 にしてくれていれば、
こんな苦労しなくてよかったのに…。

なのでしかたなく、いわゆる『自炊代行』に画像化をお願いしました。
とてもスピーディーに画像を納品してくださったんですが、
OCR にちょっと不満が…。

  • 文章の表示通りにムダに改行されてしまっている
  • ヘッダー・フッターの情報も入ってきてしまう
  • 挿絵や表の文字なども入ってきてしまう

OCR をかけた文字情報の場合、行の終わりで改行されちゃっていることが多いですよね。
樹にしなきゃいいんでしょうけど、気持ち悪い。
あと、本ってだいたい、ページの下部(フッター)とかに
ページ数とか章のタイトルとかが入っていますよね。
OCR すると、そういうのも文字情報として入ってきてしまうんですね。
そういうのも気持ち悪い。とっても。
あと、挿絵とか表とかが入っていると、そこの文字情報も入ってきてしまう。
よくわからない文章になっちゃうんです。
それがとっても気持ち悪い。

今回読もうと思っていた、
『相手は変えられないならば自分が変わればいい』ラス・ハリス(著)です!

コレってもしかして…。

そそそ、メンタリスト DaiGo さんの質疑応答でスパチャして、
ビブリオセラピー的に処方された本ですよ!
初スパチャだったから、空のスパチャを打ってしまうところまで形式美!

この目次の OCR してもらった情報はこんな感じ。

conte∩ ts
はじめに
(第1部)
第1章
第2章
(第2部)
第3草
第4章
恋愛とは骨の折れるもの
素晴らしい愛が台無しに6
恋愛はミッション・インポツシブル? ′
あなたが抱えている問題は何か? %
誓いを立てるソ
続けるべきか、別れるべきか? ”
タンゴは二人でないと踊れない? お

まぁ、目次なので横方向縦方向入り混じってますし、
文字の太さとかも違うので大変だと思いますが、コレだとちょっと…。

わたしは別で PDF 作成ソフトを持っていて、
その中に OCR の機能もあったので使ってみたんですが、
精度はイマイチだし、上記のことは解決されていないし、で
使うのをやめました。

さて、同じファイルを Google ドライブで OCR した場合の結果は…

はじめに | 恋愛とは骨の折れるもの
contents
第1 部) 素晴らしい愛が台無しに 店
第1章 | 恋愛はミッション・インポッシブル? 7
第2章 – あなたが抱えている問題は何か? 。
(第2部) 「誓いを立てる 」
第3章 – 続けるべきか、別れるべきか? % 第4章 | タンゴは二人でないと踊れない? –

かなり実用的なレベルです。
ページ番号は小さいからかほとんど認識されていませんが、
縦書き・横書きの混在している文章でもちゃんと認識してくれています。
章・部とそのタイトルもちゃんと1行で並んでいます。
いや~すごい。

読み上げてもらうまでの手順

さて、画像だけはあるので、そこからどうやって文字情報を抽出するか。
しかも、いらないノイズを無くした状態で。
今回の手順を下に紹介します。

1. PDF から画像を抽出する

『自炊代行』から納品してもらったデータは PDF です。
まずはその PDF から画像データを抽出するところから始めます。

PDF から画像を抽出するソフトはいろいろあると思いますが、
わたしは『画像梱包』というフリーソフトを使用しました。

画像梱包 – Vector

このソフト、実行するとタブが2つ出るんですが、
今回はそのうちの『開梱』を使います。
使い方はかんたん、その開いているソフトのウィンドウに
PDF をドラッグするだけ。

そうすると、もとの PDF を保存している場所に
PDF タイトルのフォルダができて、
その中に画像がだーーーーっと保存されます。
シンプルで便利。

なぜか最終ページから順番にナンバリングされますが、
後から直せばいいので今は放っておきます。

2. 画像のいらないところをトリミングする

本の画像だと、先程も書きましたが
ページの上部(ヘッダー)や下部(フッター)に

  • 章のタイトル
  • ページ番号

なんかの情報が入っているときがあります。
コレを OCR で読み取ってしまうと、
文章の間にその情報が入ってきてしまって
よくわからない文章になってしまいます。

本のレイアウトってだいたいどのページでも同じなので、
本文が書いてある部分だけ切り取ってしまいたいですよね。
同じ作業を200ページ以上やるのはだるい…。
なので、『Ralpha』というフリーソフトを使用して
一気に全ページ同じ処理をします。
いらない部分をトリミングして必要なところだけ残します。

一斉処理する画像をすべてドラッグし、右側の『トリミング』にチェック。
その後にその右の歯車マークをクリックすると、
その中の画像の1ページが表示されます。
その画面でトリミングする範囲を指定することができるので、とっても便利です。
そして実行(F5ボタンを押す)するとその範囲で一括でトリミングができます。
これで、ヘッダー・フッターのない、本文だけの画像データができあがります。

3. いらない画像・いらない挿絵などを消す

画像をざっと見て、いらない画像ファイルを削除してしまいます。
具体的には、

  • 目次のページ (読み上げてもらわなくていいから)
  • 空白のページ
  • 表や挿絵 (文字情報としてはイラナイ)

などです。
いらないページはそのまま削除してしまって、
表や挿絵の文字情報としていらない部分は
画像をペイントなんかで編集して消してしまいます。

挿絵とかが多い本だと、コレが結構めんどい…。

文字にふってあるルビ(ふりがな)も消していたんですが、
ふと思い立って消さないでみたんです。
それで OCR 変換してもなんか影響ないっぽかったので、消さないことにしました。

4. 画像の名前を昇順の連番にする

コレで下準備が完了しました。
これからこの画像を PDF に戻すんですが、
念のため各画像の名前を昇順の連番にします。
フリーソフトですと、『Flexible Renamer』あたりが便利かと思います。

Flexible Renamer

わたしは、すみません、
今回は自分で作った Excel のマクロでざざっと名前変更してしまいました。

5. 画像を PDF に変更する

できあがった画像を PDF に戻します。
ここで注意なんですが、
その100以上の画像ファイルを1つの PDF にしてはいけません。
画像をいくつか選択して、合計が 10MByte くらいになるファイル数で
PDF 化してください。

めんどくさいですが。
大体20~30ページくらいで1つの PDF にしてください。
1冊で10個以上の PDF になっちゃいますけど…。

ファイル名は、『1-20.pdf』のような名前にすればわかりやすいかもしれません。

PDF 化するときに使うと便利なのは、
PDF から画像を抽出するときに使ったのと同じ『画像梱包』です。

今回は『梱包』タブの方を使います。
合わせて10メガくらいになる画像ファイルを選択し、
そのままウィンドウにドラッグアンドドロップ、名前をつけて保存、
で完成です。
作るのも一瞬ですね。

6. Google ドライブで OCR してもらう

さて、今回のメインディッシュである Google ドライブでの OCR です。

…と言っても、この作業自体はすぐに終わってしまいます。
手順としては、Google ドライブのどの場所でもいいので、
先ほど作成した PDF をアップロードします。
ドラッグアンドドロップで OK です。

アップしたファイルを右クリックして、
アプリで開く → Google ドキュメント として、2~3分待ちます。

するとあら不思議、Google ドキュメント(Google 版の Word)が開き、
中にはアップした PDF の OCR 結果が入っているではありませんか!

いやー、すごいね!
ホント感動します。ただだし。

右クリック → アプリで開く → Google ドキュメント は
複数のファイルで同時にやって OK です。
待ち時間は長くても5~10分、10分経過しても OCR 結果が表示されない場合は
おそらくファイルの大きさが問題だと思うので、
できなかったファイルを2分割してそれぞれアップして行ってください。

大きいファイル、一晩待っても OCR されませんでした。

待ってたのね…。

待ってたよ…。できなかったけど…。
と言っても、PC 放置しておいただけだけどさ。

7. ダウンロードして1ファイルにまとめる

できあがった Google ドキュメントのファイルを選択して、
右クリックなどからダウンロードします。
Word ファイルの形式( .docx )でダウンロードできますので、
まず1つ目のファイルを開き、
2つ目のファイルを開いて全選択からコピー、1つ目のファイルのお尻に貼り付け…
とやって、1ファイルにまとめます。

若干面倒ですが、そこまで時間がかかる作業ではないので。

8. 最後に編集

さて、ここまで来たらあと少しです。
文字情報として手に入ったデータを少しばかり編集します。
…ガッツリやると2時間とか平気でかかってしまいます。
あまりに時間がかかりすぎると本末転倒ですので、適度にやりましょう。

ざざっと見て、

  • 変な文字が入っている → 消す
  • 変な改行が入っている → 消す
  • タイトルなどの『■』とか『●』とかが抜けている → 必要だと思うなら付け足す
  • 数字が抜けている → 付け足す…か、もう無視する

とかでしょうか。
読み上げてもらう際に音に問題がなさそうなら放っておいても構いません。

凝りだすとやばいです。まじで2時間半とか経過していました。
その間に1冊読めるだろ~となります…。

文字の OCR ミスはほとんどないな、というのが感想です。
わたしが見つけられたのは、『脱』という字が『脫』という字になっていたくらいでした。

読み上げの方法

さて、完成した Word のファイルですが、
わたしは『Librera』というフリーのアプリで読み上げをしてもらっています。

Librera – すべての本を読む、PDF Reader

このアプリから直接 OneDrive のファイルを読むことができるので、
わたしは完成したファイルを OneDrive に置いています。

Amazon Fire HD8 に Librera を入れて読んでもらっていますが、
音声は Fire HD8 の Kindle の音声と同じ人(?)ですね。
Kindle よりも読み上げミスは多いな、という印象ですが、実用には全く問題ないです。
いやー、ありがたい。

わたしの耳元で何時間も本を読み続けてくれる人なんていませんよ!
本当にありがたい…。

まぁ、いたらいたで怖い光景だけどね…。

『Librera』は有料版もあります。
本当に助かっているので、有料版を購入しました!
機能的には広告が入らなくなる程度かもしれませんが、
便利なものを作ってくださった作者の方へのお礼を込めて。

【番外編】Kindle ってスクショできるんですよ…

タイトルのとおりですが…。
PC にもKindle のソフトってありますよね。
買った本で『TTS : 有効』になってなくて読み上げてもらえない本の場合、
Kindle のソフト上で開いてスクショ撮れば、
上記の工程で文字の画像をゲットすることができます。

でもめんどいじゃん。本ってだいたい200ページとかあるし。

たしかにそうですね。
でも、Kindle って2ページ見開きとかにできます。
そうすれば、300ページでも150回のスクショです。
1秒に1回スクショ撮れば、2分半で終わります。
『PrintScreen』キーと『→』とか『←』とかのキーを交互に押すだけです。
それも面倒なのであれば、昔からあるソフト『WinShot』には
『定期実行』と『キャプチャ完了時に音を鳴らす』という便利な機能があります。

WinShot – WoodyBells

『定期実行』の設定で1秒毎にスクショを撮るようにして、
『完了時に音を鳴らす』設定にしておけば、
音がなったら『→』『←』を押すだけでスクショが撮れます。

わたしも VBA とかでもいいから
自動でスクショするようにしようかと思ったんですが、
それ作ってる時間でスクショできるなぁ…と。
そんなにたくさんあるわけじゃないし。

最後にまとめ

Google ドライブでの OCR の使い方をまとめました。
コツとしては、

  • 画像は本文だけにするために、必要な部分だけトリミングする
  • いらない部分は消す
  • 画像のサイズが合計10メガになる程度ごとに PDF 化する
  • OCR に必要な時間は5分程度、それ以上かかるなら分割して再度アップする

という4点でしょうか。
Google ドライブでの OCR、とっても便利なので、ぜひご活用ください。

耳読がはかどるね!

さちこ

シェアする

コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA


コメントする