スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
line

本を電子化し更に音声合成へ

 以前の記事本を裁断せずに綺麗にスキャンできるスキャナOpticBook 3600で紹介したプラステック社のブックスキャナですが、日本代理店であるエニスルのHPを見ると他にも興味深い商品がいくつかありました。

 まずはOpticBook A300
A3タイプのブックスキャナで、それだけだとスキャンサイズがA3になっただけだと思いそうですが大きな違いが。
 それはスキャナの読み取り位置。
 OpticBook 3600はスキャナの縁から6mmの位置からスキャンできましたが、OpticBook A300はなんと縁から3mmの位置からスキャンできるそうです。
結果、OpticBook 3600では本の背表紙接合部から約8mmの位置から読み取っていたのが、OpticBook A300だと約4mmの位置から読み取れるようになるとのこと。

 4mmだと裁断機を使って本をばっさり裁断したのと遜色ない出来だと言えます。
 ただし受注生産品だそうで価格は186,480円(税込み)
ちょっと個人では手が出せないなー。図書館に置いてあれば使いたい(^^;


 さて、表題の音声合成ですが、plustek BookReader BATという商品です。
 価格は87,150円(税込み)はけして高すぎるという価格ではないでしょう。
 ビデオを見たところ本体はOpticBook 3600で、OCRソフトと音声合成ソフトを添付し連携機能でスキャンから読み上げを1タッチで実現しているようです。
日本語のデモ 英語のデモ

 デモビデオをご覧になれば判りますが、なかなかの出来です。
特に英語の音声読み上げは秀逸!
下手な英会話ソフトを購入したり英会話学校に行くより、このセットを買って好きな本の原書を音読して貰った方が長続きすると思います。
多分そういう需要向けに英語専用モデルも売られています。価格も70,350円と日本語・英語両対応モデルより17,000円ほど安く設定されていてお買い得感があります。
 日本語の音声読み上げもなかなかの出来なのですが、「認識中」の音声は変えた方が良いかと・・・

 さて、世の中にはこういう商品もあるんだと気づくと次に、高価なセットを購入しなくても無料で出来ないのかと考えますよね?
 ありました。無料の日本語音声合成ソフト棒読みちゃん
フリーウェアですがカンパは歓迎するとのことなので、十分な価値があると判断された方はカンパをしてあげてください。

 Skype、Twitter、2ちゃんねる専用ブラウザの読み上げにも対応している力作のようです。
私は上記のどれも利用していないので判りませんが、テキストファイルの読み上げはなかなかの物でした。
 音声を男性・女性・ロボットなどから選択でき、スピード調整も可能です。

 更に調べてみるとこんなページが 他にも色々出てるんですね。
 早速Adobe Reader 9を試してみました。

 残念ながら私のpcはOSがWindows 7なので日本語の読み上げは不可能な模様(;;
Windows XPや2000を使用している方はアドビ社のこのページの方法で利用できるようです。

 また、視覚に障碍のある方及び視覚に障碍のある方をサポートされる方向けに、MicrosoftがWindows 7 に対応した日本語音声合成エンジンを無償(数量限定)提供しているようです。お心当たりのある方は利用されてはいかがでしょう。

 で、Adobe Reader 9の英語音声読み上げ機能は!?

 速いよお姉ちゃん・・・
 もちっと手加減しておくれよ!

 発音はいいんですけど速すぎてどこを読んでいるんだか(@@
時々入る'アクセント'を探して右往左往(しばらくして意味はわかりましたw)
 使い方はまず(表示 - 読み上げ - 読み上げを起動)
次に(表示 - 読み上げ - このページのみ読み上げる)
 マウスでクリックすれば、文節というか改行で区切られた範囲だけを読ませることもできます。
繰り返し読んで貰うには便利な機能ですね。

 なんどか聞いているとだんだん慣れてきて余裕も出てきました。
うーん、かなりいい出来です。
OCRの認識(正解)率と合わせればかなり使えそうです。
英語圏すごいなー・・・













http://pdfhon.web.fc2.com/
スポンサーサイト

theme : 電子書籍
genre : 本・雑誌

line

Adobe Acrobat 9 StandardのOCR機能

 ScanSnap S1500にはAdobe Acrobat 9 Standard版が添付されています。
このAcrobatの機能に画像ファイルのOCR機能が有り、JPGファイルなどから検索可能な文字列を埋め込んだPDFを作成することが出来ます。

 この埋め込まれた文字を全て選択-コピー-テキストエディタ等でペーストすることによりテキストファイルとして利用することが出来ます。

 画像補整、傾き補正を加えたファイル
org 01-02

 OCR結果
++++++++++++++++++++++++++++++++++++++++++++++++++++++
10
人影は別段、気を悪くした風もなく、
「では、言おう。私をクラウハウゼンの村まで送ってもらいたい」
ここから西へ二00キロ||辺境の果てにある村である。果てといっても、
しゅんげん
数千メートル級の山脈が峻厳とそびえ立つばかりだ。
寸ひとりで行けぬ身でもあるまい」
その向こうには
と馬上の戸は言った。
「それがそうもいかん」
と青い人影は川合えた。
ヘ主がんす占ぴぼう
したたり落ちるような金髪と碧眼。凄まじい美貌の主であった。月光がそれに神秘さをつけ
力日

周囲の万物をかすませてしまいそうだ。
ただひとり
「その村には私の訪問を歓迎しないものがいる。近づけば、たちどころに迎撃してくるだろう。
正直、ひとりでは自信がない。君の助けがいるのだ、nuト4F」

「おれの同行を求める理由をきこう。腕に自信がないなどとは言わぬことだ」
「ひとつはもう、わかっているはずだ。
それを発してもらいたい。
もうひとつは言えん。その村に待っている相手は貴族
これで勘弁してくれたまえL
/1 J)ー青白き堕天使l
Dは無言で奇妙な依頼主を見つめた。彼に貴族の抹殺を求めるのは、確かに筋、が通っている
カf
現由を口外しないのはルル違反であった。先刻からDの態度はどこか不可思議であった。
彼は背を向けた。
「待ってくれ」
パラlジュが呼びかけた。
「肉親の恥をさらしたくはなかったが、仕方がない。
と申一円い山川町
クラウハウゼンの寅放の名は、


ド・パラlジュ。私の父親だ」
..,
な馬
ぜ首
父が
をP 再
影~革び
す'巡
るつ
のた
か。




し〉



し当

し〉

とパラlジュは硬い声で言った。
「私は父を姥さねばならない。4晶、
余計な奴らを相手に力を削ぐわけにいかん。それだけが目的だ。
吸血鬼ハンターが貴族の依頼を受けるなど、前代未聞の話だろうが、承諾し曲げて頼む。
てはくれまいか?」
吸血鬼が、
これは沈黙せざるを州何まい。
まさに彼らを滅ぼすための存在に助力を依頼し、しかも、自ら狙う敵が肉親であ
沈黙があった。Dとはいえ、
++++++++++++++++++++++++++++++++++++++++++++++++++++++
ルビ、ノンブル(ページ番号)が文中に現れ、一部横書きと認識されています。


 更にMeTilTranを使ってルビ、ノンブル(ページ番号)を削除、行間を広くして再配置
MeTilTran 01-02

 OCR結果
++++++++++++++++++++++++++++++++++++++++++++++++++++++
人影は別段、気を恕くした風もなく、
寸では、言おう。私をクラウハウゼンの村まで送ってもらいたい」
ここから西へこ00キロ辺境の果てにある村である。果てといっても、その向こうには数千メートル級の山脈が峻雌とそぴ
え立つばかりだ。
「ひとりで行けぬ身でもあるまい」
と町内上の声は言った。
寸それがそうもいかん」
と背い人彩は川合えた。
したたり落ちるような金援と碧眼。凄まじい美貌の主であった。月光がそれに神秘さをつけ加え、周閣の万物をかすませてしま
いそうだ。
ただひとり
「その村には私の訪問を歓迎しないものがいる。近づけば、たちどころに迎燃してくるだろう。正直、ひとりでは自信がない。君の
助けがいるのだ、Dよ」
「おれの同行を求める理由をきこう。腕に自信がないなどとは一言一わぬことだ」
寸ひとつはもう、わかっているはずだ。もうひとつは言えん。その村に待っている相手は訟玖た。それを銘してもらいたい。
、,

れで勘弁してくれたまえ」
Dは川県吉一同で脊妙な依頼主を見つめた。彼に訂版の抹殺を求めるのは、般かに筋が通っているが、副叫山を口外しないのはルル逃
反であった。先刻からDの態度はどこか不可思議であった。
彼は坤Hを向けた。
「待ってくれ」
と州Hい山川町パラlジコが仰びかけた。
「肉親の恥をさらしたくはなかったが、Ir--、;; 利υ1'L古品yb クラウハウゼンのお族の名は、ヴラド・パラージュ。私の父親だL
市内首が一山び巡った。
「なぜ父を詠するのかは訊かないでもらいたい」
とパラlジュは硬い戸で言った。
「私は父を姥さねばならない。それだけが目的だ。余計な奴らを相手に力を削ぐわけにいかん。吸血鬼ハンターが民族の依頼を受
けるなど、前代未聞の認だろうが、山げて頼む。承治してはくれまいか?」
沈黙があった。Dとはいえ、これは沈黙せざるを川何まい。
酬明刷出品が、まさに彼らを減ぽすための存在に助力を依頼し、しかも、自ら狐う敵が肉税であ
++++++++++++++++++++++++++++++++++++++++++++++++++++++

 ルビ、ノンブル(ページ番号)が消え、段組の誤認識は無くなりましたが一部順番が入れ替わっている行もあり
漢字の誤認識はまだまだ目立ちます。

 わずか2ページでこれだけの誤変換があるのですから、250ページもの修正はやってられません。
なにせ読むのは自分1人なんですから。
 JPGのまま読むか、PDFに検索(補助)用として透明なまま埋め込むのがいいところでしょう。

 考えてみれば紙に印刷された文章は絵と言えます。検索なんてそもそもできません。
JPGのまま読んだからと言って不便になるわけでもありません。
ファイルサイズがテキストと比べると大きいのは難点ですが、このくらい圧縮してもとくに文字が崩れるわけでもありません。

M 01

 高級なOCRソフトの認識率は95%くらいだそうですが、それでも100文字中5文字は誤認識するわけです。
仮にこれが99%まで上がったとしても100文字中1文字は間違えるわけで、1行が40文字なら5行に2個誤りがあることになります。
将来99.9%まで上がったとしても1000文字中1文字は・・・結局本を廃棄することを考えたらチェックせざるを得ません。

 本気でテキスト化を考えるのであれば、むしろチェックの方法を工夫した方がよいでしょう。
例えば複数のOCRソフトにかけ、異なる結果になった場所だけピックアップしてチェックするとか。
 実はMeTilTranのオプションを少し変えるだけでもOCR結果は微妙に変化します。
正しく認識できるようになる場所もあれば、逆に誤変換してしまう場所もあります。
 それ以前に600dpiでスキャンした方が効果が大きいかも?

<追記>
 かも? と思ったので600dpiでスキャンしなおしてみました(資源ゴミの回収日に出し忘れたので残ってたw)

 結果は・・・いいかも?
 もちろん認識率(正解率)は100%じゃありません。
だけどかなり検討しています。このままでも読めないこともない・・・

 けれど数文字無かったことにされている場所も2カ所ほどある。
他の文字と比べて差があるとも思えないのですが、Acrobatの処理が理解できません。

 うーん、しかしこれは困った
OCR前提なら600dpiでスキャンしないといけない。
もちろん600dpiでもフラットベッド型のスキャナに比べたらかなり早いんですけどね。


++++++++++++++++++++++++++++++++++++++++++++++++++++++
人影は別段、気を悪くした風もなく、
「では、言おう。私をクラウハウゼンの村まで送ってもらいたい」
ここから西へ二00キロ辺境の果てにある村である。果てといっても、その向こうには数千メートル級の山脈が峻厳とそびえ立つばかりだ。
「ひとりで行けぬ身でもあるまい」
と馬上の声は言った。
「それがそうもいかん」
と青い人影は答えた。
したたり落ちるような金髪と碧眼。凄まじい美貌の主であった。月光がそれに神秘さをつけ加え、周囲の万物をかすませてしまいそうだ。
ただひとり馬上の騎主を除いて。
「その村には私の訪問を歓迎しないものがいる。近づけば、たちどころに迎撃してくるだろう。正直、ひとりでは自信がない。君の助けがいるのだ、Dよ」
「おれの同行を求める理由をきこう。腕に自信がないなどとは言わぬことだ」
「ひとつはもう、わかっているはずだ。もうひとつは言えん。その村に待っている相手は貴族だ。それを廃してもらいたい。これで勘弁してくれたまえ」
Dは無言で奇妙な依頼主を見つめた。彼に貴族の抹殺を求めるのは、確かに筋が通っているが、理由を口外しないのはルlル違反であった。先刻からDの態
度はどこか不可思(議)であった。
彼は背を向けた。
「待ってくれ」
と青い影パラlジュが呼びかけた。
「肉親の恥をさらしたくはなかったが、仕方がない。クラウハウゼンの貴族の名は、ヴラド・パラlジュ。私の父親だ」
馬首が再び巡った。
「なぜ父を諒(誅)するのかは訊かないでもらいたい」
とパラlジュは硬い声で言った。
「私は父を艶(斃)さねばならない。それだけが目的だ。余計な奴らを相手にカを削ぐわけにいかん。吸血鬼ハンターが(貴)族の依頼を受けるなど、前代未聞の話だろ
うが、曲げて頼む。承諾してはくれまいか?」
沈黙があった。Dとはいえ、これは沈黙せざるを得まい。
吸血鬼が、まさに彼らを滅ぽすための存在に助力を依頼し、しかも、自ら狙う敵が肉親であ
++++++++++++++++++++++++++++++++++++++++++++++++++++++

”|”は縦書きなら正解。
”誅”と”斃”の字を誤認識していますが2ページで2文字なら大した物!
ただ判らないのが、不可思(議)、(貴)族の2文字をなぜか無視しているところ。他の箇所の”貴族”は正解しているのに?
 貴方の方が不可思議だよ"Acrobat"!







http://pdfhon.web.fc2.com/

theme : 電子書籍
genre : 本・雑誌

line

裁断機を使うときのコツ

 裁断機PK-513を使って本をバラバラにしているんですが、ちょっと気を抜くとアレレ?な事に

20100301.jpg

 右は気を入れて切った時。 左は気を抜いた時です。
右のものを上から下まで幅が均一ですが左のは下に行くほど広がって台形に。
当然切り離された本のページの方は後のページほど幅が狭くなることになります。
見開きページがあるとアレレ?な結果に。

 気を入れるのと抜くのは何が違うか?
本を押さえながら切るかどうかですw
 本を置いてそのままガシャンとやると微妙に本が引きずられると思われ左のような結果に。
しっかりと本を押さえて切ると右のようになると。

 裁断機を使う方は気にした方が良いですよ。







http://pdfhon.web.fc2.com/

theme : 電子書籍
genre : 本・雑誌

line

ScanSnapはJPGで格納した方が良い

 前記事の原因というか、2度読み込む事になった理由は
1度目にPDFで読み込んで失敗したのでJPGで読み直したんですよ。
で、線に気づいて慌てたと・・・

 なぜJPGで読み直したか
PDFからJPGを取り出したところ、とんでもないことが判ってしまって
それは

 PDFで回転とかトリミングをしてもファイルは修正されていない

おそらく、PDF内の管理データのみが書き換わっていると思われます。
つまり、表示するときにこの画像は90度回転してね とか
表示するのは座標(X1,Y1)(X2,Y2)だよ、みたいな情報が追加されてるだけで
元の画像を修正したわけではないと

 ということは、せっかくPDFファイルを修正してもJPGで取り出すと元の木阿弥
全部無駄ってことです。

 必ずJPGを取り出すとは限りませんが、オリジナルデータとして取っておくには適さないなと
それでJPGで取り直したわけです。
JPGファイルからPDFを作るのは簡単ですからね。
劣化無しでPDF化できますし。

 ということで、ScanSnapでスキャンする時はJPGで格納した方が良いと思います。








http://pdfhon.web.fc2.com/

theme : 電子書籍
genre : 本・雑誌

line

ScanSnapで同じ原稿を何度も読ませると

跡がついちゃいます・・・

 最初は汚れが付いたのかと思っていたのですが、原稿を見ても汚れていない
 不思議に思いながらなにげに原稿を見ていると・・・おや?
さっきは気づかなかった薄線が・・・こ・これは!
ローラーの跡でした Orz

 1度のスキャンでは現れないのですが、2度スキャンするとほぼ確実に黒っぽい線になります。
おそらくかなり近い位置をローラーが2度通ることにより、光の反射が乱れる箇所が出来て
それが線になって現れるのだと思います。

 対策は原稿の向きを変えること。
縦横を変えてスキャンすれば綺麗に読めます。

 ということは、同じ原稿は2回までしか読ませられないと思っていた方がいいです。
裏返しにするとか、原稿をセットする位置をずらしたりすればいけるかもですが・・・

 スキャンしたデータは直接いじったりせずに、必ずコピーを取りましょうって事ですね。







http://pdfhon.web.fc2.com/

theme : 電子書籍
genre : 本・雑誌

line
line

FC2Ad

line
プロフィール

本をPDFに

Author:本をPDFに
FC2ブログへようこそ!

line
最新記事
line
最新コメント
line
最新トラックバック
line
月別アーカイブ
line
カテゴリ
line
FC2アフィリエイト
line
検索フォーム
line
RSSリンクの表示
line
リンク
line
ブロとも申請フォーム

この人とブロともになる

line
QRコード
QRコード
line
sub_line
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。