どうもどうも。
先に結論を言うと、アリかもしれない(結論とは)。
今年の春、ようやく会社機のmacOSをMontereyまで上げたんですよ。
業務使用していくうち、クイックルック上でテキストを選択&コピーできるのに気づいて、
うわー、おめーすげー便利じゃんすか、と一瞬だけ盛り上がったんですけども。
ちょっと怪しい結果がちらついたので、使うのやめました。
特性を把握した上で自己責任で使うにはいいんでしょうけど、
追加原稿のちょっぴりのテキストをものぐさに取り込む時など、
つい使ってしまいそうだったのをつよいこころでやめました。
以下、今回の質素な検証内容です。
Illustrator上でテキストを入力してみました。
察しのよいあなたにはもうおわかりでしょうけど、
Helvetica Neue Regularで「Illustrator」と打ち込むことで、
大文字アイと小文字エルの紛らわしいところがうまくできているのか見てやろうってんです。
ついでなので「Adobe」も入れちゃいました。
察しのよいあなたにはもう略でしょうけど、
これ「gdobA」を左右反転したやつです。
スペースが余ったので、小文字オー、ゼロ、大文字オー もなんとなく入れときました。
これをPDFで保存。
それをクイックルックで選択、コピー。
それをInDesignのテキストフレームにペースト。
さてどうじゃ。
おおっ、しっかりと「Abodg」になってる。ほかの箇所も存外に大丈夫だった。
つまり、今回これ、きわめて精度のよいOCRなのではないかと疑っていたんですが、
ちゃんとテキスト情報を拾ってくださってたという結果です。
反転したbとdを正しく拾ってくれてたわけ。
文字ごとに座標のZ順で評価してるのかな。たぶん。
とりあえず、事故るまで使ってみることにします。
でも皆さんはちゃんと慎重にやりましょうね。
うちだけ早く終わらせて早く帰ります。
── 追記 および 追試 ──
ものかのさんからコメントいただいてたのに気付いたのが盆休み明け。うわーすみません。
ということで追試。アウトライン文字はどうだ。
いちおう例によって左右反転したテキスト。
クイックルック上で選択はできそうで、できなさそうで、できそう。だけどぎこちない。
ので、⌘+Aしてコピーした。
InDesignにペースト…んんん、ぜんぶ半角スペースに。。
というわけで、テキスト以外(画像・図形でできた文字)が入っている可能性のあるファイル形式ではちょっと油断しきれないな、という結論に上書きです。
言ってしまえばプレーンテキスト(.txt)以外ほぼ全部、気をつけましょうということに。
なんということだ。
PDFをクイックルックで表示するのは、PDFをプレビューで表示するのと同じです。
クイックルックもプレビューもファイル形式によって表示するエンジンを変えています。
OCRが働くのは画像ファイルを表示した時でけでしょうね。
コメントいただいてたの気付かず堰き止めてましたすいませんっ ありがとうございます!
クイックルック元ファイル中の文字が画像でも図形でもなくテキストであると明確になっている上では油断して使ってっちゃっていい、ということですね?