OCR(Optical Character Recognition/Reader、オーシーアール、光学的文字認識)
OCRは、紙帳票をスキャナー等で画像データ(PDFなど)に記載されている文字を、エクセルなどで扱える文字データに変換する技術のことです。
OCR機能というか、画像の中にある文をテキスト化したい。
ワードの文章の中にYouTube動画に表示されている文を、「Shift」+「Windows」+「S」を押してスクリーンショットしてその画像を貼り付けている。
YouTube動画に表示されている文とは、例えば「ニック式英語」で紹介される文のことである。
スクショした画像をたくさん貼り付けたのでファイルが重くなって、ファイルを開く時に時間がかかる。それでその時間を短縮するために、画像の中にある文字をテキストにして、画像は削除したい。
画像の中にある文字をテキストにするには、Googleレンズを使うのがいい。
画像データのテキストにしい部分をドラッグして、そのうえで、右クリックし、「Googleで画像を検索」を選ぶ。右側にGoogleレンズの画面が出てくるので、そこにあるテキストをクリック。その後テキストをコピーをクリックする。
それによりテキストを得ることができる。
あるいは、動画、画像の中の文字をテキスト化したい場合は、画面の外で右クリックし、Googleで画像を検索を選んで、Googleレンズ画面を呼び出すこともできる。
GeminiとかMicrosoft Copilotとかでも試してみたが、あまりうまくいかなかった。
Googleレンズが一番いいようである。
よろしければクリックをお願いします。励みになります。
にほんブログ村