はじめに

R/OCRとは？

画像、PDFから表示されている文字をテキストデータに変換するサービスです。

書類をデジタル化、正規化することにより、文字列としての検索やコピー&ペーストが可能に！
業務効率化によりヒューマンエラーを低減！
高精度な「AI-OCR」により97〜98%の認識率を実現！
ペーパレス化の促進！
専用サーバーで運用！機密データも安心！

まずはOCRを実行してみましょう

実行するだけなら簡単です！

ファイル登録からファイルをアップロードする
アップロード可能なファイルは GIF JPEG PNG PDF
1ファイルにつき、16Mバイトまで
ファイル一覧からアップロードしたファイルを表示する
アップロードしたファイルを確認してください！
PDFの場合

もし、PDFにテキストが埋め込まれている場合以下の内容で取り出すのが確実です。
1. PDFに埋め込まれたテキストを抽出するをクリックし有効にする
2. OCR設定を保存し実行
3. 右下文字起こしテキストを保存を押下
もしテキストが埋め込まれていない場合、その他画像ファイルと同様に以下からOCRを実行してください。
画像ファイルの場合
表示内容すべてをそのまま取得するのであれば1アクションです。
1. 右上 OCR設定を保存し実行予約を押下
ファイルの内容によりますが少し時間がかかります。
文字起こしテキストに抽出されたテキストが登録されています

作業の効率を上げましょう！

もし、同じ書式のファイルをアップロード、OCRを実行するのであればテンプレート機能が便利です。

アップロードされているファイルを表示する (ファイル一覧から表示してください)
すでに、文字起こしテキストがうまくできているのであれば、その設定のままでOK
まだうまくできていないのであれば、OCR設定を確認し調整する。
左下 OCR設定をテンプレートとして保存を押下
新しく登録する / 上書きするを選択し、テンプレート名を入力、保存を押下してください。
作成したテンプレートは各アップロード済みファイルに対しても利用できます。
また、もしそのまま使えるテンプレートなのであれば、ファイル一覧の各ファイル、名称の左のチェックボックスを利用し、ページ下部、OCR実行予約を押下

利用するテンプレートを選択の上、予約するを押下することでテンプレートを利用した一括予約が可能です。

OCRの精度を上げるには

学習辞書、読み取り方、読み取り動作ももちろん大事な内容ですが、一番効果が高いのはOCRを実行するファイルの状態です。
文字の大きさ、画像のノイズ、傾きなど、AIが読み取りやすい状態で実行することが望ましいとされています。
OCR設定に各フィルタをご用意しております。もしそれらを使うことにより制度が上がるのであれば是非ご利用の上OCRを実行してください。
文字のサイズが小さすぎる、もしくは大きすぎる場合など、ある程度の拡大は可能ではありますが、少なからず画像自体の劣化が発生するため、可能であれば文字サイズが大きいものをご用意の上ファイルを登録してください。
OCR設定対象画像の設定についてはこちらも参照してください。
OCR設定読み取り設定についてはこちらも参照してください。

特定の文字の誤認識を防ぐには

学習データモデルの作成で改善する可能性があります。
ものすごく強力な機能にはなりますが、学習させるデータ量や質、記載の仕方によって結果がかなり変わってきてしまうため簡単ではありません。
また、こう書けば必ずこうなる、というルールが存在するわけでもないため、ある程度試行錯誤し辞書を作っていく形となります。
学習データについてはこちらも参照してください。

文章学習データ

認識させたい文章や例文を句読点などで適宜改行し入力してください。
学習中、長すぎる場合システム上で適宜改行することがあります。
識字できない文字がある場合、ここに例文として記載すると改善する場合があります。
文字認識の学習については、ここのみが影響します。
補正用学習データは認識したうえでの訂正に利用されます。
補正用学習データを利用する際は、その内容を含むように記述してください。

入力例

これは日本語の練習用テキストである。
ひらがな、カタカナ、漢字が含まれている。
句読点や数字も含まれている。
機械学習や文字認識のテストに利用できる。
1日は24時間である。
1時間は60分である。
1分は60秒である。
2024年や2025年のような年号もよく使われる。
価格は1,200円である。
割引率は15%である。
メールアドレスの例は example@test.com である。
URLの例は https://example.com である。
駅の前には多くの店がある。
パン屋、書店、コンビニ、カフェなどが並んでいる。
店の前には看板が置かれている。
「本日セール」「10%割引」と書かれている。

単語補正用学習データ

単語辞書として機能します。
OCR結果を「もっともありそうな単語」に補正します。
認識できない単語について、頻繁に登場する単語や、一般辞書にない専門用語を1行に1つずつ書きます。
住所、会社名、特定の製品名などを入れると、それらの認識率の向上を見込むことができます。

入力例

東京
大阪
株式会社
情報
日本
型番ABC-123

数字パターン補正用学習データ

数字のパターン、書式を入力します。
数字を誤認識したときの補正に使われます。
「よくある数字の並び順」を記載してください。
数字の [0] をアルファベットの大文字 [O] と誤検知したり、数字の [1] をアルファベットの小文字 [l] と誤検知した場合の訂正などです。
基本的には確実な情報を入力することが推奨ですが、曖昧に入力することもできます。
その場合、数字が来る可能性のある場所を半角スペースとして入力してください。

入力例

句読点・記号補正用学習データ

句読点・記号のパターン、書式を入力します。
「記号の使われ方」「記号の組み合わせ」を記述します。
記号そのものだけでなく、前後にスペースがあるかなどの出現ルールを記述します。

入力例

（ ）
「 」
！？
……
（株）
（代）
%
℃