コピー完了

記事TOP

日本語に特化したAI-OCR「SmartRead」で高精度を実現~7年以上の実績と独自AIが描く未来

最終更新日:(記事の情報は現在から61日前のものです)
AI-OCR市場が急成長を続けるなかでも、SmartRead(スマートリード)が手書き文字や日本語処理で圧倒的な精度を誇る理由とは。独自開発のAIと豊富な文書データが生み出す強みの秘密、そしてSmartReadの未来像について、徹底インタビューをしました。業務効率化を実現するAI-OCRの全貌に迫ります。

SmartReadとは
文書内の文字を高精度に読み取るだけでなく、自動仕分けや後続システムとの連携など、文書処理の一連のプロセスを効率化するAI-OCRソリューション。定型・非定型、活字・手書きを問わず、高い精度で文字を読み取る。初期導入費用は0円で、読み取る枚数に応じた料金プランを展開する。
>SmartReadの詳細や口コミを見る

株式会社Cogent Labsの島内一磨氏

株式会社Cogent Labs
マーケティング部 担当部長 島内一磨氏
PRやプロモーション、各種メディアへの情報発信など、マーケティング全般を統括。サービスのブランディングや市場浸透に向けた施策を推進している。

AI-OCRの先駆けとして手書き、非定型、AI活用へと機能を拡張

―――まず、SmartReadの技術的な背景についてお聞かせください。初期段階ではどのようなサービスだったのでしょうか?

弊社では2017年頃から独自のAIモデルを開発し、手書き文字認識の読み取り精度を大幅に向上させました。2017年当初は申請書や口座振替依頼書のように読み取り位置が固定されている定型文書を中心に対応していました。

しかし2021年頃からは、請求書をはじめとしたフォーマットが一定でない非定型文書への対応も進めています。また、画像をテキスト付きのPDFに起こして、書類を探す際に検索しやすくなるような工夫も施しています。

自社開発AIのおかげで、従来は定型文書の読み取りしかできなかったところを、より多様な形式の書類を読み取れるよう改善できました。

―――高い読み取り精度を実現するために、具体的にはどのような技術を活用されているのでしょうか?

文書全体の構造をふまえて読み取る、当社独自の生成AI技術を活用しています。たとえば、非定型の請求書から発行元の情報を探すといった、従来なら難易度の高かった文書理解の技術を向上させています。単なる文字認識だったレベルから、文書全体の構造を理解するレベルへと進化したのが、現在のAI-OCRです。

7年以上の実績を活かした、日本語に強いモデル

―――他社のAI-OCRと比べたとき、SmartReadの強みは何だと思われますか?

SmartReadが他社と一線を画す点は、2017年より長年にわたって蓄積してきたデータにあります。AIの精度向上には、実業務で使用される文書データが非常に重要です。私たちは7年以上にわたって文書データを蓄積し、その文書データを活用してモデルや技術の開発を進めてきました。

蓄積してきた過去のデータに加え、今後新たにご利用いただくたびにデータが増えていくため、他社にとって追いつくことが難しい大きなアドバンテージとなっています。

読み取り精度を改善させた例として、健康診断の結果をデータ化する案件があります。健康診断の結果は読み取り項目が100を超えることもあるうえ、医療機関ごとに表記や数値のフォーマットにばらつきが見られるといった課題がありました。しかし、何度も改善を重ねた結果、現在は健康診断のデータ入力を担当するBPO企業向けにサービスとして提供できるレベルになっています。

Cogent Labsの島内氏

―――SmartReadは日本語に強いと打ち出していますが、そのこだわりについて教えていただけますか?

世の中にある汎用の生成AI、たとえばChatGPTのようなシステムは、まったく異なる文脈や言語であっても問題を解くように訓練されています。一方で我々のモデルは、AI-OCRを日本で使うケースに注力して設計とチューニングをしています。

その結果、お客様が日本語の文書をアップロードされた場合に、最も適した結果を得られるのが大きな強みです。オールマイティに使えるAI-OCRよりも、日本語に強いAI-OCRへと特化することで、確実に高い精度で出力できるという点が評価されています。

また、汎用AIとの大きな違いとして、ハルシネーション(事実と異なる情報を生成すること)が起こらないことも挙げられます。一般的な生成AIは、文書の読み取りにも使えますが、新たな情報を生成することに長けているといえるでしょう。

一方、我々のAIモデルは、文書に記載されている情報を忠実に再現するよう設計されています。業務文書に記載されている情報を、できるだけお客様の文脈に合わせて正確に抽出・再現することを重視しているので、明らかな誤りを抑えられています。

ちなみに、将来的なビジョンとしては、海外展開も視野に入れています。文書内の情報を抽出する技術は言語にあまり依存しない設計で、いくつかの言語はすでに学習しています。そのため、今後の海外への拡大も可能だと考えています。

精度があまりに高いので、確認作業を大幅縮小した企業も

―――実際に導入した事例についても教えていただけますか?

たとえば、人材派遣・紹介事業を展開している株式会社エントリー様では、人件費を半分に減らせたとうかがっております。また、勤怠管理表のデータ化を通じ、派遣先から勤務情報を迅速に集約することで、派遣される方への支払いサイクルを大幅に短縮。この業務効率化は、派遣スタッフの満足度向上にも貢献しています。

―――ありがとうございます。SmartReadの公式サイトには自治体でも導入が進んでいるとの記載がありましたが、どのような活用例がありますか?

群馬県をはじめとした自治体ではアンケートのデータ化に採用されています。昨年以降、特に地方自治体や官公庁のお客様からの引き合いが多く、弊社では各自治体に合わせた最適なサービス提供を進めています。

SmartReadを導入した群馬県の事例 群馬県ではSmartReadを活用することでアンケート回答のデータ入力作業を75%削減

また、あるエンターテインメント企業のお客様の場合、当初はOCRの結果を確認してから基幹システムへ連携するという作業フローを採用されていました。しかし、弊社のOCRが非常に高い精度を発揮したため、直接基幹システムへ連携し、基幹システム上での最終確認のみで運用できています。お客様に大きく貢献できたことを嬉しく思ったと同時に、弊社内でも改めてその精度の高さに驚きました。

お客様が得る価値を反映した価格構成

―――特徴的な料金プランを展開しているとお聞きしましたが、どのような料金形態なのでしょうか?

当社ではSmartReadをご利用いただくことでお客様に提供される価値に応じた料金体系をご用意しています。

1点目は、無料利用枠の設定と利用期間の考え方です。無料利用枠とは、SmartReadを利用した際の、項目読み取り単価に読み取り量をかけて計算される読み取り料金になります。

他社では、システム利用料金の60%相当額しか無料利用枠を顧客に提供しないケースもありますが、当社では、全ての顧客にシステム利用料金と同額(100%)の無料利用枠を設定させていただいています。

また、当社ではこの無料利用枠を契約期間にわたり、いつでもご利用できますので、季節性の大きい業務に適用する場合でも安心してお使いいただけます。

2点目は、利用単価についてのボリュームディスカウントを適用している点です。

3点目は、顧客のROIを徹底的に調査した価格設定です。この価格設定は、2025年3月28日のプレスリリースにある内容ですが、顧客のみなさまが利用する際に、価値を実感できるような価格設定をしました。

特に、他社では空白の項目にも価格が設定されていますが、当社では、システム提供側の都合ではなく、顧客の利用実態に合わせて、空白項目の単価を0円にしました。

以上のような構成を持つことで、価格面でもお客様に明確なメリットを実感していただける構造となっています。

価格例ですが、年間36万円のスモールプランの場合は、無料利用可能枠を36万円設定しており、これにより顧客は、年間で1.8万枚程度の文書を処理できます。また、他社と異なり初期導入費用やサポート費用が別途課金されない点も特徴です。

スモールプラン スタンダードプラン エンタープライズプラン
費用 36万円/年 96万円/年 240万円/年
処理可能枚数 1.8万枚前後 6.4万枚前後 24万枚前後

最も多く利用されているのが月額96万円のスタンダードプランです。このプランをご利用いただくお客様の場合、月間で約5,000枚の文書を処理できます。

―――さきほど話にあった価格体系に従ったプランの場合、具体的にどのようなメリットがあるとお考えですか?

無料利用枠の100%分までをご利用可能であることにより、顧客には、無駄な固定費が一切発生しません。顧客がシステムを利用することで価値が得られた場合に対価を支払う設計なので、システム利用料金が明確な価値と一対一の関係となっております。

また、無料利用枠の利用について、弊社では月単位の利用制限は設けておらず、年間を通じてお客様にご利用いただけるようにしています。お客様によっては、年度末やお中元・お歳暮の時期で処理量が大幅に増減することもありますが、そのような季節的な変動にも柔軟に対応できる設計となっています。

月ごとの制限があると、利用が多い月は追加料金が発生したり、利用が少ない月に余った枠が翌月に繰り越せなかったりするデメリットがあります。しかし、弊社は年間を通して安定した料金を実現しております。

SmartReadの年間利用料金の支払いイメージ SmartReadは年間料金内に収まれば、月ごとに大きく件数が上下しても問題なし

※累計の読み取り量が年間利用料金の相当額を超えた場合には、超えた時点で精算が必要です。顧客が文書をデータ化するためのコストと、直接関連する費用なので、変動費として管理しやすいコストといえます。これにより、顧客としては予算管理が非常に容易になります。

―――予算管理をしやすいのは、導入企業にとって安心できるポイントですね。これらの料金体系は、どのような考え方で設定されているのでしょうか?

弊社の社長をはじめとする経営陣は、お客様に提供する価値をもとにした、いわゆるバリューベースのプライシングを徹底しています。お客様の作業負荷や人件費の削減といった実際の効果に応じた料金設定を行い、顧客にとって効果のない固定料金や月ごとの利用量の変動に対するコストは頂かない方針です。

当社の理念の根底には、労働人口の減少が進むなか、少ない人手で業務の効率化を実現し、お客様の業務拡大を支援したいという強い思いがあります。実際、お客様のサービス選定時においては、こうした経営側の思いや理念も評価されるポイントだと感じています。

新機能「SmartRead AutoLoader」でOCR前後も楽になる

―――2024年11月にリリースされた「SmartRead AutoLoader」について聞かせてください。

弊社の製品や機能の拡張の方向性として、お客様の業務をできるだけ自動化するというビジョンがあります。従来からOCRや文書の仕分け機能はすでに提供していたものの、文書のアップロードや結果のダウンロードといった前後のプロセスは、お客様が手動で行っていました。

そこで、「SmartRead AutoLoader」では、指定したフォルダにPDFが追加されたら自動でOCR処理を実行し、処理結果を指定のフォルダにアップロードする、といった一連の業務プロセスを自動化します。

SmartRead AutoLoaderのイメージ図 SmartRead AutoLoaderなら、読取対象フォルダから結果出力フォルダまでがワンストップ

従来は手作業で文書を振り分けてアップロードしていた業務が自動化されることで、ミスが減り人手もかからなくなるのがポイントです。

ちなみに、以前はお客様ご自身でPythonスクリプトを組んで自動化されていた事例もありました。「SmartRead AutoLoader」ならプログラミングの知識がなくても、多くのお客様がOCRの前後にある作業を簡略化できます。「SmartRead AutoLoader」は、お客様の業務全体を自動化するための一機能です。

―――つまり、OCRによる読み取りが当たり前になる中で、さらにお客様のその後の業務、たとえば、納品書と請求書の突合やその他工程の自動化なども視野に入れているということですね。

はい。当社は読み取り精度の向上だけでなく、その前後のプロセスも自動化し、全体の業務効率を向上させることを目指しています。これにより、従来手作業でやっていた部分を含め、トータルで大幅な工程の効率化を実現できると考えています。

今後の展望:世の中のあらゆる文書を電子化したい

―――読み取り精度の向上について、なにか検討している点はありますか。

弊社では、読み取れる文書の種類を増やそうと取り組んでいます。お客様が保有している文書には、健康診断書のほか、図面や検査結果表などさまざまな形式の文書が存在するため、各文書を読み取れるようにしていきたいというのが一つの目標です。

Cogent Labsの島内一磨氏

―――特定の業界に絞るのではなく、幅広いドキュメントの電子化を目指されているのですね。

プロダクトのビジョンとして、世の中のあらゆる文書を電子化したいというのを目指しています。そのため、特定の業種に特化するのではなく、より幅広い文書に対応できるモデルを、短期間で量産できる体制を整えております。

具体的には、お客様からのリクエストを受け、特定帳票のAIモデルを学習・作成、文書の読み取りに至るまでの期間を短縮すべく、取り組みを進めています。

たとえば、建設業向けの請求書は、工事科目や累計出来高などの特殊な項目があるほか、工事の特性を反映した一般と異なる点が多々あります。しかし、当社ではこれらに対応し、さらに迅速なモデル開発に成功しました。こうした特殊なフォーマットへの対応力は、他社を上回ると自負しています。

また、複雑な構造の文書における認識精度についても自信があります。請求書の明細のような、細かいために従来は正確な読み取りが難しかった箇所も、SmartReadなら高精度で読み取ることが可能です。このため、お客様には、これまで以上に高い精度を実感いただけると考えております。

―――具体的には、どのようなプロセスでお客様の要望に応えていくのでしょうか。

サンプルが多ければ多いほど精度を向上させられる前提はあるものの、200枚程度の文書サンプルをいただければ、AIモデルを作成できます。1か月から1か月半程度で実用化できる体制を整えていますので、サンプル数が少なくて悩んでいた企業も、これをきっかけに検討してもらえたらうれしいです。

精度が心配なら、まずは体験して効果を実感してほしい

―――最後に、インタビューをご覧になっている方々にお伝えしたいメッセージがあればお願いします。

これまで文書入力やデータ入力を諦めていた方も一定数いると思うのですが、弊社ならあらゆるドキュメントをデータ化できます。弊社のビジョンとしても、ニッチな分野を含めデータ化を推し進めていきたいです。

そのため、「マニアックな要望だから難しいのでは?」と固定概念にとらわれず、ぜひ一度ご相談いただき、実際にどれだけ業務効率を改善できるのかを体験していただきたいと思います。

文書のデータ化から基幹データベースへの登録に至るまでの自動化でお悩みの企業様は、ぜひ当社のソリューションをご検討ください。当社ではOCRの領域にとらわれず、お客様に必要な機能を提供させていただきます。ご相談お待ちしております。

SmartRead - 株式会社Cogent Labs

SmartRead
SmartRead
BOXILセクション | BOXIL SaaS AWARD 2025
5
(
)
4
(
)
3
(0)
2
(0)
1
(0)
ボクシルSaaSのデータを元に表示しています
提供企業様でご不明点がある方はこちら

AI-OCRおすすめ比較12選!選び方やOCRとの違い【2025年】
AI-OCRは、画像やPDFから文字情報を読み取る「OCR」にAIを搭載し精度を高めたツールです。BOXILでは、...
詳細を見る
708_AI-OCR選び方ガイド_20241031.pptx.pdf
AI-OCR
選び方ガイド
この記事が良かったら、いいね!をしてください!最新情報をお届けします!
貴社のサービスを
BOXIL SaaSに掲載しませんか?
累計掲載実績1,200社超
BOXIL会員数200,000人超
※ 2024年3月時点
AI-OCRの最近更新された記事