画像データ自動化の新たな可能性:
ChatGPT & ルールエンジン

Vol.020 2023年10月24日

最新のChatGPTでは、画像データの解析が可能になりました。例えば、知人との飲み会の写真をChatGPTに投入すると参加人数や男女比、場所の推定までの情報抽出が実現しています。圧巻の進化ですね。
さて、前回のコラムでは、弊社ルールエンジン「NaU Rulebook」が大規模言語モデルと連携する方式で特許申請を行なったことを報告しました。今回は、この言語モデルとの組み合わせで、画像データの新しい活用領域に焦点を当てます。

弊社で検討中の応用例

  • 工事写真の自動評価
    証跡としての工事写真を安全基準などに適合して合否判定します。これまでの人による判定から、効率的な自動判定へのシフトが期待されます。
  • 図面からの情報抽出
    行政機関が行う飲食店の開業申請など、見取り図をみながら法律や条例に適合しているかを自動確認します。図面確認作業の高度な自動化が見込まれます。
  • コスト効果的なOCRの実現
    高価なAI-OCRの代替として、全文変換型OCRと大規模言語モデルを組み合わせ、低コストでのテキスト抽出の可能性があります。

上記は弊社が遭遇した利用シナリオの一部に過ぎません。
これらの業務においては、単に画像データの処理を自動化するだけでなく、法律や規約など時間と共に変化する判断基準に対して、柔軟に対応できることがポイントになります。そこにルールエンジンと大規模言語モデルとの併用の価値が出てきます。
このような大規模言語モデルの業務への応用は、個人情報保護など多くの課題も伴いますが、業務の効率化と革新に貢献することは間違いないと考えています。
弊社は、今後も最先端のノウハウの蓄積を目指して参ります。画像データを対象としたルール運用の課題や相談は、いつでも弊社までお気軽にご連絡ください。