2021年に、シナモンAIにおける人工知能に関する研究成果が国際学会で高い評価を得ることができました。このブログではそれらの論文成果の一部をご紹介させていただきます。

DI@KDD 2021 Best Paper

今年6月にシンガポールで開催された「DI@KDD 2021」にてシナモンAIの研究チームが発表した論文「HYCEDIS: Hybrid Confidence Engine for Deep Document Intelligence System」がBest Paperに選ばれました。

DI@KDD(Document Intelligence Workshop at Knowledge Discovery and Data Mining)はアメリカ計算機学会(ACM)が主催する、データサイエンス、機械学習、ビッグデータ、人工知能の国際会議KDD内のドキュメント認識・理解に特化したワークショップでこの分野ではトップ国際会議と位置付けられています。 

シナモンAIが発表した論文「HYCEDIS」では、AIモデルの出力結果が、どの程度信頼できるものかを数値として示す指標「確信度」を与えることで、AIビジネスの課題であるAI結果をチェックする人間のコストを減らせない問題を解決しようとする取り組みです。本手法では複雑AI-OCRのプロセスから適切に結果の尤度を取り出すと同時に、モデルに対して親和性の引くものを検出することで、確信度の信頼性を向上させました。 

図1:HYCEDIのアーキテクチャ 

DI@KDD 2021 https://www.kdd.org/kdd2021/ 

ICDAR 2021 Best Paper

さらに、9月にスイスで開催されたICDAR 2021では、シナモンAI ベトナム研究チームが「A Span Extraction Approach for Information Extraction on Visually-Rich Documents」を発表しましたICDAR(International Conference on Document Analysis and Recognition)は2年に一度開催される文字認識及びドキュメント解析のトップ国際会議です。こちらにおいても、弊社の論文はBest Paperに選出されました。 

この論文では、近年提案されているLayoutLM を導入し、言語モデルの手法をテキストだけでなく表などのオブジェクトを含む文書認識に適用し、テキスト文書から文脈に基づいて所望の情報抽出をするAurora Clipperの技術を、帳票やレシートなどの非定型文書からデータを抽出するFlax Scannerの技術へと適用できることを示しました。特にこの論文では、情報抽出タスクに威力を発揮するスパンベースのQAモデルを適用し、Flaxで特に重要な一つの質問に対し複数回答を抽出する方法を提案しています。同時に、QAアルゴリズムを高速化する一般手法を提案しています。これらによって帳票認識の精度向上及び速度向上を達成できることを証明しました。 

図2:リカーシブスパン抽出メカニズム 

ICDAR 2021 https://icdar2021.org/

今後、シナモンではこれら技術を起点として、Flax ScannerとAurora Clipperを統合し、より複雑な文書を柔軟に対応できるインテリジェントドキュメントアナライザーの研究に取り組んでまいります。

コンサルティング、ワークショップ、ソリューションの提供を通じて、「AIを競争戦略に結びつける」お手伝いをさせていただいております。ぜひお気軽にお声がけをいただけましたら幸いです。

お問い合わせはこちら => お問い合わせフォーム