ストックマーク株式会社、SATでRAGシステム検証機能を追加し精度向上

ストックマーク株式会社、SATでRAGシステム検証機能を追加し精度向上

ストックマーク、SATにRAGシステム検証機能を追加

ストックマーク株式会社は、データ構造化プラットフォーム「Stockmark A Technology」(SAT)にRAGシステムの検証機能を導入しました。この新機能により、組織が保有する複雑なデータを高精度に構造化し、それをもとにRAGシステムの検証を行うことが可能となります。さらに、SATはマルチモーダルLLMを搭載しており、構造化データからナレッジグラフを自動生成し、より効果的な検索や回答生成が実現されます。これにより、データを基にした高精度なRAGシステムの構築が加速され、生成AIの利便性が向上します。

この記事の要約

  • ストックマークがSATにRAGシステム検証機能を追加。
  • マルチモーダルLLMにより構造化データからナレッジグラフ生成。
  • RAGシステムの精度向上と生成AI活用を推進。

 ストックマーク株式会社(本社:東京都港区、社長:林 達、以下:当社)は、当社が提供するデータ構造化プラットフォーム「Stockmark A Technology、以下:SAT」にて、RAGシステムの検証機能を追加しました。

 これにより「SAT」を活用することで、組織が保有する様々な形式の複雑なデータを、高精度に構造化出来ることに加え、構造化したデータベースでRAGシステムの検証まで実行することが可能になり、組織におけるRAGシステムの構築を加速することが出来ます。

 更に、SATに搭載されたマルチモーダルLLM(大規模言語モデル)が、構造化したデータからナレッジグラフを自動生成することでより精度の高い検索・回答生成が可能になります。

「SAT」について

 データ構造化プラットフォーム「SAT」は、生成AI活用で重要視される回答精度に大きな影響を与えるRAGシステムの精度向上を簡単に実現できるサービスです。  マルチモーダルLLMの活用により、テキスト/図/表など様々な形式の複雑なビジネスデータを正確に構造化できるだけでなく、構造化データをもとに自動的にナレッジグラフを生成します。これにより、データ内の概念同士の関連性を正確に理解した高精度なRAGシステムの開発が可能になります。

・「SAT」公式サイト:https://stockmark-sat.studio.site/

「SAT」の特徴 

特徴①:複雑な構成のデータを簡単かつ高精度に構造化

 ビジネスシーンで頻繁に用いられている、図や表を含むあらゆる形式で構成された、複雑かつ膨大な量のドキュメントを、簡単にテキスト抽出し、検索可能なデータ形式に変換することができます。

特徴②:ナレッジグラフの自動生成

 構造化されたデータベースから概念同士の関係性を理解したナレッジグラフを自動生成します。これにより組織固有の専門性が高い知識でも正しく検索・回答生成が可能になります。

特徴③:RAGシステムの検証や、継続的な改善が実現可能

 構造化されたデータベース、自動生成されたナレッジグラフに対して、質問・回答の検証を実施できます。これにより組織のRAGシステム構築を加速し、対象のドキュメントが増加しても、簡単に構造化や検証が可能となり、RAGシステムの検証・改善継続的に実現します。

今後の開発ロードマップ

 今後は「SAT」では、組織の生成AI活用をより強固に支援するプラットフォームとして、データ構造化からRAGシステムの構築/検証/改善までを、ワンストップで実現する機能へ進化する予定です。 更に「SAT」を活用したデータベースをAPI経由で接続可能にすることで、組織内のRAGシステムへ簡単に接続、継続的な改善サイクルの実現を目指します。

「データ構造化」について

 2022年以降、急速に注目された生成AIは、ビジネスシーンでも約7割の企業が何かしらの形で生成AIを導入している一方で、実際の利用頻度は、数日に1回程度が約35%と主流となり、各社で生成AIツールの導入が進んでいる割には、高頻度に利用できているユーザーが少ない状況にあります※1。

 その理由として、生成AIが事実と異なる生成をしてしまう「ハルシネーション(もっともらしい嘘)」が主な理由と言えます。ハルシネーションの抑止策として、既存のデータベースから検索・回答生成を行う「RAGシステム」の利用が一般的です。しかし、業務データを用いたRAGシステムを構築するためには、組織内データの大半を占める、図表を含む複雑な形式の非定型ドキュメントを、検索可能なデータ形式に変換する「データ構造化」が必要です。正しく構造化されたデータでRAGシステムを構築することで、組織内の専門的な知識や情報を検索し、生成AIによる正確な回答生成が可能になります。

※1:製造業における生成AIの活用とセキュリティ状況:https://stockmark.co.jp/news/20240418

無料オンラインセミナーを12月5日(木)に開催

 「SAT」の新機能搭載に伴い、無料オンラインセミナーを12月5日(木)に開催します。セミナーでは、RAGの精度向上のポイントとして、データ構造化やナレッジグラフ、RAGシステムの開発などについて具体例とともにご説明いたします。

ストックマーク株式会社について

 ストックマーク株式会社は「価値創造の仕組みを再発明し、人類を前進させる」をミッションに掲げ、最先端の生成AI技術を活用し、多くの企業の企業変革を支援しています。
 
 社内外の情報をワンストップで検索できる「Anews」及び、あらゆるデータを構造化し企業の資産に変える「SAT(Stockmark A Technology)」を運営しています。さらに、企業特化生成AIの開発や、独自システムの構築も支援しています。

会社名 :ストックマーク株式会社
所在地 :東京都港区南青山一丁目12番3号  LIFORK MINAMI AOYAMA S209
設立  :2016年11月15日
代表者 :代表取締役CEO 林 達
事業内容:自然言語処理を活用した、
     事業機会の探索と意思決定の支援を行うサービスの開発・運営
URL  :https://stockmark.co.jp/

記事選定/ライター
NFT-TIMES 長尾英太

ブロックチェーン技術記者、長尾といいます。ブロックチェーンについては投資/投機的な観点よりも、技術として未来の社会でどのように取り込まれていくかを中心に発信したいです。最近ではNFTやメタバースなどに注目しています。 1989年11月7日千葉出身。大学卒業後IT企業に入社。2017年にブロックチェーンの技術ライターとして独立。 Twitter
ページトップへ