FastLabelがAI開発全工程サポート、VLM開発用の日本語データセット販売を開始

FastLabelがAI開発全工程サポート、VLM開発用の日本語データセット販売を開始

FastLabelがAI開発全工程をサポートし、VLM開発用の日本語データセット販売を開始

FastLabelが、AI開発の全ての工程を支援するサービスを提供します。2024年9月12日よりVLM開発用の日本語データセットの販売を開始しました。VLM(大規模視覚言語モデル)は、生成AI技術の一つであり、高品質で多量の画像データとテキストデータの収集と作成を必要とします。そのためのデータセット販売の他に、アノテーション代行サービスや、マルチモーダルRAGデータ作成サービスも提供します。これにより、データ収集や作成の際に企業が直面するリソースの不足やデータの質の保証といった課題を解決します。

この記事の要約

  • FastLabelがAI開発全工程をサポートするサービスを展開。
  • 大規模視覚言語モデル(VLM)開発用の日本語データセットの販売を開始。
  • データセット販売をはじめ、アノテーション代行サービスやマルチモーダルRAGデータ作成サービスも提供し企業のデータ関連課題を解決。

Data-centric AI開発に必要なデータ収集・生成からアノテーション、モデル開発、MLOps構築までの全工程を支援するFastLabel株式会社(本社:東京都渋谷区、代表取締役:鈴木健史、以下「当社」)は、大規模視覚言語モデル(以下、VLM)開発用の高品質で権利クリアな日本語データセット販売サービスをはじめとした、「VLM開発用データ 支援サービス」を2024年9月12日より提供開始したことをお知らせします。

■「VLM開発用データ 支援サービス」 提供の背景

米OpenAI社の「GPT-4」、米Meta社の「Llama2」を始めとするLLMが公開されたことを受け、コンテンツを生成することが可能な生成AI(Generative AI)技術が急速に発展しています。併せて、「GPT-4o」や「Gemini」に代表されるVLM(大規模視覚言語モデル)も登場し、活用の可能性が期待されています。一方で、VLMの学習には過去の技術をさらに上回る質・量の画像データおよびテキストデータ収集、作成が必要とされますが、社内に既に存在するデータだけで十分な質・量を確保できない場合は、外部から大量のデータを権利クリアな状態で調達することが必要です。そこで、当社はVLMの学習データとして利用される画像・動画・文書データのデータセット販売、同データセットに対するアノテーション代行サービス、マルチモーダルRAGデータ作成サービスを「VLM開発用データ 支援サービス」として提供し、企業のデータ収集・作成において発生するリソース不足やデータの質の担保といった課題を解決します。

 

「VLM開発用データ 支援サービス」紹介ページはこちら

https://fastlabel.ai/service/vlm

■当社が提供する「VLM開発用データ 支援サービス」の特徴

<データセット販売の特徴>

・100万点超の多様な学習データ

当社パートナーのストックフォトサービスが所有する100万点超の画像・動画・文書データをVLMの学習データとしてご利用いただけます。

・権利クリア

販売するデータセットは全て当社でゼロから作成しており、権利リスクがなく、安心してご利用頂けます。

・高品質

当社ではデータの正確性や多様性に関する細かな品質管理基準を設定しており、データ作成工程、データ作成後の品質検査工程で基準への適合を担保しております。

 

<VLM向けアノテーション代行サービスの特徴>

・柔軟な構造のテキストアノテーションを付与することが可能

  ・キャプショニング

  ・画像の特定の領域(矩形で指示)を根拠としたQA

  ・多肢選択式のQA

  ・OCR

  ・その他要件に応じて対応可能

・セキュアなデータ管理

お客様のクラウド環境に保管された機密性の高いデータは、当社環境のストレージに保存することなくアノテーションが可能です。

・当社独自のプラットフォームを活用したスムーズな検品

プラットフォーム機能により、効率的なレビューと作業者間コミュニケーションが実現します。必要に応じてお客様側でランダムサンプリング機能を利用した抜取での受入れ検査が可能です。

 

<マルチモーダルRAGデータ作成サービスの元となるデータ>

・お客様が社内で保有しているPowerPoint、PDF、Excel等の図表を含むドキュメント

・お客様が事業活動の中で蓄積される画像・動画データ

・お客様が開発するVLMの適用領域における信頼性の高い外部ドキュメント(IR情報等)

■今後の展望

当社は今後、国内外の大手精製AIベンダーをはじめとした多くのお客様へのデータ提供の経験を元にデータの品質に関する客観的な基準の整備、品質定量化手法の開発を進めて参ります。当社は引き続き、データセットおよびAIプラットフォームのご提供、データ作成代行やコンサルティング等のサービスを通じてAI開発プロセスを効率化し、AI開発に取り組む企業、研究機関のインフラとなることで、日本社会におけるAI革命を下支えしていきたいと考えております。

■データセットの購入およびサンプル画像の確認方法

ご購入またはお見積り、サンプル画像の確認や新規撮り下ろしをご希望のお客様は、以下のメールアドレス宛、もしくはフォームよりお問い合わせください。今回販売を開始するデータセットにご希望の要件のデータがない場合は、ご要件に応じた新規撮り下ろし対応も可能です。

 

お問い合わせ:pr@fastlabel.ai

お問い合わせフォームURL:https://fastlabel.ai/service/vlm

■当社のデータセット事業について

当社は、データセットの販売のみならず、以下に対応したデータ収集代行サービスを展開しています。

・画像(人物撮り下ろし、帳票データ収集 他)

・動画(スポーツ動画撮影、走行車両撮影 他)

・音声(スクリプト発話、ノイズ収音 他)

・テキスト(会話コーパス 他)* VLM開発用途含む

 

【データ収集代行サービスの取り組み事例】

・ソニーネットワークコミュニケーションズ株式会社:https://fastlabel.ai/casestudy/snc

・AWL株式会社:https://fastlabel.ai/casestudy/awl

 

お問い合わせ:pr@fastlabel.ai

お問い合わせフォームURL:https://fastlabel.ai/contact-pr

 

FastLabel株式会社について

当社は、“AIインフラを創造し、日本を再び「世界レベル」へ”をパーパスに掲げ、2020年1月の創業以来、教師データ作成代行やアノテーションツールの提供を主力事業として展開してきました。

現在では、AI開発に必要な学習データ素材の収集、アノテーション、モデル開発、MLOps構築までの全工程をサポートする事業を展開しております。

 

社名:FastLabel株式会社

代表者:代表取締役CEO 鈴木健史

事業内容:AI開発を包括的に支援する「AIPaaS」(※)の提供(AIデータプラットフォーム、アノテーションサービス)

設立:2020年1月23日

本社所在地:〒151-0051 東京都渋谷区千駄ヶ谷五丁目27番5号

URL:https://fastlabel.ai/

 

※)AIPaaS…AI Process as a Service、AI開発プロセスを高速化・高度化させるサービス、プロダクトの総称

記事選定/ライター
NFT-TIMES 長尾英太

ブロックチェーン技術記者、長尾といいます。ブロックチェーンについては投資/投機的な観点よりも、技術として未来の社会でどのように取り込まれていくかを中心に発信したいです。最近ではNFTやメタバースなどに注目しています。 1989年11月7日千葉出身。大学卒業後IT企業に入社。2017年にブロックチェーンの技術ライターとして独立。 Twitter
ページトップへ