205言語以上の言語音声データをサポート
自動音声認識に必要な音声収録と書き起こしによるデータ提供。15万人以上のネイティブ話者と言語に精通したプロジェクトマネジメント体制でサポートします。日本語、英語、ヨーロッパ言語、中国語をはじめとしたアジア言語などを方言や人種による発音の違いなどもサポートします。
自動音声認識に必要な音声収録と書き起こしによるデータ提供。15万人以上のネイティブ話者と言語に精通したプロジェクトマネジメント体制でサポートします。日本語、英語、ヨーロッパ言語、中国語をはじめとしたアジア言語などを方言や人種による発音の違いなどもサポートします。
物体検知、顔認証、画像解析、不良品検知など画像や動画をもとにした判定を行う、
AI開発に必要なデータの収集やバウンディングボックス付加、キーポイント設定、セグメンテーションマスクなどコンピュータビジョン向けアノテーション業務を行います。
音声合成用データ作成に関するプロフェッショナルな声優による音声収録、感情表現の再現、低ノイズ・高音質な収録スタジオ環境のサポートなど、音声合成(TTS)に関するデータをご提供します。また、音声合成に必要なコーパスの作成などにも対応しています。
OpenAIのChatGPT、MetaのLama2、GoogleのBard、Microsoft copilotなど大規模言語モデルに関するシステム構築のサポート、業界や業種、地域性などに対応した対話出力データのチェック、強化学習用のデータ生成(RLHF)などに対応します。
テキストデータに対応した人間の話し言葉などを書き起こしたデータに対する分析、ラベリング、固有表現抽出、テキスト分析など、テキストデータに関するさまざまなプロジェクトに対応します。また、動画や画像コンテンツに対する法対応、ガイドラインへの順守の対応などモデレーション、コンテンツチェックを行います。
テキスト認識や手描き文字認識に欠かせない画像データとテキスト抽出のアノテーションデータをご提供します。運転免許証やマイナンバーカードなどの身分証明書データ、見積書、注文書、請求書などの各種帳票データの収集とテキストデータ、認識領域のラベリングデータなどをご提供します。
日本語、英語、中国語をはじめとした各種アジア系言語、ヨーロッパ言語などの60言語、2万8千時間におよぶ収録済みの音声データを提供します。スクリプト読み上げ型、対話形式、音声応答などのタイプをご用意しています。
またテキスト認識、手描き文字認識などの画像データとテキストのデータセットもご提供します。
先進運転システム(ADAS)、自動運転向けの2D画像アノテーション、3D点群データ、2D/3Dデータフュージョンやドライバーモニタリングシステム(DMS)、同乗者モニタリングシステム(OMS)向け音声・映像収録など自動車業界向けのデータ生成、アノテーションを行います。
倫理的なAI
ダイバシティーに富んだデータをもとに倫理的なAI開発をサポート
年齢層や人種、居住地域などバリエーションを考慮したデータをご提供
個人情報保護などセキュリティ保護
データの使用許諾などのエビデンス