Cerebrum Technology – AI Data Excellence

ケルブルムテクノロジーの
3つの特徴

お客様にAI開発に必要な世界各国のトレーニングデータをお届け
お客様にご納得いただける価格水準でのデータ提供
AI開発の経験豊富なプロジェクトマネジメントによる高精度なデータ

世界中の音声、テキストなどのAI向け言語データをお届けします

自動音声認識向け音声データの収録・書き起こしデータを205言語以上の言語でお届けします
会話テーマをAIアシストで作成したり、音素のバランスを整えることで効率的な音声・テキストのデータを
ご提供します。

画像・動画などのコンピュータビジョンデータ

画像・動画などの画像解析、物体検知、顔認証、AI-OCRなどのデータを収集
バウンディングボックス、セグメンテーションマスク、姿勢推定のためのキーポイントなど、各種アノテーション

2023.12.13ケルブルム・テクノロジー株式会社を設立いたしました

205言語以上の言語音声データをサポート

自動音声認識に必要な音声収録と書き起こしによるデータ提供。15万人以上のネイティブ話者と言語に精通したプロジェクトマネジメント体制でサポートします。日本語、英語、ヨーロッパ言語、中国語をはじめとしたアジア言語などを方言や人種による発音の違いなどもサポートします。

コンピュータビジョン向けデータ

画像解析や物体検知向けの画像収集、各種アノテーションやAI-OCR向けの画像収集、テキストアノテーション、自動車業界に向けた2D画像・3D点群データへのアノテーションサービスをご提供します。自動車向けではドライバーや同乗者モニタリングのためのデータ作成も対応しています。

大規模言語モデル・テキストデータ

ChatGPT、Lama2やBardなどの大規模言語モデルを利用したAPI連携環境の開発サポート。業界や地域に連動した対話出力の妥当性や安全性を高めるための強化学習に必要なRLHF (Reinforcement Learning with Human Feedback)などをサポートします。自然言語処理や感情分析など多くのテキストプロジェクトにも対応しています。

自動音声認識向け205言語以上の音声データ

コンピュータビジョン

物体検知、顔認証、画像解析、不良品検知など画像や動画をもとにした判定を行う、
AI開発に必要なデータの収集やバウンディングボックス付加、キーポイント設定、セグメンテーションマスクなどコンピュータビジョン向けアノテーション業務を行います。

音声合成用データ(TTS)

音声合成用データ作成に関するプロフェッショナルな声優による音声収録、感情表現の再現、低ノイズ・高音質な収録スタジオ環境のサポートなど、音声合成(TTS)に関するデータをご提供します。また、音声合成に必要なコーパスの作成などにも対応しています。

大規模言語モデル

OpenAIのChatGPT、MetaのLama2、GoogleのBard、Microsoft copilotなど大規模言語モデルに関するシステム構築のサポート、業界や業種、地域性などに対応した対話出力データのチェック、強化学習用のデータ生成（RLHF)などに対応します。

自然言語処理・固有表現抽出・感情分析・テキスト分析・コンテンツモデレーション

テキストデータに対応した人間の話し言葉などを書き起こしたデータに対する分析、ラベリング、固有表現抽出、テキスト分析など、テキストデータに関するさまざまなプロジェクトに対応します。また、動画や画像コンテンツに対する法対応、ガイドラインへの順守の対応などモデレーション、コンテンツチェックを行います。

AI-OCR

テキスト認識や手描き文字認識に欠かせない画像データとテキスト抽出のアノテーションデータをご提供します。運転免許証やマイナンバーカードなどの身分証明書データ、見積書、注文書、請求書などの各種帳票データの収集とテキストデータ、認識領域のラベリングデータなどをご提供します。

60言語の音声データセット・AI-OCR向けデータセット

日本語、英語、中国語をはじめとした各種アジア系言語、ヨーロッパ言語などの60言語、2万8千時間におよぶ収録済みの音声データを提供します。スクリプト読み上げ型、対話形式、音声応答などのタイプをご用意しています。
またテキスト認識、手描き文字認識などの画像データとテキストのデータセットもご提供します。

ADAS、自動運転、ドライバーモニタリング、同乗者モニタリング

先進運転システム(ADAS)、自動運転向けの2D画像アノテーション、3D点群データ、2D/3Dデータフュージョンやドライバーモニタリングシステム(DMS)、同乗者モニタリングシステム(OMS)向け音声・映像収録など自動車業界向けのデータ生成、アノテーションを行います。

倫理的なAI

ダイバシティーに富んだデータをもとに倫理的なAI開発をサポート
年齢層や人種、居住地域などバリエーションを考慮したデータをご提供
個人情報保護などセキュリティ保護
データの使用許諾などのエビデンス

産業別ソリューション

さまざまなお客様の産業別のユースケースをサポートします。

お客様の産業・業種に特化したデータをご提供します。

製造業・自動車業界・スマート工場・建設/土木業界・通信業界・広告/メディア・医療業界・金融業・公共機関など