音声認識– tax –
音声認識とは、人間の発話音声をコンピュータがテキストデータに変換する技術です。音響モデルと言語モデルを組み合わせる従来型アーキテクチャから、Whisper(OpenAI)に代表されるEnd-to-End型の深層学習モデルへと技術の主流が移行し、多言語対応やノイズ耐性が大幅に向上しました。近年は数秒の音声サンプルから話者の声を複製するゼロショット音声合成との組み合わせなど、音声分野全体のAI活用が加速しています。
主要な応用領域として、コールセンターの通話書き起こしと対話分析、会議の自動議事録作成、医療現場でのカルテ音声入力、音声コマンドによるハンズフリー操作、リアルタイム字幕・多言語同時通訳などがあります。話者分離(ダイアライゼーション)や感情認識と組み合わせることで、誰が・何を・どのような感情で発話したかまでを構造化する高度なソリューションも実用化されています。
国内ではAmiVoice(アドバンスト・メディア)、MiiTel、Rimo Voice、Notta、Otolioなどが代表的なサービスとして法人市場に広く普及しています。近年は日本語音声基盤モデルKotoba Whisperや、ソフトバンクのSarashina音声API、Kotoba Technologiesの同時通訳技術など、国産音声AIの競争も活発化しています。
-
CapCut
ByteDanceが提供する「CapCut」は、AI機能を豊富に搭載したオールインワンの動画編集プラットフォームです。自動字幕生成・AIナレーション・背景除去・AIアバター動画・スマートレイアウトなど多彩なAI機能を備え、TikTok・Instagram Reels・YouTube Short... -
HeyGen
HeyGenが提供するAIアバター動画生成プラットフォーム「HeyGen」は、テキストを入力するだけで100種類以上のリアルなAIアバターが話す動画を作成できるサービスです。175言語に対応した多言語翻訳・吹き替え機能を備え、自分の顔をもとにしたカスタムアバ... -
Synthesia
Synthesiaが提供するAI動画生成プラットフォーム「Synthesia」は、テキストを入力するだけで230種類以上のリアルなAIアバターが話す動画を自動生成するサービスです。140以上の言語・アクセントに対応し、自分の映像からカスタムアバターを作成する機能やA... -
Felo瞬訳
Felo瞬訳は、Sparticle株式会社が提供するリアルタイム音声翻訳アプリです。GPT技術を活用した独自のRRT(Rapid Real-Time Translation)機能により、音声認識と高精度翻訳を瞬時に実現し、文体や文脈を考慮した自然な翻訳文を生成します。韓国語・日本語... -
Felo字幕
Felo字幕は、Sparticle株式会社が提供する多言語対応のAIリアルタイム字幕・音声認識翻訳ツールです。1秒以内の即時翻訳でオンライン会議の音声を自動認識し、原文と翻訳の二言語字幕を同時表示できます。20言語以上に対応し、Zoom・Google Meet・Microsof... -
VoiceGPT
株式会社SparkPlusがDyna.Ai Technology Pte. Ltd.と共同開発した「VoiceGPT」は、コールセンター業務に特化した日本語対応の音声対話AIエージェントです。独自の音声認識・音声合成技術により200ミリ秒以内の応答を実現し、スクリプトに依存しない自然な... -
カイクラ
株式会社シンカが提供する「カイクラ」は、電話・SMS・メール・ビデオ通話など企業の顧客対応チャネルをひとつの画面で一元管理するクラウドコミュニケーションプラットフォームです。着信時に顧客情報を自動ポップアップ表示し、通話内容を自動録音・AIが... -
SHaiN
株式会社タレントアンドアセスメントが提供する「SHaiN」は、AIを活用したオンライン面接サービスです。スマートフォン・タブレットから24時間365日どこでも受検でき、採用担当者の工数を増やさずに全国規模の候補者へ対応できます。独自の「戦略採用メソ... -
症状ことばチャット
SHANRI株式会社が提供する、患者と医師のコミュニケーションを支援する医療特化型チャットサービスです。患者がスマートフォンからチャット形式で症状を入力すると、内容が医療形式に自動変換され、医師への伝達をスムーズにします。音声入力や写真・イラ... -
Otolio
エピックベース株式会社が提供する「Otolio」は、会議音声を活用したAIエージェントサービスです。旧「スマート書記」から2025年11月に名称変更されました。会議前の資料準備から、会議中のリアルタイム文字起こし・要約、会議後のタスク整理・議事録共有...
