音声認識– tax –
音声認識とは、人間の発話音声をコンピュータがテキストデータに変換する技術です。音響モデルと言語モデルを組み合わせる従来型アーキテクチャから、Whisper(OpenAI)に代表されるEnd-to-End型の深層学習モデルへと技術の主流が移行し、多言語対応やノイズ耐性が大幅に向上しました。近年は数秒の音声サンプルから話者の声を複製するゼロショット音声合成との組み合わせなど、音声分野全体のAI活用が加速しています。
主要な応用領域として、コールセンターの通話書き起こしと対話分析、会議の自動議事録作成、医療現場でのカルテ音声入力、音声コマンドによるハンズフリー操作、リアルタイム字幕・多言語同時通訳などがあります。話者分離(ダイアライゼーション)や感情認識と組み合わせることで、誰が・何を・どのような感情で発話したかまでを構造化する高度なソリューションも実用化されています。
国内ではAmiVoice(アドバンスト・メディア)、MiiTel、Rimo Voice、Notta、Otolioなどが代表的なサービスとして法人市場に広く普及しています。近年は日本語音声基盤モデルKotoba Whisperや、ソフトバンクのSarashina音声API、Kotoba Technologiesの同時通訳技術など、国産音声AIの競争も活発化しています。
-
SHaiN
株式会社タレントアンドアセスメントが提供する「SHaiN」は、AIを活用したオンライン面接サービスです。スマートフォン・タブレットから24時間365日どこでも受検でき、採用担当者の工数を増やさずに全国規模の候補者へ対応できます。独自の「戦略採用メソ... -
症状ことばチャット
SHANRI株式会社が提供する、患者と医師のコミュニケーションを支援する医療特化型チャットサービスです。患者がスマートフォンからチャット形式で症状を入力すると、内容が医療形式に自動変換され、医師への伝達をスムーズにします。音声入力や写真・イラ... -
Otolio
エピックベース株式会社が提供する「Otolio」は、会議音声を活用したAIエージェントサービスです。旧「スマート書記」から2025年11月に名称変更されました。会議前の資料準備から、会議中のリアルタイム文字起こし・要約、会議後のタスク整理・議事録共有... -
HARMONY
ロジカル・アーツ株式会社が提供する「HARMONY」は、生成AIを活用したクラウド型コールセンターシステムです。Amazon Connectをベースに開発されており、通話内容のリアルタイム文字起こし・校正・要約・会話議事録生成・自動入力・コールリーズン判定・カ... -
AmiVoice
株式会社アドバンスト・メディアが提供する「AmiVoice」は、国内シェアNo.1のAI音声認識サービスです。独自の深層学習技術により、会議・医療・コールセンター・建設・物流など多様な業種向けに高精度な音声文字起こしを実現します。クラウドAPIからオンプ... -
X-Ghost
X-Ghost(クロスゴースト)は、Gen-AX株式会社が提供するコンタクトセンター向けの自律思考型AIオペレーターソリューションです。Speech-to-Speechモデルを採用した自然な音声対話により、24時間365日の問い合わせ対応を実現します。モニタリングAIが応答... -
ailead
株式会社aileadが提供する「ailead」は、商談・Web会議・採用面接の対話データを一元管理するAIプラットフォームです。録画・書き起こし・AI解析を自動で行い、トピック・合意事項・懸念点・次アクションを抽出します。SFA/CRMへの自動入力やタスク起票ま... -
COG SUITE
コグニティ株式会社が提供する「COG SUITE」は、AIによるビジネストーク解析で組織の人材育成と業績向上を支援するサービス群です。2013年に開発・特許取得した独自の知識表現AI技術「CogStructure」により、営業・MR・コーチング・プレゼンなどの音声コミ... -
AIナレーション
株式会社ホンヤク社が提供する「AIナレーション」は、AI音声合成技術による多言語ナレーションサービスです。50年以上にわたる翻訳ノウハウとAI翻訳技術を組み合わせ、高品質な多言語ナレーションコンテンツを従来の制作コスト・納期を大幅に削減して提供... -
PIAS
株式会社ロジロジが提供する「PIAS」は、AI薬歴支援システムです。「薬剤師を薬歴作成から解放する」をコンセプトに、AIが服薬指導の内容をリアルタイムに解析し、薬歴の下書きを自動生成します。薬剤師は生成された下書きを確認・修正するだけで薬歴が完...
