深層学習– tax –
深層学習(ディープラーニング、Deep Learning)とは、多層のニューラルネットワークを用いてデータの複雑な特徴表現を自動的に獲得する機械学習の一手法です。従来の機械学習では人手で設計していた特徴量を、モデル自身がデータから階層的に学習する点が本質的な特徴であり、画像認識・音声認識・自然言語処理などの分野で従来手法を大幅に上回る精度を達成しました。
代表的なアーキテクチャとして、画像処理に強い畳み込みニューラルネットワーク(CNN)、時系列データに適した再帰型ニューラルネットワーク(RNN/LSTM)、そして現在のLLMや画像生成モデルの基盤となったTransformerがあります。学習には大量のデータと計算資源(GPU/TPU)を要しますが、転移学習や事前学習済みモデルの活用により、少量のデータでも高精度なモデルを構築するアプローチが一般化しています。
深層学習が実用段階に入った転換点は、2012年の画像認識コンテストImageNetでCNNベースのAlexNetが従来手法に圧倒的な差をつけた出来事でした。以降、CNN→RNN→Transformerと主流アーキテクチャが移り変わり、2022年のChatGPT登場で一般社会にもその影響が可視化されました。現在は画像・動画・音声・テキストを統合処理するマルチモーダルモデルの研究が盛んで、自動運転・創薬・ロボット制御など物理世界への応用が次のフロンティアとされています。
-
Veo
Google DeepMindが開発した「Veo」は、テキストや画像から音声付きの高品質動画を生成するAIモデルです。最新のVeo 3では映像と音声を単一モデルで統合処理し、雷の映像と音を同期させるなど自然で矛盾のない動画生成を実現しています。Geminiアプリ経由で... -
Seedance
ByteDanceが開発した「Seedance」は、テキスト・画像・動画・音声をマルチモーダルに処理してリアルな動画を生成するAIモデルです。最新のSeedance 2.0では2K解像度対応・ネイティブ音声合成・フォネームレベルのリップシンク・複雑なカメラワーク再現に対... -
Pika
Pika Labsが提供する「Pika」は、テキストや画像から手軽に高品質な動画を生成できるAIプラットフォームです。最新のPika 2.5では、水の流れや物体の崩れといった物理法則をAIがシミュレートする「Pikaffects」機能が搭載され、リアルな映像表現が可能にな... -
Runway
Runwayが提供する動画生成AI「Runway」は、テキストや画像から高品質な動画を生成できるプラットフォームです。最新のGen-4.5モデルはAI動画生成ベンチマークで世界トップクラスの評価を獲得しています。動画生成に加え、背景除去・モーションブラシ・イン... -
DeepL翻訳
DeepLが提供する「DeepL翻訳」は、深層学習技術を活用したニューラル機械翻訳サービスです。文全体の文脈を理解した上で翻訳を行うため、従来の機械翻訳と比較して自然で正確な翻訳文を出力できます。31言語・900以上の言語ペアに対応し、テキスト翻訳に加... -
BCDC.Ai.GPU Data Center
売れるネット広告社グループの子会社BCDC.Ai.GPU Data Center株式会社が手がける、高性能GPUサーバーセンターの構築・運営事業です。世界最先端の水浸冷却技術を採用したGPU演算インフラを自社保有・運営し、AI開発・データ分析・ブロックチェーン等向けの... -
ailia SDK
アイリア株式会社が提供する「ailia SDK」は、あらゆるデバイスに実装できる独自開発のエッジAI推論フレームワークです。VulkanとMetalを活用したGPU/CPU両対応の高速推論を実現し、Windows・Android・Linux・iOS・Macのクロスプラットフォームに対応して... -
SmartRead
株式会社Cogent Labsが提供する「SmartRead」は、次世代AI OCRで文書のデータ化を自動化するIDP(Intelligent Document Processing)サービスです。独自AIエンジンにより99.2%の高精度で印刷文字・手書き文字の認識と文書仕分けを実現します。クラウド版と... -
Matlantis
株式会社Preferred Networksが提供する「Matlantis」は、独自の汎用AIポテンシャル「PFP」を基盤とした原子レベルの材料シミュレーションプラットフォームです。バッテリー、半導体、触媒、新素材開発など幅広い材料科学分野において、従来数ヶ月を要して... -
NVIDIA AI Enterprise
NVIDIAが提供する「NVIDIA AI Enterprise」は、エンタープライズ向けAIアプリケーションの開発・デプロイ・スケールを支援するクラウドネイティブのフルスタックソフトウェアスイートです。NVIDIA NIMマイクロサービスによる最適化推論やNeMoによるモデル...
