Compass note

未踏の地へ踏み出すコンパス的エンジニアノート

【生成AI概論】生成AIの基盤モデル:機械学習のヒューマン・インターフェースであり生成系AIのOSの様なもの

* 本ページはプロモーションが含まれています

基盤モデル(Foundation Model)は、生成AI(Generative AI)の一部で、大規模な深層学習ニューラルネットワークです¹。これらのモデルは、膨大なデータセットに基づいて訓練され、データサイエンティストが人工知能(AI)をゼロから開発するのではなく、基盤モデルを出発点として、新しいアプリケーションをより迅速かつコスト効率よく強化する機械学習モデルを開発します¹。

基盤モデルは、一般化されたデータやラベル付けされていない幅広いデータに基づいて訓練され、言語の理解、テキストや画像の生成、自然言語での会話など、さまざまな一般的なタスクを実行できる機械学習モデルを表します¹。

基盤モデルのユニークな特徴は、その適応性です。これらのモデルは、入力プロンプトに基づいて、さまざまな異なるタスクを高い精度で実行できます。タスクには、自然言語処理(NLP)、質問応答、画像分類などがあります¹。

基盤モデルは、規模と複雑さが増した10年以上にわたる研究の集大成です。たとえば、最初の双方向基盤モデルの1つであるBERTは、2018年にリリースされました。3億4,000万個のパラメータと16GBのトレーニングデータセットを使用して訓練されました。わずか5年後の2023年、OpenAIは170兆個のパラメータと45GBのトレーニングデータセットを使用してGPT-4を訓練しました¹。

基盤モデルは、生成系人工知能(生成系AI)の一種で、1つ以上の入力(プロンプト)から人間の言葉による指示という形で出力を生成します。モデルは、敵対的生成ネットワーク(GANs)、トランスフォーマー、変分エンコーダーなどの複雑なニューラルネットワークに基づいています¹。

基盤モデルは、事前に訓練されていても、推論中にデータ入力やプロンプトから学習し続けることができます。つまり、入念にキュレーションされたプロンプトにより、包括的なアウトプットを開発できるということです¹。

参考: (1) 基盤モデルとは何ですか? - 生成系 AI の基礎モデルの説明 - AWS.

aws.amazon.com

(2) 生成AI基盤モデルの開発に係る事前調査を開始します - 経済産業省

www.meti.go.jp

(3) 人工知能研究の新潮流2 ~基盤モデル・生成AIのインパクト ....

www.jst.go.jp

(4) 競争力ある生成AI基盤モデルの開発に係る事前調査について

(5) 生成AI基盤モデルの開発支援に向けた公募を開始しました ....

www.meti.go.jp