[No.133]ChatGPTの次は”カスタムChatGPT”がブレーク!!OpenAIはAIエージェント「GPTs」を投入、独自の生成AIが企業のビジネス形態を激変
OpenAIは、11月6日、開発者会議「OpenAI DevDay」を開催した。
イベントのハイライトはAIエージェント「GPTs」で、独自のChatGPTをコーディングすることなく簡単に生成できる技術が公開された。GPTsは特定分野の技量と知識を持ち、人間のプロフェッショナルのように、難解なタスクをこなす。
OpenAIは一年前にChatGPTを公開したが、会議ではこれが進化したカスタムChatGPTが投入された。
開発者会議で発表された新技術
巨大テックの開発者会議と異なり、OpenAI DevDayはエンジニアを惹きつけ、AIのブレークスルーが起こる熱気をもたらした。
CEOであるSam Altmanは、ステージでライブデモを交えながら、最新技術を公開した(上の写真)。
新技術は三つの軸で構成される:
- GPT-4 Turbo:現行ハイエンド「GPT-4」の機能を拡張した新モデル。入力できる文字数(Context Window)が128Kに拡張された。API利用価格を値下げ。
- Assistants API:AIエージェント「GPTs」を生成するための新しいAPI。発表のハイライトで、Assistants APIを使って”カスタムChatGPT”を開発する。
- マルチモダル機能:GPT-4 Turboにビジョン機能が搭載され、イメージを理解する機能が備わった。
ChatGPTの限界
OpenAIはChatGPTを運用しており、対話形式で様々なタスクを指示し、モデルは処理結果を出力する。
ChatGPTはインターネットの情報で教育されており、多彩な知識を有し、指示されたタスクを的確に実行する。人間のように有益な情報をもたらし、これが爆発的な普及の要因となった。しかし、企業やパワーユーザは、ChatGPTの機能の限界に直面し、OpenAIに機能拡張を求めてきた。
その中心が”カスタムChatGPT”で、独自の生成AIを生み出すためのプラットフォームが求められてきた。
GPTsとは
この解が「GPTs」で、OpenAIは”カスタムChatGPT”を容易に開発できる技術を導入した。
GPTsは独自のスキルと知識を持ち、特定分野で威力を発揮する。例えば、企業はスケジュール管理に関するAIエージェントを容易に開発できる(下の写真)。これは、「Zapier AI Actions」というAIエージェントの事例で、GPTが企業の予定表にアクセスし、対話を通して社員の打ち合わせスケジュールを管理する。
現行のChatGPTはカレンダーなど、企業固有の知識を持たず、このタスクを実行できない。これに対し、GPTsはプライベートデータを読み込み、企業内のスケジューラーとして機能する。
GPTsを体験する
OpenAIは既にGPTsを公開しており、これを使ってAIエージェントの機能を体験できる。
グラフィックデザイン企業Canvaは、専用エージェント「Canva」を公開している。Canvaは言葉の指示に従って、プレゼン資料を作成し、また、ソーシャルメディアへの投稿記事を生成する。
例えば、「インスタグラムに投稿する日没の写真」と指示すると、指示に沿ったデザインを生成する(下の写真)。
このGPTはCanvaが培ってきたデザイン技術が使われている。
スケジュール管理のGPT
上述のスケジュール管理エージェント「Zapier AI Actions」は、既にサービスを公開し、実際に使ってみることができる。
これは「Calendar GPT」というモデルで、個人のカレンダーにアクセスし、本人に代わり予定を管理する。
実際に、Calendar GPTはGmailにアクセスし、スケジュールを把握する。例えば、「来週の予定は」と尋ねると、それを出力する(下の写真)。現行のChatGPTで個人情報にアクセスするには特別のプラグインが必要で、その作業は高度なスキルを要す。
しかし、GPTsを使うとこの作業は不要で、簡単に”カスタムChatGPT”を生成できる。
GPTs開発環境
OpenAIはGPTs開発のための環境を公開しており、ここで独自のAIエージェントを開発できる。
開発環境は「Editor」と呼ばれ、ここでチャットボット「GPT Builder」と対話しながらAIエージェントを開発する。また、OpenAIは開発環境「Playground」を運用しており、ここにGPTsを開発する機能が加わった(下の写真)。
GPTを作ってみる
これはTeslaの最新情報を解析するAIエージェントを制作したケースである。
名称は「TesalGPT」で、上述のPlaygroundを使い、必要事項を記載することで、コーディングすることなく簡単にモデルを生成できる。設定した主な項目は:
- Instructions:モデルの機能概要を言葉で定義。ここではTeslaの技術をウィッチするAIエージェントと定義。(下の写真左側)
- Model:ファウンデーションモデル「gpt-4-1106-preview」を選択。このモデルを改造することでGPTを生成する。(下の写真右側)
- Functions:外部サービスにアクセスする機能で「Function Calling」と呼ばれる。ここでは株価情報にアクセスする機能を設定。
- Code Interpreter:モデルが自動でPythonコードを生成する機能。計算問題を問われたらこの機能が稼働する。
- Retrieval:アップロードしたデータにアクセスする機能。ここではTeslaの決算情報をアップロードしており、モデルはこのデータにアクセスして回答を生成する。
ChatGPTはAIエージェントに進化
GPTsのインパクトは大きく、ChatGPTはチャットボットから、専用知識を有したAIエージェントに進化した。
Assistants APIやPlaygroundなど開発環境が公開され、企業はここで簡単に、専用のAIエージェントを開発できる。今月末には、AIエージェントを販売する「App Store」が開設され、多彩なモデルが登場する。
iPhoneで様々なキラーアプリが生まれたように、生成AIの次のブレークスルーはAIエージェントで起こる。