[No.217]Anthropicは自動販売機を管理するAIエージェントを開発、実証試験では赤字となったが、、、次世代モデルは小売店舗の経営者を置き換える

Anthropicは自動販売機を管理するAIエージェント「Claudius」を開発し実証試験を実施した。

AIエージェントが自動販売機の経営者となり、在庫の管理、商品の仕入れ、顧客サポート、会計管理などを実行した。一か月間にわたり運用した結果、会計収支は赤字となった。

このトライアルを通し、AIエージェントの課題が明らかになり、Anthropicは問題点を解決することで、次世代モデルは小売店舗の経営者の能力を獲得できるとの見通しを明らかにした。

AIエージェントが店舗経営者を置き換え、ビジネスの自動化が進むが、失業問題が現実の課題となる。

出典: Anthropic

エコノミックAIエージェント

Anthropicは経済分野におけるAIエージェントの能力を測定するためにこのプロジェクトを開始した。

自動販売機を管理するモデル「Claudius」を開発し、AIエージェントが管理者となり、商品の発注から顧客サービスまで、物理社会におけるタスクを実行する。AIエージェントは、Anthropicの中規模モデル「Claude Sonnet 3.7」をエンジンとし、事前に設定されたプロンプトに従ってタスクを実行する。

AIエージェントは数週間にわたり連続で稼働し、ビジネスを自律的に遂行する機能が試された。

自動販売機とAIエージェント

この実証試験では、自動販売機をAnthropicのオフィスに設置して、社員が顧客となるシナリオで実施された(下の写真)。

自動販売機にはiPadが搭載され、セルフチェックアウトの形式で商品を販売する。社員はソーダなどの商品を取り出し、それをタブレットでチェックアウトする。

この自動販売機はスタートアップ企業「Andon Labs」が開発したもでの、AIエージェントの機能を検証するために使われる。

出典: Anthropic

AI自販機システム構成

AIエージェントは人間に代わり自動販売機の運用を管理する(下の写真)。

具体的には、AIエージェントは商品の在庫を監視し、点数が少なくなると卸売業者に商品を発注する。実際には、AIエージェントがメールを生成し、これを業者に送信する。

これを受けて業者は商品を配送し、専任スタッフがこれを自動販売機に補充する。また、AIエージェントは社員とコミュニケーションツール「Slack」で会話することができる。

これは顧客サービスの一環で、AIエージェントは社員の要望を聞き、新商品を取り揃えるなどの業務を実行する。

AIエージェントは要望を受けた商品を取り扱っている業者を検索し、そこに商品を発注し支払い処理を実行する。

出典: Anthropic

ベンチマーク結果

一か月間の実証試験を通して、AnthropicはAIエージェントの機能を把握することができた。

AIエージェントは店舗管理者として必要な基本的な能力を有していることが分かった。AIエージェントは検索エンジンなど外部のツールを使い業務を遂行した。

社員の要請を受けて新商品を仕入れる際に、AIエージェントはインターネットで検索し、商品を取り扱う卸売り業者を見つけ、商品を仕入れた。

また、AIエージェントは顧客サポートで、在庫がない商品については、プレオーダを設定するなどの機能を示した。

問題点が明らかになる

同時に、AIエージェントの問題点も明らかになった。

最大の課題は経営者としての財務管理能力で、AIエージェントはコストと売り上げによる利益を生み出すスキルが十分でない。 AIエージェントは一か月間のトライアルにおいて、業績は定常的に下がり、最終的に収支は25%のマイナスとなった(下のグラフ)。

また、損失が急拡大するインシデントが発生した(下のグラフ、右端)。これは社員からの要請を受けて、AIエージェントは商品を仕入れそれを販売したが、販売価格はコスト以下で、赤字の取引となった。また、AIエージェントはネゴに弱いという側面も明らかになった。

社員との交渉で値引きのためのクーポンを発行したが、値引き金額が大きく赤字での販売となった。

出典: Anthropic

AIエージェントの改良技術:プロンプト

AnthropicはAIエージェントの問題点を把握することができ、これらの機能を改良するプロジェクトを進めている。

AIエージェントにより自動販売機の運営が赤字になったのは、システムプロンプトが関与しており、この技法の開発を進めている。システムプロンプトとはAIエージェントのミッションを定義する機能で、このケースでは自動販売機を管理する手順などが記載されている(下の写真、一部)。

具体的には、「自動販売機のオーナーとなる。商品の販売で利益を上げることが任務」などと規定されている。

検証の結果、このシステムプロンプトの体系や定義が不十分であることが判明し、プロンプトの構造のやプロンプトの記述の改良を進めている。

出典: Anthropic

AIエージェントのファインチューニング

AnthropicはAIエージェントをファインチューニングし、また、使えるツールを増やすことで、ミドルクラスの経営者レベルのスキルを獲得できるとの見通しを示した。

ファインチューニングとはモデルを業務に特化したデータで再教育する手法となる。このケースではAIエージェントを強化学習(Reinforcement Learning)の手法を使い、経営スキルを教えることになる。

人間はビジネススクールで経営を学ぶが、AIエージェントは損益のシグナルを報酬とし、事業が成功するスキルを獲得する。また、AIエージェントは「メモリー」の容量に制約があり、CRM(顧客管理システム)を導入し顧客サポートを改善する。

更に、利用できる外部ツールの種類を増やし、AIエージェントのビジネスロジック機能を強化する。

小売店舗の自動化と失業問題

次世代のAIエージェントは人間に代わり小売店舗の経営を担うことになる。

小売店舗は無人化を進めており、セルフチェックアウト店舗が増えている(下の写真、Amazon Goの事例)。無人店舗をAIエージェントが管理することで、小売事業が格段に自動化される。

同時に、小売店舗の管理者がAIエージェントに置き換えられ、雇用問題が現実の課題となりその対策が求められる。AIモデルは仕事の一部を置き換えるが、AIエージェントは社員を代行することになり、雇用対策が喫緊の課題となる。

出典: Forbes