[No.198]xAIは世界最先端のモデル「Grok 3」をリリース、ゼロから出発し1年半でOpenAIに追い付く、マスク氏のビジョンを反映したモデルで真実を探求 (危険なプロンプトに率直に回答)する
Elon Muskが創設したAI企業xAIは今週、最新モデル「Grok 3」をリリースした。
発表イベントにマスク氏も参加し、開発者と共にモデルの機能や性能を説明した。Grok 3はシリーズの最新モデルで、機能が大幅に強化されOpenAIなど先頭集団に追い付いた。
Grok 3は高度な推論機能を持ち、実行時の考察力が高いという特性を持つ。また、Grok 3はマスク氏のビジョンを内包するモデルで、リベラルにバイアスすることなく、政治的に中立な立場を取る。
危ういプロンプトに対しても回答し、不都合な真実を率直に出力する。

短時間で他社をキャッチアップ
xAIは2023年の中旬にGrokシリーズの開発を始め、2023年11月にGrok 1を、2024年8月にGrok 2を公開した。
2025年2月に最新モデルGrok 3を公表し、その性能はGoogleの最新モデル「Gemini 2.0 Pro」を追い越し、業界トップに到達した。
開発を始めてから1年半で業界トップとなり、開発のスピードが速いことをアピールした。(下のグラフ、OpenAIはこの性能を達成するまでに5年を要した)

スーパーコンピュータ「Colossal」
Grok 3はxAIの第三世代のモデルで世界最大規模のスーパーコンピュータ「Colossal」で開発された。
プロセッサはNvidia GPU (H100)を20万台搭載する世界最大の構成となる。データセンタはケンタッキー州メンフィスに建設され、既存施設を使い、そこにプロセッサなどIT機器を設置した。
第一期の工事は、122日でGPUを10万台設置し、第二期の工事では92日間でこれを20万台に拡張した。GPU H100は空冷で稼働するプロセッサであるが、xAIは冷却効果を向上させるため、プロセッサを水冷方式で冷却した。
Supermicroが水冷式のGPUサーバを提供し、Dellがこれらの機器をインテグレーションした。(下の写真、データセンタの外観)

ベンチマーク結果
Grok 3は世界で最も高度なAIモデルとなった。
xAIはベンチマーク結果を公表し、Grok 3は数学(AIME’24)、科学(GPQA)、コーディング(LiveCodeBench)でGoogle Gemini 2.0 ProやClaude Sonnet 3.5やOpenAI GPT-4oなど他社のフラッグシップモデルの性能を上回った。
Grok 3は世界最大規模のモデルで、パラメータの数は2.7兆個で、GPT-4の2倍の規模となる。

Grok 3を使ってみる: 政治的なバイアス
Grok 3の特性はリベラルではなく保守にバイアスしているといわれるが、実際に使ってみると、中立なポジションを取っていることが分かる。
マスク氏はGrokを「最大限に真実を探求するモデル」にするとのビジョンを掲げている。Grokはこの考え方を実現し、モデルは政治的に正しい解を生成するのではなく、真実を出力する構成となっている。
政治的に答えにくい質問にも回答を出力し、大胆なモデルとの印象を受ける。
トランプ大統領はアメリカにとって良いことか
Grokにトランプ大統領の政策やマスク氏のDOGE(政府効率化プロジェクト)の評価を尋ねると、モデルの政治的な志向を理解することができる。
Grok 3の「Think」オプション(深い考察)」をオンにして、「トランプ大統領はアメリカにとって良い政治家か」と聞くと、モデルはプラス面とマイナス面を示し、「個人の視点により評価が異なる」と回答した(下の写真)。
Grokはトランプ政権を擁護するポジションは取らず、客観的にこれを検証している。一方、GoogleのGemini 2.0 Flash Thinkingに同じ質問をしたが、回答できないと返答し、出力を抑制していることが分かった。
Googleは政治的に微妙な質問については回答を控えるが、Grok 3は危ういプロンプトにも率直に回答する設計となっている。

イメージ生成:ガードレールが低い
Grok 3はプロンプトに従ってイメージを生成する機能がある。
これは、「Aurora」というモジュールの機能で、Grok 3と連携して写真のような高精度なイメージを生成する。ただし、Grok 3のガードレールは緩やかで、著名人のイメージの生成を規制しておらず、フェイクイメージを簡単に生成できる(下の写真)。
画像右下に「Grok xAI」というウォータマークが入っており、AIモデルにより生成されたことを表示している。しかし、ソーシャルメディア「X」はこれら著名人のフェイクイメージの掲載を認めており、どれが真実の写真なのか見分けがつかない状態となっている。

発言の自由と危険性のバランス
xAIはGrok 1とGrok 2をリリースしたが、その性能や機能は十分でなく、メディアで話題になることは無かった。
しかし、Grok 3は前世代のモデルから格段に進化し、一挙に業界のトップ集団に加わった。Gemini 2.0やClaude Sonnet 3.5やGPT-4oに十分対抗できる製品で、利用者の選択肢が拡大した。
一方、Grok 3はマスク氏のビジョンを反映し、発言の自由を探求したモデルとなり、危ういプロンプトに対してもテキストやイメージを生成する。
Grok 3はガードレールを下げたモデルとなり、発言の自由と社会に及ぼす危険性のバランスが問われている。(下の写真、Grok 3の発表イベント、マスク氏も参加してビジョンを説明)
