マインクラフトを大規模言語モデルのGPT-4で反復学習しながら自動でプレイするAIエージェント「Voyage」が登場

  • 📰 gigazine
  • ⏱ Reading Time:
  • 34 sec. here
  • 2 min. at publisher
  • 📊 Quality Score:
  • News: 17%
  • Publisher: 51%

日本 見出し ニュース

日本 最新ニュース,日本 見出し

世界で最も売れたゲームであるマインクラフトは、探索を続けることで手に入れられる素材が増え、それによって自分の道具や武器をアップグレードし、さらに探索できる世界が広がっていきます。NVIDIAやカリフォルニア工科大学、スタンフォード大学などの共同研究チームが開発した「Voyager」は、人間の介入なしにマインクラフトを学習しながら攻略していく生涯学習エージェントで、OpenAIの大規模言語モデル(LLM)であるGPT-4を搭載しています。

マインクラフトでは世界がシード値に基づいて作られるため、シード値をランダムにしている限り、毎回生成される世界が大きく変わります。そのため、マインクラフトをプレイする上で重要なのは「与えられた状況に臨機応変に対応していく能力」です。また、木・石・鉄・ダイヤモンドというように、道具や武器の性能を左右する素材の加工技術を進化させることも重要です。

Voyagerは「探索を最大化する自動カリキュラム」「複雑な動作を保存・取得するためのスキルライブラリ」「環境フィードバック・実行エラー・プログラム改善のための自己検証」という3つのコンポーネントで構成されており、反復方式で学習します。 Voyagerは目標を達成するためにGPT-4でプログラムを作成し、ゲーム環境からのフィードバックとエラーを基に、GPT-4でプログラムを改良します。こうすることで、Vyagerは徐々にスキルライブラリを構築し、成功したプログラムを優先し、さらに複雑なスキルを構築していきます。以下のグラフはVoyagerのスキルツリーの進化を示すグラフ。オレンジ色がVoyager、青色がスキルライブラリなしのVoyager、緑・赤・紫はそれぞれVoyager以外の言語モデルベースのマインクラフトエージェントであるReAct・Reflecition・AutoGPTです。縦軸が発見したアイテム数で、横軸がコード生成の反復回数。これを見ると、Voyagerは圧倒的な速度でダイヤモンドの武器を作るまでに至っていることがわかります。

なお、記事作成時点でVoyagerはテキストベースで動作しているため、実際にMinecraft上で何が起きているのかは認識していない状態。しかし、実験の初期段階で研究チームがVoygaerに視覚的なフィードバックを与えたところ、家やネザーポータルの建設も学習可能になったとのこと。以下のサムネイルをクリックすると、実際にネザーポータルを建築する様子を見ることができます。

 

コメントありがとうございます。コメントは審査後に公開されます。
このニュースをすぐに読めるように要約しました。ニュースに興味がある場合は、ここで全文を読むことができます。 続きを読む:

 /  🏆 80. in JP

日本 最新ニュース, 日本 見出し

Similar News:他のニュース ソースから収集した、これに似たニュース記事を読むこともできます。

戦闘機配備されたことない空自基地に「ファントムII」なぜ? 愛称「ヨサク」YS-11と並んでいるワケ | 乗りものニュース「客寄せパンダ」的存在ではないみたいです。 【戦闘機配備されたことない空自基地に「ファントムII」なぜ? 愛称「ヨサク」YS-11と並んでいるワケ】 美保基地航空祭 美保基地 米子空港 鳥取県 境港市 #米子市
ソース: TrafficNewsJp - 🏆 5. / 68 続きを読む »

【SK×Pocochaコラボグラビア】ゆいかさん。「頑張っている人を応援することが楽しい! そう思えたのは昨年のW杯」 | サッカーキング⚽SK×Pococha📸 ライブコミュニケーションアプリ『Pococha』(ポコチャ)とのコラボイベントを 実施✨ 上位に入賞したライバー(配信者)の写真&インタビューページが公開中❗ 「⚽サッカー×👕ユニフォーム×👩‍🦰女子」にピン!ときた方はぜひご覧ください☺
ソース: SoccerKingJP - 🏆 111. / 51 続きを読む »