ChatGPTに画像生成機能を搭載してチャット形式で画像生成可能な「Visual ChatGPT」をMicrosoftが開発

  • 📰 gigazine
  • ⏱ Reading Time:
  • 36 sec. here
  • 2 min. at publisher
  • 📊 Quality Score:
  • News: 18%
  • Publisher: 51%

日本 見出し ニュース

日本 最新ニュース,日本 見出し

OpenAIが提供する対話型AI「ChatGPT」は非常に高い性能から裁判での使用や文章の執筆などで用いられています。います。しかし、ChatGPTは会話用に開発されたAIであり、画像生成機能は搭載されていません。そんな中、新たにマイクロソフトリサーチアジアのチェンフェイ・ウー氏らの研究チームがChatGPTに画像生成機能を搭載した「Visual ChatGPT」を発表しました。

として入力することで、好みの画像を生成できます。しかし、画像生成AIを使いこなすには、「モデルデータ」「解像度」「サンプリング回数」など多様な要素を適切に設定する必要がある他、複雑なプロンプトの構築など、面倒な操作を実行する必要があります。

そこでウー氏らの研究チームは、従来のChatGPTを基にした「Visual ChatGPT」と呼ばれる対話型AIを開発しました。Visulal ChatGPTは、入力されるテキストやプロンプトを介して対話を行うことで、画像の生成を行うことが可能です。などのVFMを追加しました。さらにChatGPTとVFMの機能間のギャップを埋めるために「入力・出力形式を指定し、各VFMの機能についてChatGPTに通知すること」「さまざまなVFMの使用履歴や優先順位などを参考に画像処理を行うこと」「png画像や深度画像などのさまざまな視覚情報を言語形式に変換することで、ChatGPTの処理を支援すること」といったプロンプトマネージャーを導入しています。

Visual ChatGPTのアーキテクチャ概要が以下の画像です。Q1で示されたソファの画像をQ2では「画像中のソファを机に置き換え、さらに水彩風にして」と問いかけています。ユーザーからのクエリを受け取ると、ChatGPTのシステムの説明や対話履歴を含め、さまざまなVFMの中から選択したツールを使用するためのプロンプトを作成し、ChatGPT上に入力します。 Visual ChatGPTのデモがこんな感じ。Visual ChatGPTに「Could you generate a cat for me? 」と入力すると、Visual ChatGPTは即座に猫の画像を生成します。また「That's cool! Could you generate the canny edge of this image? (この画像を

 

コメントありがとうございます。コメントは審査後に公開されます。

対話型AIの発達はめざましいですね。そのうち、対話型チャットAIが人間の面倒なこと、相談アドバイス等、全て引き受けてくれそうです(笑)。

このニュースをすぐに読めるように要約しました。ニュースに興味がある場合は、ここで全文を読むことができます。 続きを読む:

 /  🏆 80. in JP

日本 最新ニュース, 日本 見出し

Similar News:他のニュース ソースから収集した、これに似たニュース記事を読むこともできます。

ChatGPTが生成した質問をする記者と答える官房長官 ほか【中島由弘の「いま知っておくべき5つのニュース」2023/3/2~3/8】「ChatGPT」が誰でも使える環境になってきた。インターネットサービスの企画・開発を手掛けるpiconは「ChatGPT」のAPIを利用したLINE bot「AIチャットくん(ID: ai_chat)」をリリースした(ITmedia)。おなじみのLINEのインターフェースなら多くの人が利用できる。使い方は簡単だ。LINEで友達に追加するだけだ。すでに発表から3日後に「累計登録者数が20万を突破」という。使ってみなければ関心も湧かないだろうし、理解も進まない。
ソース: internet_watch - 🏆 23. / 63 続きを読む »

ChatGPTをLINEで使える「AIチャットくん」 登録者数20万突破 - トピックス|Infoseekニュースインターネットサービスの企画・開発を手掛けるpicon(東京都渋谷区)は3月2日、対話型AI「ChatGPT」のA【トピックス】
ソース: Infoseeknews - 🏆 10. / 68 続きを読む »

ChatGPTの上位互換「BingAI」 検索はどう変わる?|MONO TRENDY|NIKKEI STYLE2022年11月30日にリリースされ、月間ユーザー数が1億を超える衝撃的な勢いで広がる対話型AIチャットツール「ChatGPT」。さらに23年になって上位互換ともいえるサービスを米マイクロソフトが投入した。テキストを生成するChatGPTや、画像を生成する「Midjour…
ソース: NIKKEI STYLE - 🏆 70. / 53 続きを読む »

AIブーム最大の勝者はエヌビディアとマイクロソフト。TSMCら中国・台湾勢が続く、クレディ・スイス最新分析スイス金融大手クレディ・スイスが、「ChatGPT」の登場に始まる人工知能(AI)ブームの勝者と期待される「推奨6銘柄」を顧客向けに情報提供しています。 圧倒的な優位はNvidiaとMicrosoft、それ以外は中国・台湾勢という極端な内容でした。
ソース: BIJapan - 🏆 83. / 51 続きを読む »

「ChatGPT」の名称を悪用したマルウェアが出現--「Chrome」拡張機能を装う「ChatGPT」への連携機能を提供するとうたいながら、インストールすると「Facebook」アカウントを乗っ取られる「Chrome」拡張機能が公開されていた。
ソース: cnet_japan - 🏆 100. / 51 続きを読む »

ChatGPTを詐称したマルウェアがChrome拡張に登場 - 週刊アスキー2023年3月3日ごろから「Quick access to ChatGPT」というChrome拡張機能を装ったマルウェアがChromeウェブストアに登場、インストールしたユーザーがFacebookのアカウントを乗っ取られるといった被害を受けたという。
ソース: weeklyascii - 🏆 94. / 51 続きを読む »