として入力することで、好みの画像を生成できます。しかし、画像生成AIを使いこなすには、「モデルデータ」「解像度」「サンプリング回数」など多様な要素を適切に設定する必要がある他、複雑なプロンプトの構築など、面倒な操作を実行する必要があります。
そこでウー氏らの研究チームは、従来のChatGPTを基にした「Visual ChatGPT」と呼ばれる対話型AIを開発しました。Visulal ChatGPTは、入力されるテキストやプロンプトを介して対話を行うことで、画像の生成を行うことが可能です。などのVFMを追加しました。さらにChatGPTとVFMの機能間のギャップを埋めるために「入力・出力形式を指定し、各VFMの機能についてChatGPTに通知すること」「さまざまなVFMの使用履歴や優先順位などを参考に画像処理を行うこと」「png画像や深度画像などのさまざまな視覚情報を言語形式に変換することで、ChatGPTの処理を支援すること」といったプロンプトマネージャーを導入しています。
Visual ChatGPTのアーキテクチャ概要が以下の画像です。Q1で示されたソファの画像をQ2では「画像中のソファを机に置き換え、さらに水彩風にして」と問いかけています。ユーザーからのクエリを受け取ると、ChatGPTのシステムの説明や対話履歴を含め、さまざまなVFMの中から選択したツールを使用するためのプロンプトを作成し、ChatGPT上に入力します。 Visual ChatGPTのデモがこんな感じ。Visual ChatGPTに「Could you generate a cat for me? 」と入力すると、Visual ChatGPTは即座に猫の画像を生成します。また「That's cool! Could you generate the canny edge of this image? (この画像を
対話型AIの発達はめざましいですね。そのうち、対話型チャットAIが人間の面倒なこと、相談アドバイス等、全て引き受けてくれそうです(笑)。
日本 最新ニュース, 日本 見出し
Similar News:他のニュース ソースから収集した、これに似たニュース記事を読むこともできます。
ソース: internet_watch - 🏆 23. / 63 続きを読む »
ソース: Infoseeknews - 🏆 10. / 68 続きを読む »
ChatGPTの上位互換「BingAI」 検索はどう変わる?|MONO TRENDY|NIKKEI STYLE2022年11月30日にリリースされ、月間ユーザー数が1億を超える衝撃的な勢いで広がる対話型AIチャットツール「ChatGPT」。さらに23年になって上位互換ともいえるサービスを米マイクロソフトが投入した。テキストを生成するChatGPTや、画像を生成する「Midjour…
ソース: NIKKEI STYLE - 🏆 70. / 53 続きを読む »
ソース: BIJapan - 🏆 83. / 51 続きを読む »
ソース: cnet_japan - 🏆 100. / 51 続きを読む »
ソース: weeklyascii - 🏆 94. / 51 続きを読む »