AI関連

ChatGPT、Gemini、どちらも左右が認識できない・・・

先程投稿したネタのサムネイル、バイクにまたがるイラストとしたかったのですが、うまく生成できませんでした。

まず最初の依頼。

バイクに乗る人ならわかると思うけど、こんな風にまたがる人はいませんよね。
ということで、再依頼。

何故かバイクが変わったが、足も画像のアスペクト比も変わらず。

できたよ!じゃないw

何故かアングル変えてきた。
まぁ、間違いじゃないけど、これはまたがったあとなので、またがろうとしているイラストにして欲しいので再依頼。

また始まったw

なんか、ChatGPTも自分で何やっているのかわからなくなっている模様。

埒が明かないので聞き方を変えてみた。

できたよ!じゃないw
ChatGPTは右とか左とかの指示はできないんだと理解し、さらに聞き方を変更。

う~ん、無理なのか・・・
このあと何度か押し問答したが、やっぱりダメ。

弱点と言われたらしょうがないのかな。。。

この傾向はGeminiも同じで、左右の指示はできませんでした。
さらにGeminiはアスペクト比の指定もできませんでした。

めっちゃ使える相棒のChatGPT、こんな簡単なことで躓いてしまうんだと親近感も少し湧きますが、どうにか対処法はないですかね?
効果的なプロンプトを知っている方がいましたらご教示ください🙇‍♂️

ポチッとお願いします

5 / 5. Total: 2

最初の評価をどうぞ

コメント

  1. 匿名 より:

    私も試してみたら全然またがる体勢を書いてくれなかったんですけど、画像検索してもまたがろうとしている状態の画像がほぼ無いので、学習餌が無いんだろうと推測しました

    • Hiro Hiro より:

      確かに画像検索してもあまり引っかかりませんね。
      そういったことも影響しているんですかね。。。

  2. 匿名 より:

    私は同じ文言(バイクに跨るところをイラストを「16:9のランドスケープ比率」、文字なし、日本のアニメ風で作成して)で一度目の生成では既にバイクに乗った後の絵を出してきましたが、「跨った後ではなく、今まさに跨ろうと足を上げている姿で」と言って2回目の生成をさせたら正しい姿勢の絵が出力されました。

    「今まさにバイクに跨ろうと足を上げている姿のバイカーを、文字なしで画像出力してください。」と指示して写真調の画像生成をさせた後、「それを日本アニメ風のイラストにしてください」と指示してもうまく行きました。

    左右を間違えた場合は「バイクに接する側の足を上げた姿」のような指示を出せば上手くいくのではないでしょうか?
    あとは一度間違えるとその間違った出力結果もコンテクストに含めてしまうので、新たなチャットでリトライした方が良いかもしれませんね。

    現在のGeminiはアスペクト比指定を正しく受け付けませんが、16:9の真っ白なpng画像を添付して「これをキャンバスにして描いてください」と指示するとうまく行きます。

    • Hiro Hiro より:

      同じようにやってみたら惜しいところまでは行けるのですが、微妙にそうじゃないってイラストになります(笑
      それっぽい写真を喰わせて、こんな感じで足を上げているイラストを・・・とすると「ポリシー違反」と言われるしでなかなか難しいです。
      「バイクに接する側の足を上げた姿」も試してみましたがダメでした。
      Geminiのアスペクト比問題は、うまくいきました。
      こういうプロンプトもあるのだなと勉強になりました。