はじめに
生成AIによる画像生成は進化してきていますが、特に吹き出し内の文字が正しく描写されないという課題がありました。日本語や複雑な文字の描写が崩れることが多く、意図した通りの表現が難しい点が残っています。今回、この問題がどの程度解消されているかを確認し、ブログ用の挿絵として活用できるか試してみました。その過程で感じた改善点や、試行錯誤の結果を皆さんに共有したいと思います。
ブログの挿絵画像を生成する
ある程度チャットを繰り返したのち、ブログに掲載する記事の挿絵を作成するよう依頼しました。結果の画像はかわいらしくてよかったのですが、吹き出し内の文字が正しく表現されませんでした。
吹き出し内の文字を正しい表記にする
ここまでの文脈から日本語を出力しようとしているのかもしれません。吹き出し内の文字を英語かシンボルによる画像出力に変えてみます。
プロンプト
同じ画像で、吹き出し内の文字を正しい表記の英語にするか、または文字ではなくシンボルに変更してください。
回答
吹き出し内の文字が正しくなりました。しかし、最初の画像の鉛筆の先をくわえるポーズが失われました。
鉛筆の先端をくわえるようにする
鉛筆の先をくわえるポーズは良かったです。それを再現してもらいます。
プロンプト
非常に良いですね。最初の画像のように、柴犬が右手でペンの先端くわえているポーズにしてください。
回答
鉛筆の先端ではなく、消しゴム側をくわえる画像になってしまいました。
最終選考
難度か試したのですが、鉛筆の先端くわえる画像にはなかなかなりませんでした。また、最後の画像は吹き出しの内容がいい加減で、生成AI画像っぽさが強かったので採用しませんでした。最終的には、鉛筆をくわえていないこちらの画像を採用することにしました。