AIを使ってしたい100のこと

生成AIの可能性と、それを使って自分自身を表現する楽しさを伝えることを目指しています。

生成AIでの「文字表現」への挑戦と改善の体験

はじめに

生成AIによる画像生成は進化してきていますが、特に吹き出し内の文字が正しく描写されないという課題がありました。日本語や複雑な文字の描写が崩れることが多く、意図した通りの表現が難しい点が残っています。今回、この問題がどの程度解消されているかを確認し、ブログ用の挿絵として活用できるか試してみました。その過程で感じた改善点や、試行錯誤の結果を皆さんに共有したいと思います。

ブログの挿絵画像を生成する

ある程度チャットを繰り返したのち、ブログに掲載する記事の挿絵を作成するよう依頼しました。結果の画像はかわいらしくてよかったのですが、吹き出し内の文字が正しく表現されませんでした。

吹き出し内の文字を正しい表記にする

ここまでの文脈から日本語を出力しようとしているのかもしれません。吹き出し内の文字を英語かシンボルによる画像出力に変えてみます。

プロンプト

同じ画像で、吹き出し内の文字を正しい表記の英語にするか、または文字ではなくシンボルに変更してください。

回答

吹き出し内の文字が正しくなりました。しかし、最初の画像の鉛筆の先をくわえるポーズが失われました。

吹き出し内の文字描写が正しくなり、シンボルが併記された。

鉛筆の先端をくわえるようにする

鉛筆の先をくわえるポーズは良かったです。それを再現してもらいます。

プロンプト

非常に良いですね。最初の画像のように、柴犬が右手でペンの先端くわえているポーズにしてください。

回答

鉛筆の先端ではなく、消しゴム側をくわえる画像になってしまいました。

鉛筆の消しゴム側をくわえる柴犬

最終選考

難度か試したのですが、鉛筆の先端くわえる画像にはなかなかなりませんでした。また、最後の画像は吹き出しの内容がいい加減で、生成AI画像っぽさが強かったので採用しませんでした。最終的には、鉛筆をくわえていないこちらの画像を採用することにしました。

おおむねバランスの良いこの画像を採用した。(ポーズは最初の方が良かった。)

やってみた感想

  • 4か月ほど前より、画像の吹き出し内の文字の正確さが向上したと思います。
  • 英語文字の出力はほぼ完ぺきに見えます。
  • 吹き出しの文字を除いて絵だけで言えば、最初の画像が最もよかったかもしれません。画像と文字の両立については今後の課題ですね。
  • ChatGPTは、過去に「かわいい柴犬キャラクターの絵柄はこれ」と指定されたのを覚えているようです。絵柄が安定しています。