AIが進化するほど頭の中のイメージを言語化する国語や語彙力が重要になるのではないかと思う話

Essay

画像生成にMidjourney(ミッドジャーニー)というAIツールを使っています。プロンプトと呼ばれるAIへの指示をChatGPTを使ってつくっています。

つまり私はChatGPTでプロンプトをつくり、それを使ってMidjourneyに指示を出して画像生成を行っているわけです。両方ともAIツールで、ChatGPTは日本語対応していますが、Midjourneyは英語です。だからChatGPTでプロンプトをつくる際に英語にしてもらいます。

こう書くと私がやっているのはタイピングだけで、時代がもう少し経てば必要のないポジションになりうるのかもと思われがちです。果たしてそうでしょうか?

結論を言えば私が行っていることはAIに取って代わられることはないと思います。

というのもAIは指示を与えてはじめて機能するものだからです。AIツールを使うとわかりますが、ソフトを開いたからといって自動で画像が生成されるわけではありません。ソフトを開いた瞬間に「●●のような画像を生成しますか?」と聞かれたとしたらビビります。ですが、そうはなりません。

こちらから指示を出すまでは何もしないのです。つまりどんなプロンプトをつくろうか考えることが第一歩で、それは頭の中のイメージを言語に置き換える作業になってきます。

パソコンの頭脳にあたるチップは高性能でひとりの人間よりもできることが多いのではないかと思うくらいです。それでも、そもそも「画像を生成しよう」といった動機のようなものはありません。指示を与えて動きます。

となるとその指示の精度によって、AIが生成する結果は大きく変わってくるのだろうと思います。このあたりは以前書いた記事の「画像生成AIのMidjourneyはディレクターやってた者からすると面白い」でも少し触れました。

単純に言うと「何をつくるか」、それと「伝え方」が大事。

頭の中のイメージをいかに具体化できるかがポイントで、この具体化は言い換えれば言語化です。人間はいろいろ考えたりイメージしたりしますが、それらは言語を使っています。頭の中がモヤモヤした状態とは、言語で理路整然とした状態ではないのでしょう。この状態では伝えたいことがうまく伝わりません。

「●●のような画像をつくりたい」という動機だけのときはまだモヤモヤしたままで、それを伝える際に言語を整理整頓することで伝わる形になります。

こう考えてくると「動機」と「伝える」部分はAIにはできないではないかと思います。画像生成に置き換えると、「●●のような画像がつくりたい」と「その画像のイメージを言語化する」部分にあたります。

実際にAI画像生成のツールを使っていると言語化能力の重要性に気づかされます。この能力を高めるためには何が必要か考えたときに、国語をよく学び、語彙力を高めることだと思いました。

つまり日本語を扱う能力を高めること。それが動機を考える力や伝える力を高めることになり、結果的に精度の高いAI画像が生成できることにつながるのだと思います。