私は今Midjourneyで画像生成に励んでいます。「画像生成AIのmidjourneyはカメラ・撮影の語彙が多いほどイメージに近づけやすい話」にあるようにカメラ実機を買うお金がなくても、月に1,000円とか2,000円あれば言葉だけで画像や動画が生み出せます。
長期的に見れば実機を買うほうがいいかもしれませんが、生成AIは日進月歩。実機も2年単位くらいで新商品が出ます。そう考えると、あまり長期的に同じものを使うのは得策ではないかもしれません。生成AIが日々進化していて、いい時代だと思います。
さて国語の理解度や語彙力が高まるほど、よりリアルに思いどおりに画像や動画を生み出せるのが生成AIです。アプリケーションも短期間でバージョンアップしています。最近フェイクかどうかを見分けるのが正直難しいです。
私自身、人物をリアルに描いたAI画像を生成していますが、生身の人間をカメラの実機で撮影した見た目と遜色がないように感じます。静止画でこの感じ方なので、曖昧さが多少許される動画ならなおさらリアルと混同しがちかもしれません。
ふと思ったのは、人間らしさってなんだろう?ということです。
生成AIの画像が生身の人間と遜色なくなったとしても、以前としてAI画像と生身の人間という違いは残ります。つまりそこに生身の人間だからこそ持っている「何か」があるのではないでしょうか。その「何か」こそが人間らしさなのではないかと思います。
あらかじめ言っておくと、私の考えは今後変遷していくと思います。その前提にたったうえで現時点で考える「何か」とは、「理由」と「不安定さ」です。
「AIが進化するほど頭の中のイメージを言語化する国語や語彙力が重要になるのではないかと思う話」でも書いたように、生成AIが自ら進んで「こんな画像を生成しよう」とは言い出しません。なぜでしょうか。おそらく生成する「理由」がないからです。
TEDで有名なサイモン・シネックさんの「WHYから始めよ」のゴールデンサークルでいうところの「WHY」は生成AIにはなくて、まだ人間にしかないと思います。残りの「HOW」「WHAT」は生成AIの得意分野です。だから、なぜ画像や動画が必要なのか?というそもそもの「理由」は人間にしかないと思います。
もうひとつの「不安定さ」について。生成AIの作品を見ているとバランスのとれたものばかりです。中年のおじさん画像を生成したとしても、おじさんらしさが施された隙のない画像が出力されます。左右対称なところも生成AIらしいところです。
でも現実には小綺麗なおじさんや小汚いおじさん、見た目には20代かと思うほど若々しいおじさん、反対に老け込んで60代かと思わせるおじさんなど挙げだしたらキリがないほど多くの種類のおじさんがいます。左右対称なんて人はおそらくひとりもいません。みんな違ってみんないいという言葉を思い出すほどです。
リアルならばさまざまなおじさんがいますが、AIが生成したおじさんは安定して中年のおじさんらしさを備えています。そして左右の対称性をはじめ、バランスのとれた人物が出力されます。プロンプトで指示すれば生成できると思いきや、結構難しいところです。
生成AIがプロンプトの指示を受け取っても、理解できず混乱している様子が画像を見ていると感じ取れます。生成された画像がのっぺらぼうだったり勝手におじさんを削除したりしてきます。
私のプロンプトの粗さゆえなところもありますが、この「理由」「不安定さ」が人間らしさなのだろうと思います。
とはいえ生成された画像を選び取るのは生身の人間です。吉本隆明さんの「共同幻想」に近いものが「人間らしさ」を形づくっていて、私を含め選び取る人たちが同じような「人間らしさ」のある画像を選んでいるのかもしれません。だから世に出るAI画像が、多数に受け入れられるおじさん画像なのでしょう。
生成AIがそうした「共同幻想」の共通項を学習して、より人間らしさの増したAI画像が生み出されている時代なのだと思います。
小難しいことを考えましたが、とにかくフェイクを世に出す人は「これはフェイクです」と明言して発信してほしいものです。フェイクで人を扇動したり騙したりしないでほしいと思います。いい世界をつくるために生成AIを使っていきましょう。