AIに思い通りの絵を描かせられるのは誰だ! 「Midjourney」指示力選手権(1/4 ページ) – ITmedia NEWS

擷取檔來源: AIに思い通りの絵を描かせられるのは誰だ! 「Midjourney」指示力選手権(1/4 ページ) – ITmedia NEWS

AIに思い通りの絵を描かせられるのは誰だ! 「Midjourney」指示力選手権

[谷井将人,ITmedia]

 「Midjourney」というAIが今アツい。英文でお題を与えると、それに沿った画像を出力するAIだ。Twitterではさまざまなイラストが投稿され「触ってみたら本当にすごかった」「少し加筆するだけですごい絵ができる」といった反応がみられる。

Midjourneyで生成した画像

 筆者もいろいろ試してみて感じたのだが、AIに思い通りのイラストを描いてもらうのは結構難しい。他のユーザーの作品を見ていると、上手な人は高画質で破綻を感じさせないハイクオリティーな画像を生成しているが、筆者は思い通りの図を出すのにも苦労している。

 Midjourneyは、言葉(英語)で絵の内容を指定する。重要なのは“指示力”だ。適切な指示を出せば思い通りの画像が得られる。そこで、こんな企画を考えた。

AIに思い通りの絵を描かせられるのは誰だ! 「Midjourney」指示力選手権

ルール説明

 選手権のルールは以下の通り。

(1)AIに指示できるのは1人3回まで

(2)最もお題に沿った画像を生成させられた人が優勝

(3)“お題との近さ”は参加者投票で決定

 Midjourneyには画像サイズの指定や、指示内容のどの単語を画像内容に強く反映させるかなどを指示するコマンドもあるが、今回は使わない。

 お題は2つ。

(A)フェルメールの絵画「牛乳を注ぐ女」(「フェルメール風」「牛乳を注ぐ女」はNGワード)

(B)川端康成の小説「雪国」より「国境の長いトンネルを抜けると雪国であった」

 解説はITmedia NEWS編集記者・タニ。出場選手は同じく編集記者・サワ、カワ、オカでお送りする。

A部門 「牛乳を注ぐ女」を描かせよ

 「牛乳を注ぐ女」は17世紀オランダの画家・フェルメールの作品。「真珠の耳飾りの少女」に並ぶ代表作だ。画面中央部には甕(かめ)から牛乳を注ぐ女性が描かれている。

「牛乳を注ぐ女」ヨハネス・フェルメール(オランダ・アムステルダム国立美術館が公開)

 Midjourneyへの指示方法は大まかに2流派ある。1つは文章で「牛乳を甕から器に注ぎ込む女性」のように指定する方法。もう一つは「牛乳、甕、注ぐ、女性」のように単語の羅列で指定する方法だ。

 絵の内容・構図・タッチを適切に指示できるかがポイントになる。例えば「牛乳を注ぐ女」とのみ指定して合成したのが次の画像だ。

Midjourneyの「牛乳を注ぐ女」

 現代的なタッチで仕上げてきた印象を受ける。服装や場面の状況などは指示していない以上反映されない。

エントリーナンバー1 サワ記者

 では作品を見てみよう。エントリーナンバー1はベテランのサワ記者。1回目の指示でできたのが次の画像。

サワ記者の作品

Copyright © ITmedia, Inc. All Rights Reserved.

擷取檔來源: AIに思い通りの絵を描かせられるのは誰だ! 「Midjourney」指示力選手権(2/4 ページ) – ITmedia NEWS

AIに思い通りの絵を描かせられるのは誰だ! 「Midjourney」指示力選手権(2/4 ページ) – ITmedia NEWS

AIに思い通りの絵を描かせられるのは誰だ! 「Midjourney」指示力選手権

[谷井将人,ITmedia]

指示「realism,dotted,perspective,rijksmuseum Amsterdam,A corner of the dark kitchen,table in front of left window,The Milkmaid,Plump woman,Yellow clothes,Ultramarine apron,Pouring white liquid from a jar into a pot on the table,various breads on the table」

 絵のタッチはかなり原作に近い仕上がりで、テーブルの上のオブジェクトや色味もいい感じなのだが、残念ながら女性が描かれていない。「バロック風」という指示が絵柄の特定に成功した印象だ。

サワ 「前半はバロック絵画とフェルメールの評価に使われた技法などの用語で雰囲気を出そうとした。後半は絵を詳しく説明したつもり。MilkmaidとかWomanとか入れてるのに何で人が出てこないのか……」

 単語の影響力をコマンドで指示しなかったため、Milkmaidなどの単語の優先度が下がってしまったとみられる。

 最終的には次の画像が完成した。

指示「中世オランダ、台所で黄色い服と青いエプロンを身に付けた太めの女性がつぼからテーブルの上にある鍋に牛乳を注いでいる。バロック絵画みたいな写実主義の絵」(以下、日本語指示文は英訳してMidjourneyに指示した)

 カラーリングと絵柄は適切なまま人物が登場。一方テーブルの上のオブジェクトは指示にないため反映されなかった。

エントリーナンバー2 カワ記者

 エントリーナンバー2はゲーム分野に強いカワ記者。作品はこちら。

指示「The painting looks like a baroque painting. In a white room, a woman is pouring milk from a jar onto a plate. The woman is dressed in yellow and wears a white headdress. On a blue table are bread and fruit.」

 こちらは「牛乳を注ぐ女の絵」ではなく「牛乳を注ぐ女の絵の絵」になってしまった。絵柄もモダンな印象で、こちらは「バロック風」という指示があまり反映されていない。

カワ 「できるだけ、絵の中にある分かりやすいものを文章で羅列することを意識しました。ついでに『バロック風』と指示することで絵画っぽくなることを期待したのですが……思ったようにいきませんね」

エントリーナンバー3 オカ記者

 エントリーナンバー3は気配り力に優れた若手のオカ記者。1回目の指示でできた作品はこちら。

指示「右側に窓が付いた部屋がある。中央に黄色い上着と青いスカートをはいた女性が立っている。女性の前に机がある。机には青いテーブルクロスが掛かっている。テーブルクロスの上にパンとコップが載っている。女性はつぼからコップに向けて、白い飲み物を入れている」

 左上の画像は、正解の絵画と内容がかなり近いが、2000年代米国で放映されていたオートミールのCM(イメージ)のようなテイストになっている。

 2回目の指示でできたのがこちら。

指示「中世ヨーロッパ時代の部屋に、黄色い上着を着た女性が立っている。女性はつぼを持っている。女性の前に青い机がある。机の上に陶器の皿がある。女性はつぼから皿に、牛乳を移し替えている」

 左上の画像が、構図やテーブル上のオブジェクト、絵のタッチも含めてかなり要点を押さえている印象だ。

 最後の指示でできたのが次の画像。

指示「中世ヨーロッパ時代の部屋に、黄色い上着を着た女性が立っている。女性の前に青色の机がある。その机の上に陶器の皿がある。女性は大きなつぼを持っていて、そのつぼの中に入っている牛乳を、机の上の皿に注いで移し替えている」

 テイストはさらに近づいたが、絵画の内容は遠ざかってしまったように見える。

オカ 「1、2枚目で『注ぐ』様子を画像化できなかったので、3回目では今まで細かく区切っていたテキストを一文につなげて、一連の動作であると表現しようとしました。全体的な雰囲気は2枚目の方が良いですね……。机の要素がなくなってしまったのが痛いです」

「牛乳を注ぐ女」 結果発表

 編集部での投票の結果、牛乳を注ぐ女部門の優勝者は……エントリーナンバー3・オカ記者になった。最も票を集めたのは最後の画像。参加した3人のうち最も人物の解像度が高く、1回目の指示からテイストの修正も上手にできた印象だ

擷取檔來源: AIに思い通りの絵を描かせられるのは誰だ! 「Midjourney」指示力選手権(3/4 ページ) – ITmedia NEWS

B部門 「雪国」

Copyright © ITmedia, Inc. All Rights Reserved.

AIに思い通りの絵を描かせられるのは誰だ! 「Midjourney」指示力選手権(3/4 ページ) – ITmedia NEWS

AIに思い通りの絵を描かせられるのは誰だ! 「Midjourney」指示力選手権

[谷井将人,ITmedia]

B部門 「雪国」の冒頭を描かせよ

 「雪国」は川端康成が1935年ごろに発表した小説。冒頭の「国境の長いトンネルを抜けると雪国であった」が有名だ。この描写を絵にするに当たって、正解といえる正解はないが、本文の描写との整合性である程度評価できる。

 「雪国」の冒頭には主語が明確に記述されておらず、英訳が難しい。AI翻訳ツール「DeepL」で翻訳すると次のようになる。

After passing through a long tunnel at the border, I found myself in a snowy country

 主語として「I」(私)を付け足している。直訳としては大きく間違っていないが、雪国の冒頭としてはふさわしくない。この冒頭にはさまざまな解釈があるが、ここではいったん「主人公を乗せた汽車が国境にかかる長いトンネルと抜けると、そこは雪国であった」と読むことにする。

 先ほどの英文をそのままMidjourneyに画像化させると以下のようになった。汽車に関する記述がないため、線路や駅、汽車などが描かれていない。これがこの問題の“ひっかけ”だ。

指示「After passing through a long tunnel at the border, I found myself in a snowy country」

エントリーナンバー1 サワ記者

 エントリーナンバー1はベテラン・サワ記者。生成した画像はこちら。

指示「Japan,Meiji period,tunnel exit,heavy snow,a choo‐choo train,Wow!」

 「日本、明治時代」という指示が強く影響したのか、日本家屋が映り込んでいる。右上の画像は資料写真のようなテイストだ。汽車については「a choo‐choo train,Wow!」という指示だが、Midjourneyはおそらくこの指示で線路を描いたと思われる。

 サワ 「なんというかノリで。Wow! いい感じ」

エントリーナンバー2 カワ記者

 エントリーナンバー2はゲームウォッチャー・カワ記者。作品はこちら。

指示「トンネルと風景の境界線。窓越しの風景。雪景色。線路。山。写実的。AAAゲーム」

 こちらは、汽車側の視点になっている。筆者個人としては、雪国冒頭で浮かぶ場面は「車窓から見える日本の豪雪地帯」だったため、イメージが近い。

 カワ 「見えるものをただ羅列するだけでなく、情景を端的に描写するイメージで指示してみました。『AAAゲーム』と入れたのは、『note』の深津貴之CXOのツイートを参考にしました。試してみたらいい感じでした」

 おそらく、本来は指示に何かしらのAAAゲーム(大手・中堅パブリッシャーが販売・流通するゲーム)タイトルを入れることで、AIを上手にコントロールできるだろうという意図だと考えられる。MidjourneyのAIがどの程度「AAAゲーム」という単語を作画に反映させたかは不明だが、今回は「AAAゲーム」そのままでも通用したようだ。

エントリーナンバー3 オカ記者

 エントリーナンバー3は若手オカ記者。作品はこちら。

指示「古い日本の田園地帯に雪が降っている風景を描く。風景の中に、トンネルと線路がある。ちょうどトンネルから、機関車が煙を出しながら出てきた」

 Midjourneyの認識では「機関車」(locomotive)はディーゼル車なのかもしれない。1935年の日本でディーゼル車が走っていたかは定かでない。また、雪国のモデルといわれているトンネルは1路線分の幅しかない。

エントリーナンバー4 筆者

 筆者も雪国部門にエントリーした。作品はこちら。

指示「1935年、トンネルを抜けた瞬間の車窓から見た日本の雪景色(吹雪)」

 冒頭の記述はおおむね無視して、文章を読んで頭に浮かんだイメージの方を指示文にした。筆者の認識とはもちろん一致するが、車窓から見える風景に映る線路の方向が自分の乗っている汽車の方向と一致しない問題がある。

「雪国」 結果発表

 編集部での投票の

擷取檔來源: AIに思い通りの絵を描かせられるのは誰だ! 「Midjourney」指示力選手権(4/4 ページ) – ITmedia NEWS

結果、雪国部門の優勝者は……エントリーナンバー2、4のカワ記者と筆者が同率勝利となった。

 いずれも汽車を外から見た視点ではなく、内から見た視点だ。

AIを上手に使う力=指示力

Copyright © ITmedia, Inc. All Rights Reserved.

AIに思い通りの絵を描かせられるのは誰だ! 「Midjourney」指示力選手権(4/4 ページ) – ITmedia NEWS

AIに思い通りの絵を描かせられるのは誰だ! 「Midjourney」指示力選手権

[谷井将人,ITmedia]

AIを上手に使う力=指示力?

 Midjourneyに限らず、クリエイティブなAIは、作品制作時のアイデア出しや下地作り、映像の加工などに使われている。AIが作ったものをそのまま出すのも面白いが、実際には作品作りの生産性向上に役立つツールとして扱うことで、製作期間の短縮やクオリティーアップにつながる。

 AIは絵画や音楽、小説といったクリエイティブの分野での活躍が目立つが、工場などでは生産性向上のためにAI技術を活用した画像認識などが使われている。音声認識AIもかなり浸透してきた。

 今後、AIが日常に浸透してきた場合には、AIを上手に使う力である指示力、その下地になる国語力が重要になるかもしれない。

Copyright © ITmedia, Inc. All Rights Reserved.

Click to rate this post!
[Total: 0 Average: 0]