画像生成AIのMidjourney創業者が語る「AIアートが起こす混乱と未来」

画像生成AIのMidjourney創業者が語る「AIアートが起こす混乱と未来」

  • Forbes JAPAN
  • 更新日:2022/09/23
No image

Midjourney(ミッドジャーニー)は、テキストによる指示(プロンプト)を人工知能(AI)に与えてビジュアルイメージを作り出す、新しい技術を牽引するツールの1つだ。サンフランシスコを拠点とするこのスタートアップは、最近コロラド州主催のコンテストで賞を獲得した作品が同社のエンジンから生み出されたものであったことでニュースになった。だがAIアートが直面する複雑な問題はこれが最後ではないだろう。

Midjourneyは、絵画的な美しさを強調した画像を制作することで、この技術世界内での差別化を図っている。このプラットフォームは、写真と見間違うような写実的な画像を作ろうとしているわけではない。CEOのデヴィッド・ホルツは、むしろディープフェイクなど現実を模倣しすぎた作品の不気味さに個人的にとても不安を感じているという。ホルツは、Midjourneyは普通の人が創造性を発揮できるように、言葉で描写するだけで美しい画像を作ることができるツールを提供するのだという。

No image

Midjourney創業者・CEOのデヴィッド・ホルツ(Getty Images)

しかし、同社の人間中心主義や消費者志向とは裏腹に、商業美術やプロのアーティストへの影響についてはどうしても疑問が残る。私は、AIアートがエンターテインメント、ビデオゲーム、出版のための画像制作に引き起こすかもしれない混乱について、ホルツに詳細なインタビューを行った。以下は、そのインタビューからの抜粋だ。ホルツはこうした問題に対処する際の、より深い背景とコンテキストを語り、会社、業界、技術に対する彼のビジョンを説明した。インタビューの内容は、わかりやすさのために長さも含めて適宜編集されている。

──あなたの役割と肩書きを教えてください。

私は創業者でCEOです。普通は創業者と呼ばれる方が好きです。というのも、CEOというとビジネスライクな響きがありますが、私たちはあまりビジネスライクではないので。私たちは、製品を作る応用研究機関なのです。

──Midjourneyのミッションは何でしょう?

私たちは、人類という種の想像力を広げようとしているのだといいたいですね。目標は、人間をより想像力豊かにすることであって、想像力豊かなマシンを作ることではありません、これは重要な違いだと思っています。

──これまでの会社の歴史を簡単に教えてください。

当社が画像を扱う部分に取り組み始めたのは、1年半ほど前です。diffusion model(拡散モデル)、画像分類モデルのCLIP、openAI(オープンAI)など、いくつかのブレークスルーがありました。これに関わっていたのはほぼ全員がサンフランシスコ在住で、全員がこれは本物だ、他の多くのものとは違うと実感していました。

──Midjourneyはこのテキストから画像への変換技術が、ビジネスや社会にとってどのようなメリットをもたらすと考えていますか?

私はビジネスよりも社会のことを考えています。私たちが提供するのはコンシューマー向け製品ですが、現在ユーザーの30〜50%はおそらくプロフェッショナルです。コンシューマー中心ではないのです。このプラットフォームを利用しているアーティストは、初期段階でよりクリエイティブに、より探求的に、短時間でたくさんのアイデアを思いつくことができると話してくれます。

現在は、プロのユーザーはコンセプト作りのためにプラットフォームを使っていますね。商業美術のプロジェクトで最も難しいのは、特に最初の段階です。注文主側は何を望んでいるのかがわからないので、とりあえず見て考えるためのアイデアを求めてくるからです。こうしたコンセプトのブラッシュアップには大変な労力がかかるので、Midjourneyを利用することで、より早く目的のアイデアに到達できるのです。

また、アーティストにとっては、自信のない分野でも自信を持てるというメリットもあります。ほとんどのアーティストは、自分がうまくできない部分があると感じているはずです。それは色であったり、構図であったり、背景であったりします。有名なキャラクターデザイナーに使っていただいているのですが、多くの方がその方に「こんなに優秀なのに、なぜAIを使うのですか」と尋ねます。彼の答えは「まあ、僕はキャラクターの部分だけは得意なんだけどね、このツールは、残りの世界を構築するのに役立ってるんだよ」というものです。

──何人くらいの人が使っているのですか?

何百万人もの人が使っています。私たちのDiscord(ディスコード)の登録ユーザーは200万人を超えました。現在、これまでで圧倒的に大規模でアクティブなDiscordサーバーとなっています。

──Midjourneyのライセンスは、このプラットフォーム上で生成された画像の商業利用を許可しているのですか?

はい。しかし、年商100万ドル(約1億4400万円)以上の大きな会社にお勤めの方には、法人ライセンスのご購入をお願いしています。

──データセットはどのように作られたのでしょう?

インターネット上のデータをかき集めたものです。公開されているオープンデータセットを利用し、それらを横断的に用いてトレーニングしています。これは、みんながやっていることだと思います。選り好みはしませんでした。モデルの品質に対して本当に必要とされるデータの量に関していえば、科学は急速に進化しています。やり方が本当にわかるには数年かかるでしょうし、その頃にはほとんど何も使わなくてもトレーニングできるモデルもできているかもしれません。何ができるのか、誰も本当のところはわかりません。

──現存するアーティストや著作権で保護されている作品に対して同意を求めたのでしょうか?

いいえ。1億枚もの画像を集めて、それがどこから来たのか知る手段は現実問題として存在しないのです。画像に著作権者などのメタデータが埋め込まれていたら良かったのですが。しかし、それはモノではなく、登記所もないのです。インターネット上で画像を見つけ、その所有者を自動的に追跡しそれを認証できる何らかの手段がないのです。

──アーティストは、作品がデータトレーニングモデルに含まれることを拒否することができますか?

現在検討中です。現在の課題は、どんなルールがあり得るのか、ある作品の作者が本当にその人なのか、それともただ自分の名前を載せているだけなのかを見極めることです。私たちは、データセットの中に実際に含まれる自分の名前を取り除いてほしいという人にはまだ出会っていません。

──アーティストが指定されるプロンプトに自分の名前が使われることを拒否することはできますか?

現在はできません。現在検討中です。その場合も、拒否リクエストが正しいものであるかを確認する方法を見つけなければならないので、難しくなってしまいます。

──このツールのせいで生活が成り立たなくなると心配する商業アーティストに、どのような言葉をかけますか? コンセプトアートやプロダクションデザイン、背景などの制作に、適切な文章を入力するだけでより早く、より低コストで有用なアウトプットが得られるとしたら、アートディレクターがイラストレーターを雇う理由が残るのかといった懸念があると思いますが。

まだまだ大量の仕事は残されています。AIに向かって単に「ちょっと背景を作ってくれ」で終わるものではありません。これまでに比べると10分の1の仕事量かもしれませんが、1人のマネージャー自身がやるよりもずっと多い仕事量なのです。

これは2つの方向性があると思います。1つは、みんなが消費するのと同じレベルのコンテンツを、より低価格で提供しようとする方向ですよね? そして、もう1つの方向は、私たちが現在支払っている価格を据え置いたまま、大幅に優れたコンテンツを提供する方向です。すでにお金を使っている状態で、優れたコンテンツとチープなコンテンツのどちらかを選べるのであれば、実際には優れたコンテンツを選ぶ人が多いと思うのです。市場は、人々が喜んで支払う価格帯をすでに確立しているのですから。

アーティストを切り捨てようとする人も出てくるとは思います。そうした人は似たようなものをより安く作ろうとするでしょうけど、市場で失敗すると思います。これからはより質の高い、より創造的な、はるかに洗練された、多様で深みのあるコンテンツが市場に出てくると思います。そして、実際にアーティストのようにツールを使いこなせる人たちが勝ち組になるのです。

これらの技術は、映像メディアに対するより深い評価とリテラシーを実際に生み出すものなのです。そしてそうしたレベルの制作能力を、はるかに凌駕する要求も生じるかもしれません。そうなれば、実際にアーティストの給料を上げることになるかもしれませんね。変な話かもしれませんが、そういうことが起きるでしょう。品質と多様性の両方に対する要求のペースが高まることで、すばらしい、予想外のプロジェクトの誕生につながることもあるでしょう。

──多くの学生が多額の借金を背負って美術学校を卒業し、芸能プロダクション、テレビゲーム制作、商業美術などの比較的高収入の仕事をあてにしてきました。AIによる「テキストからイメージへの変換プラットフォーム」の登場は、彼らの将来にどのような影響を与えるのでしょうか?

コストを削減しようとする人もいれば、野心を膨らませようとする人もいると思います。野望を膨らませる人は相変わらず同じ給料を払い続けるだろうし、コスト削減をしようとする人は失敗すると思うのです。

──AIは、コールセンターや空港の手荷物検査など、人があまりやりたがらない仕事に大規模に使われるのが一般的です。そして、人々をよりやりがいのある、よりおもしろい仕事をすることができるよう解放できるというのがAIが提案している価値です。でも、アートの仕事はやりがいがあっておもしろいものです。こういう仕事に就くために、人は一生働き、技術を身につけて行きます。なぜそのようなレベルの世界に対して、その技術をビジネスの焦点や優先事項として向けて行くのでしょうか?

個人的には、そこに向かってはいません。私の製品は、プロのアーティスト向けに作られたものではありません。まあ気に入って使ってもらえるなら、それはそれでうれしいですけど。私の製品は……そうですね、たとえばこんな人のために作られています。あるとき私のところに香港在住のある女性が連絡してきて、こう言ってくれたことがあるのです「香港では親が子どもに絶対なってほしくない職業はアーティストなんです。なので私は今銀行員をやっています。銀行員として充実した生活を送っています。でも、Midjourneyが手に入って、実際になりたかった自分になれる経験を味わい始められたんです」と。あるいは、トラック用サービスエリアで、純粋に遊びとして、かっこいい日本風の野球カードを自作している男性もいます。Midjourneyはこのような人たちのために作られたのです。他の人たち同様に、彼らにはいままでやりたくてもその機会が巡って来なかったのです。

強調しておきたいのは、これはアートの話ではないということです。これは、イマジネーションの話です。イマジネーションはアートに使われることもありますが、そうでないことも多いのです。Midjourneyで作成された画像のほとんどは、プロ用途としては使われていません。共有さえされていないのです。作品は他の目的、まさに人間的な欲求のために利用されているのです。

──とはいえ、あなたの製品のアウトプットは画像で、それは他のすべての特性に加えて、プロの文脈での商業的価値を持ちますよね。そして、これはそのプロ経済を大きく混乱させるものです。

私たちはボートを作っていて、誰かがそのボートでレースに参加することはできます。でも私はそのボートはレースのためのものであるとは限らないと考えています。もしレースで使うのであれば……まあ、そうなるかもしれませんね。使われた瞬間はそうでしょう。でも、本当に大切なのは人間性だと思うんです……。私たちは、画像を美しく見せたいのです。花がミツバチのために美しくあろうとしているのと同じです。それは自然の美しさであり、アートの美しさではありません。機械に意図はありません。そして私たちの意図も、アートとは無関係です。私たちは世界がもっと想像力に溢れた世界になってほしいし、醜いものよりも美しいものを作りたいのです。

──この技術を規制するための、管轄権や権限を持てる政府機関があると思いますか? また、あるとして、そうすべきだと思いますか?

わかりません。規制は興味深いテーマです。何かをする自由と、守られるべき自由のバランスが大切なのです。技術そのものが問題なのではありません。水と同じです。水は危険です、溺れるかもしれませんから。一方、水は必要不可欠なものです。危険な場合があるからといって、水を禁止したくはありません。

──まあ、その水はきれいにしておきたいのですけれどね。

それは、そのとおりですね。

forbes.com 原文

この記事をお届けした
グノシーの最新ニュース情報を、

でも最新ニュース情報をお届けしています。

外部リンク

  • このエントリーをはてなブックマークに追加