Midjourneyが作成したアーティスト名一覧に関する訴訟資料概要

ペンギン
·

先日、Midjourneyが作成したアーティスト名一覧のリンクをポストしました。

このリストは「Andersen v. Stability AI Ltd.」訴訟の添付資料で、「Exhibit J (Midjourney Name List)」という資料になります。

この「Midjourney Name List」資料に関連しそうな部分のみ、訴訟資料の概要をまとめましたので、もしよければ参考にしてください。

以下の訴訟資料の概要になります。主にMidjourneyに関する事項部分をまとめています(61ページから75ページあたりで、省略している部分もあります)。

詳細内容については、以下の訴訟資料を実際にご参照ください。

訴訟資料のMidjourney関連部分まとめ

  • 2022年2月、Midjourney初期バージョンのリリース間近にMidjourneyのCEOであるDavid Holz氏は、MidjourneyのDiscordサーバーに、Midjourneyイメージ・プロダクトの既存の芸術的スタイル、特に特定のアーティストのスタイルを模倣する能力を宣伝するメッセージを投稿

  • Holz氏はDiscordメッセージで「このスタイル機能によって、(中略)ジャンルだけでなく、アーティスト名もあります。(中略)ほとんどアーティスト名です。(中略)4000人のアーティスト名です」と述べた

  • Holz氏は、「これが私たちのスタイルリストです」と言い、「Midjourney Style List」というスプレッドシートへのリンクを掲載

    → これが例のスプレッドシート(Webアーカイブリンク)で、訴訟資料としては「EXHIBIT J (Midjourney Name List)」(以下、Midjourney Name Listと呼ぶ)

  • 言い換えれば、Holz氏はMidjourneyのユーザーがこれらの名前をプロンプトの用語として使用することを明示的な目的として、Midjourneyが認識するアーティストのリストを公表している

-------------

  • 2022年2月以前の数ヶ月間でMidjourneyのバージョン1を訓練

  • 2022年2月、MidjourneyのDiscordサーバー上でHolz氏がMidjourneyのトレーニングデータについて説明

    → Midjourneyは少なくともLAION-400Mデータセットでトレーニングしている

  • LAION-400Mはオープンにアクセス可能なデータセットであるため、MidjourneyはLAION-400Mデータセットに著作物が含まれていることを知っていた

  • LAIONには他のデータセットの透かしの検出スコアも含まれており、MidjourneyはLAION-400MデータセットにCMI(著作権管理情報)が貼付された作品が含まれていることを知っていた

  • 2022年10月以降、MidjourneyはStable Diffusionのバージョンも組み込んでおり、テキストプロンプトに「--test」または「--testp」というコマンドを追加することで、ユーザーがアクセスできるようになっている

  • MidjourneyのモデレーターであるMolang氏によると、「「--test」と「--testp」は、Stable Diffusionを少し混ぜたものに、Midjourneyの微調整と魔法をたくさん加えたものだ」

-------------

  • 2022年7月以降2023年3月までのある時期、MidjourneyはLAION-5Bをトレーニングデータセットとして採用

    → DiscordモデレーターのDanger Awesome氏が、更新されたLAION-5Bデータセットが、今度の(Midjourneyの)データセットの更新の基礎になっていると述べた(2022年7月)

    → DiscordモデレーターのSunshineyday氏が、MJはLAION-5Bのサブセットで訓練されていると述べた(2023年3月)

  • Midjourneyのモデルバージョン5は2023年3月にリリース

    → バージョン5とそれ以降のバージョンは、LAION-5Bでトレーニングしたと考えられる

-------------

  • LAION-5Bはオープンにアクセス可能なデータセットであるため、MidjourneyはLAION-5Bデータセットに著作物が含まれていることを知っていた

  • LAION-5Bには透かしの検出スコアも含まれており、MidjourneyはLAION-5BにデータセットにCMI(著作権管理情報)が貼付された作品が含まれていることを知っていた

-------------

  • Midjourneyはまた、アナログのみのMidjourney Magazineを発行(デジタル形式では入手できない)

  • Midjourney Magazineの毎号の特集は、Midjourneyモデルによって生み出されたアウトプットのセレクションと、それを生み出したプロンプトである

  • 多数のサンプルプロンプトに、アーティスト名がキーワードとして使用されている

-------------

  • LAION-5Bデータセットには、学習画像のURLのみが含まれており、実際の学習画像は含まれていない(LAION-400Mも同様)

    →したがって、LAION-5Bをトレーニングに利用しようとする者は、まずimg2datasetツールまたは同様のツールを使って、URLから実際の学習用画像のコピーを取得しなければならない

    → Midjourneyはトレーニングに備えて、LAION-5B登録作品の法定コピーを1つ以上作成し、各Midjourneyモデルにトレーニングデータとして供給できるようにした

  • Midjourneyはまた、CMIのない作品の配布がさらなる侵害につながることを認識していた

  • Midjourneyは、アーティストの名前をプロンプトとして使用すること、すなわち、Midjourneyのユーザーがアーティストの作品を侵害することを奨励している

    → ここで実証されているように、MidjourneyモデルはCMIが削除/改変されたオリジナル作品のコピーを生成する

    → MidjourneyはCMIを保持しないため、ユーザーもCMIのない侵害作品を作成し、さらなる侵害につながる可能性がある

-------------

  • Midjourneyは、原告の人気、知名度、魅力を利用しようとする商業的なスピーチを行なった

  • Midjourneyが原告の名前を使用したのは、純粋に自社の画像ジェネレーターを宣伝するためであった

  • Midjourney Name Listに4700人以上の名前を掲載する目的は、名前が掲載されたアーティストの作品と見分けがつかないような作品を模倣し、作成できる機能を宣伝し、強調することであった

  • Midjourneyの商業的スピーチおよび原告の名前の使用は、Midjourneyとの提携、関係、関連について消費者を欺いた

  • Midjourneyは、機能を宣伝するためにアーティストの名前を公表することで、この高い認知度に依存している

  • Midjourneyは、原告のアーティストとしての評判を利用し、ユーザーに自社の画像ジェネレーターを利用させようとしている

  • Midjourney Name Listへのリンクは、CEOであるDavid Holz氏により、Midjourneyのユーザーや潜在的な消費者が頻繁に利用するDiscordで公開された

-------------

  • Midjourneyが原告の名前をMidjourney Name Listに掲載したのは、Midjourneyが原告の作品について訓練されたCLIPモデルを使用しているからである

  • 原告やMidjourney Name Listに掲載されているその他のアーティストの場合、CLIPモデルは本質的にトレードドレス データベースとして機能する

    ※トレードドレス:消費者にその製品の出所を表示する、製品あるいはその包装(建物のデザインすらも該当しうる)の視覚的な外観の特徴を指す法律用語である

    Wikipedeiaより

  • MidjourneyはそのCLIPモデルが原告およびMidjourney Name Listに掲載された他のアーティストのトレードドレスを、説得力を持って模倣するようトレーニングされていることを保証した

    → 言い換えれば、Midjourneyは同社のCLIPモデルが原告のトレードドレスの特徴的な外観を模倣できるようにしたのである

  • その結果、Midjourneyサービスは、消費者に混同を引き起こす可能性のある保護可能なトレードドレスを特徴とする画像を生成することができ、また頻繁に生成している

  • Midjourneyは、ユーザーが特定のアーティストの名前を入力するだけで、そのアーティストのスタイルで画像を生成できることを宣伝することで、自社の画像ジェネレーターを販売するために、原告のそれぞれのトレードドレスの固有の特徴を認め、実際にそれに依存している

    → このように、ユーザはアーティストのスタイルの画像を生成するために、プロンプトで特定のデザインや芸術的要素を説明する必要はなく、単にそのアーティストの名前を入力するだけでよいのである

  • Midjourneyは「text-promptsのヒント」を提供するオリジナルのオンラインドキュメントの中で、ユーザーに「ユニークなスタイルを得るためにユニークなアーティストを呼んでみてください」と推奨し、原告の一人である「Greg Rutkowski」を含むリストを提供

    → Midjourneyは、本訴訟で最初の訴状が提出された2週間後に、公開ウェブサイトからこれらのページを削除

  • Midjourneyは現在、「Showcase」と呼ばれる購読者がアクセスできるオンライン ギャラリーで、アーティスト名のプロンプトで作成された画像を宣伝している

-------------

  • Midjourneyは、画像パイプラインにCLIPモデルを組み込むこと、またMidjourney Name Listを通じて画像ジェネレーターの主要機能としてアーティスト名のプロンプトを販売することで、侵害画像の管理をしている

    → CLIPモデルがなければ、Midjourneyのユーザーは原告やMidjourney Name Listの他のアーティストのトレードドレス権を侵害することはできない

  • Midjourneyによるトレードドレスの侵害は、原告の権利侵害がこれ以上拡大しないよう、本裁判所がMidjourneyを抑制しなければ、取り返しのつかない損害を与え続けることになる

    → 原告には、Midjourneyによって引き起こされている損害、特にMidjourneyの侵害行為による信用と市場シェアの損失に関して、法律上の適切な救済がない

    → したがって、一時的および恒久的な差し止めによる救済を受ける権利があり、それを求める

以上、参考になりそうなポイントをまとめました。認識相違や誤りがある場合は、ご指摘ください。

Midjourney Name Listについて、日本のアーティストに関してまとめてくださっている方がいます。以下のポストをご参照ください。

@penpengin
生成AIのリスクや規制に関する記事のまとめを投稿予定。日本と欧米中心に記事をチェックしています。 また自分の論点整理用に情報を整理したものとかも投稿します。 X(Twitter)アカウント:@penpengin2023