この数週間の生成AIを発端としたTwitter上の絵師の方々の話に関して思うこと

mikuta0407
·

予防線コーナー

  • 流れてくる話でイライラし始めたので発散のために書いています。書いた結果、結構落ち着きました。

  • 全員が全員そうだと言ってるわけではありません。

  • ちゃんと理解してる人も観測しています。

  • AI製と明記してないイラスト投稿には嫌な感情はあります。

  • 普段TwitterやPixiv等で投稿されているイラストは純粋に楽しませていただいています。

  • あんたどんな人?

    • 普段業務と趣味でプログラム書いたりサーバー触ったりしています。

    • 生成AIは2年くらい前にローカルでちょっと遊びました。たまにCopilotにプログラム作成的な質問を投げる生活をしています。

    • 音楽的な作品づくりは経験あります

  • 2024-11-14 23:30追記: (思ったより広がってきたので…。) イライラ発散駆動で書いたため、一部表現が強めになっています。すみません…。

何が起きてる?

あくまでも僕の理解を三行(三行じゃないかも)で書くと、

  • TwitterがGrokへの学習をプライバシーポリシーだけでなく規約にも明記した

  • 規約に明記されたことで、「11/15以降自分の絵がAIに学習されるようになる」と曲解した方々が焦り始める

  • 結果としてウォーターマークの追加やGlaze等による加工や、Twitterからの画像削除等が大規模に広まる

です。

お気持ちスタート

そもそもですね

11/15以降に学習されるようになるとかではなく、そもそもとして今世の中にでてる大半の画像生成("生成AI"製)はインターネット上にある画像を学習してるので、今更すぎるんですよね。Twitterはあくまでも隠れてやるのはまずいからちゃんと書こう、としただけであり、Twitterから離脱したところでインターネットにある画像は収集対象になり得るんですよ。むしろ規約等に明記することで無断でやらない、という点で正しいまであります。一部企業がTwitterへの画像投稿を辞めたり、加工することを宣言していますが……本当に今更すぎるというか……なんというか……。

生成AIは切り貼りではないし、Glazeはほぼ無意味だし、対策用ウォーターマークは多分誰も幸せにならない。今まで通り元画像をアップロードすればいいと思っています。それこそTwitterにもBlueskyにもPixivにも。

まぁぷらいべったーとかで鍵付き投稿するのは自由ですが。

2024-11-14 22:00追記: ここでのウォーターマークは「"学習させない"ことを意図して入れている透かし」のことです。著作権を守る本来の意味のウォーターマークについてはあるべきだと思います。

中途半端に理解してしまった人のツイートが伸びる

「こういうことです!」 みたいなまとめツイートだったり、お願いです、みたいなツイートによって、間違った理解が広まってるのが結構まずいです。どうもここ最近見ていると、「コンピュータのことはあまりわからないがコンピュータを使って絵を描いている」という層(これ自体に批判の意図はないです)に伝わりやすい文を書ける人が、自称エンジニアだったりを名乗りながら、「こうされてしまう」「Glazeをかければいい」「◯◯に移行すればいい」「ウォーターマークを入れればいい」的な話を断定口調で書いたりしてるんですよね。そしてそれがコミュニティに一気に拡散されていく。その結果ふんわり不安に思っていた人や、そもそも気にしてなかった人にもリーチして、一斉に不安を煽りながら"誤った"対策が広まっていく。

Glazeにものすごい期待してる人が多いんですよね。肉眼で見えてる時点でもう関係ないので…。ノイズなんてJPEGノイズのほうが酷いだろどう考えても…

収集されるのは別にTwitterだけではない

GeminiやMSCopilotだって相当にインターネット上のイラストを学習しているでしょうし。「今更?」感がすごいなぁって…。

むしろ少し前に大きく話題になったNovelAIは、Pixiv等の転載サイトが学習元だったりしますからね、Twitterだけが危険な場所ではないんです。インターネットなので。インターネットに公開アップロードした時点でもう何が起きてもおかしくないのです。性悪説つらい。

集団ヒステリーと化すコミュニティ 4年前を思い出す荒れ方

もちろん適切に理解してる方々はいらっしゃいますが、既にTLに何人もイラストを学習されたくない一心で画像を消したり正直現段階ではもはや無意味な対策をしているアカウントがたくさんいます。生成AIを作っている人たちがそもそも悪、みたいな話をしていたり、こうすれば回避できる!、のような話が大量に飛び交い、絵師さん方の反AIの考え方がもはや陰謀論レベルになっていて、集団ヒステリーを起こしているレベルです。

ふと思い出したのが、4年前、2020年のコロナ禍が始まった頃。一気に反ワクチンを含めた陰謀論が広まりましたよね。誰かが意図的に仕組んでいてワクチンにマイクロチップみたいなそういうのだったり、某議員が今本気で信じてる話だったり、政府が云々で異様にヘイトを向けるやつ…。なんか、あれを思い出しています。

実は4年前、フォローしていたとある絵師さんがいきなり政治的な(デマを多く含む)批判ツイートをしだして大きく変わってしまったのを見たことがあります。かなり悲しい思いをしながらフォロー解除とブロックと報告をしたのですが、今回の騒動で画像削除だけでなく異様に生成AIに対して勘違いを多く含む批判や煽動をするツイートをたくさん見ており、再来だなぁと。

助言が曲解される風潮

この記事では(本来良くないけど)意図的に引用を避けていますが、「技術的側面から、Glazeをかけたり、対策用のウォーターマークを入れるのは"悪意ある人"からはあまり守れないし、むしろ誰も幸せにならないし、こういうことだから意味ないよ」という純粋なアドバイスをしても、「生成AIの味方」「学習させようとしている人」みたいなレッテルを貼られるような話も見ています。アドバイスをしている人は技術的に正しい理解を広めようとしているだけであり、かつ"汚い絵"を見るのは嫌だから教えているだけなのにも関わらず、攻撃されたかのような反応をされるそうです。もう完全に陰謀論の域になってます。耳をふさがれてしまっているので、その前提を覆すことは相当困難です。

マイナンバーに関する極端な誤解に近いものも感じます。そんなことにはならないし出来ないんだけどな、みたいは話も多い…。

絵を楽しませてもらってる立場としては、誤った理解を発端とする各種対策が辛いです。

二次創作だから学習されると困る?

二次創作を学習されると版権元に迷惑が、みたいな書き込みも見ました。……今更かなぁって……。既存の学習されている各種モデルで特定のキャラが出せている時点で、今から対策しても関係ないのではと……。特にTwitterに関しては、冒頭にも書きましたが、11/15から学習されるのではなく、既に学習には使われている上で、ユーザーに対してしっかり明記してるだけなので……。

生成AI製の画像かどうかって正直見ればわかるが、嗅覚の有無が大きそう

人間が描いた絵か生成製の絵か、正直見ればわかるというのがあります。明らかに違うんです。ただ、最近感じるのは一目で生成AI製だな、と思う画像に対して「生成AI製だと気づかなかった」という反応が多いことがあり、嗅覚の有無がでてきたなと感じています。

2022年頃、一気に生成AI製が誰でも使えるようになったあたりの画像を見たり、自分で生成してみて遊んでた人たちは、おそらくまだ判断がついている気がします。決定的に違うんですよね、何かが。手描きと。具体的にどう、とは言いにくいのですが、感覚的に分かる部分があります。

これ、なにか近いものを思い出したのが、所謂ダウンロードボタン詐欺的なやつです。2000年代から2010年代前半にPCでインターネットを楽しんでいた人たちは、偽ダウンロートボタンを感覚的に瞬時に避けて正しいボタンを押すような事ができる事が多い印象があります。この事象と同じで、生成AIが簡単に動かせるようになったあたりで技術的興味から触っていた人と、2023年あたりからの怒涛のような発展とともに半ば受動的に生成AI製の画像を見た人では、嗅覚の発達にかなり差がついてしまっているような気がします。

で、現時点の生成AI製画像に対する嗅覚が通用する人間として思うのは、人が描いたものは人にしか出せない、ということです。

いろんなイラストレーターさんがいますが、それぞれその人特有の表現がありすぎて、統計的に出力する生成AIとは完全に違うんです。特定のクリエイターをターゲットとして模倣したモデルの場合は当然寄る気はしますが、まぁ…多分根本的な部分では見分けついてしまうと思います。それこそ「温かみがあるかどうか」は、イラストに関してはわかってしまうかと。

絵を描いていない立場なので勝手に言っていますが、「学習されたとしてもその絵を上回る熱量と感情が載った絵は出ないんだから、自信を持って投稿し続けてほしい」と思いますね。コンピュータと戯れてる人間がこういうことを言うとは思わなかったぞ。

生成AIに対する印象の違い(憶測)

面白いなぁと思うのは、プログラム書いて生活している立場としては生成AIってアシストツールなんですよね。代替システムではない。生成AIが出力するものが正しいと思っていないので、あくまでもアシスタントとして参考になるものを出力してくれたり、うまくロジックが思いつかないものを自然言語からプロトタイプに起こしてくれたり、めんどくさいSQL文を解説したりぱっと作ってくれたりするツール、みたいな付き合い方をしています。

ところが、アート分野だと出力されたものがそのまま成果物になってしまいます。出力物をベースに、となると"トレパク"的な感情になったりするのでしょうか。難しいですね。確かに直接的に出力物が競合するとなると"敵"と考えてしまう…のかもしれません。

IT屋とイラスト屋の違い

話は戻りますが、生成AIをアシストツール的に使うIT屋と、極端に生成AIを忌避するイラスト屋で話が通じないのはなぜかを考えてみましたが、

  • IT屋は怠惰であることが美徳

  • アート分野は努力の結晶

という大きな違いがあるなぁと。まぁ、わかりあえるわけが無いですよね。真逆ですもん。"楽にしてくれるもの"という捉え方と、"出力自体には努力が見えないが競合するものが出てくるもの"という捉え方、完全に逆です。文化的にそうなので、どっちが悪いとかじゃないです。単純に逆なんです。

そしてソフトウェア開発者に絞れば、「成果物はライセンスは守ってほしいけどその範囲内では自由に使っていいよ」「知見をブログやQiitaで広めるよ」といった文化が存在するのに対し、イラストに関しては(当然)その作品のさらなる加工利用は厳禁です。完全に成果物に対する考え方が違います。本当にわかりあえるわけがない。(IT屋視点で書いてますが逆も然りだと思います。IT屋の常識が狂ってる場合もある。)

両方に足突っ込んでる人すごいと思います。

音楽制作に関しては、誰かのフレーズにインスピレーション受けて作ったものだったり、意図的な他曲の取り込みだったり、サンプリングして…のような文化もあるため、商業的に見れば脅威にはなり得るかと思いますが、アシストツールとしてのポジションになる可能性は大いに秘めているのでは、と感じています。

ブロックの使い方の違い

本筋とはそれますが、最後の話です。ここ最近、世の中にはブロック機能の使い方が2種類あることを知りました。

  • 見たくないから自衛としてブロックする

  • 見られたくないからブロックする

これ真逆ですよね考え方。この前、「AI屋に学習されたくないから投稿者をブロックしていたのに、ブロック貫通で画像が保存できるようになってる!!!」というツイートを見て、意味がわからなかったんですが、こういうことかと。

言いたいことを箇条書きに言い直して終わります。

  • 11/15から学習されるわけではないのに、技術的な面も含めて正しい理解がイラストレーターのコミュニティに伝わっておらず、曲解されて伝わっている。

  • ウォーターマークもGlazeも現状の学習からすればそんなに効力があるものではない。

  • 特にイラストレーター系の反AIの考え方が陰謀論化している。危険。

  • 技術的にアドバイスできる人々と、反AI陰謀論者化しつつある人々は、根本的に"制作"に関する考え方が異なるのでわかりあえるわけがない。つらい。

@mikuta0407
@mikuta0407, たっくんです。