できない人間が使う生成AIと、できる人間が使う生成AI

kinzal
·

最近、今まで全くやってこなかった音楽を生成AIの力でやりはじめて、見えてきたことをたらたらと書きます。

音楽は好きだけど嫌い

もともと、音楽を聴くことは好きでオーディオに2桁万円突っ込むぐらいには好きです。リモートワークをやっているということもあって、1日中音楽を聴いています。

でも、音楽を作る方はというと正直嫌いでした。音痴だし、リズム感はないし、楽器をできるほどの器用さもないし、ないないづくしです。学生時代の音楽の時間とか合唱コンクールとか本当に苦痛でした。

僕にとっての音楽は消費するものであって、僕にはできないものという感覚がとても強いものになります。

Suno AIの衝撃

そんな中で現れたのがSuno AIです。

詞とジャンルを入れれば聴ける音楽が生成できるというのにかなりの衝撃を受けました。気が付けば最上位のプランに加入して、睡眠時間を削って遊び倒してしまいました。

遊び始めてから1ヶ月でだいたい20曲ぐらい作ったと思います。

何が僕を駆り立てているんだろう・・・と、考えてみると、たぶんできないと諦めていたことができるようになったことが楽しかったのだと思います。僕が本当に欲しいものは僕にしか作れないという思想の持ち主なので、Suno AIによって僕の欲しかったものに手が届きはじめたというのが本当に嬉しかったのだろうなと。

ここまでの思いがあったのなら、これまでやっていればよかったのにという思いもありますが、自分の中の理想と現実のギャップと僕にはできないものという認識でやれなかった、やり続けることができなかっただろうなとも思います。

生成AIのすごさはこのギャップを飛び越えて始められるところにあると思います。

Suno AIの限界

2023/12時点の話になります。

Suno AIで曲を作っていて、曲は好きなんだけど音が気に入らないということが増えてきました。例えば声が割れてる気がする、余分な音で不協和音になっている気がする、音のバランスが悪い気がするなどです。

つまり、より高いクオリティの音楽を生成したくなってきてしまいました。

しかし僕は素人なので何もわかりません。ChatGPTに聞いたり、他の人の記事を読んだり、詳しい人に教えを乞いながら音楽制作沼に突入しました。

12月の頭からはじめたことを書きつらねると

  • 音声、楽器抽出

  • 音の修復

  • ミキシング

  • マスタリング

  • 音声合成

  • オーディオのMIDI変換

  • DTM

このあたりを一通り触るようなことをやりました。ブラックフライデー最高ですね。(使いすぎてカード止まりましたけど)

本当なら徐々に覚えながら音楽制作をするのでしょうが、生成AIの力によって全てを飛ばしてしまったがために、用語すら満足にわからない中で試行錯誤をしています。

これでわかってきたのが、できない人間が生成AIを使うことと、できる人間が生成AIを使うので武器の数が本当に違うということです。生成AIによってそれっぽいものを作れたとしても、何か違うと思ったときに素人にできるのはガチャを引き直すことだけです。しかし、できる人間ならガチャを引きなおさずにより洗練させることができるのは本当に強いです。

また、できる側の人間であれば問題に気づける、問題の内容を言語化できるというのも強いです。

LLMにしても、画像生成AIにしてもできる側として触ってきており、できない側として触ったのは音楽生成AIがはじめてだったのでようやく気づくことができました。

表現のマンネリ化

生成AIによって自分の好きなものを大量生産しているとかなり早い段階でマンネリ化します。

僕は詞をChatGPTで生成していましたが、7、8曲目あたりで、このワードは前に見た、このテーマは前に見たという状況に陥りました。もちろんプロンプトをいじることである程度は解消できます。できますが、大変苦行です。いまだに納得のいくプロンプトはできていません。

それならどうするかと言えば自分で詞を書くしかないわけですね。

この詞を書くという行為がとても面白くて、僕の中にあるものを言葉に置き換えていくという、なんというかとても原始的な行為でとても楽しいです。絵や音楽も本質的にはそうなのですが、詞の方がより深く潜りやすい感覚です。(僕がそうというだけで他の人がそうかは知りません。優劣の話でもないです)

世間的な評価はさておき、ここは僕の表現の軸となるオリジナリティの部分です。

ただ、僕の中にあるものはとても少なく、すぐにマンネリ化するのはわかっています。技術を上げるなり、表現を変えるなり、僕自身の幅を広げるなりしていかないといけません。しかし、軸は維持しなければなりません。そうでないと僕の表現の系譜が散逸していくことになります。

そういう視点で生成AIについてあらためて考えていくと、いい感じのものを作ることはできますし、同じようなものも生成できますが、ブレ幅が大きいのでどうしても違う人が作ったように見えます。

もちろん、この幅によって面白いものができることもあります。それによって僕の幅が広がることもあります。

でも、それは僕の表現じゃないというか、なんと言うか。

せめて軸を入れることができればと思いつつ、絵や音楽に軸ってどう入れるのだろうとか、僕が表現したいもの、伝えたいものってなんだろうと改めて考え始めて沼。

あと思うのが、AIで生成したものに対して好き、嫌いみたいな感情はあるけど、僕が作ったみたいな感覚が生まれません。たぶん苦労して作ったみたいな愛着が生まれないというのもあるとは思いますが、僕の中のものが入っていないというのも大きいのかもしれません。

おわりに

生成AIによってできなかったことができるようになったのはとても嬉しいです。でも、生成AIでさらに先に進む難しさはいろいろありますね。

たぶん、技術がどれだけ進化しても解決しない領域はあって、その領域を鍛えることと生成AIをどう扱うかを考えるのは大事なことなのかもしれませんね。