AITuberを調べた

laiso
·

よく聞くけど意味を調べたことのなかった用語シリーズ。

なんとなく想像するとVTuberのVの部分をBOTにしたやつだと思っていた。

  • ストリーミングプラットフォームでライブ配信をする。

  • Live2D的なアバターが表示されている。

  • 視聴者のコメントを読んで返事する。

  • それらを音声合成で読み上げる。

  • 会話をLLMとかで動的に生成する。

  • マイクラを自動操作したりする。

この辺りが調べる前までの前提知識(想像)です。

わかったこと

だいたい想像した通りだった。

人間Tuberの雑談ライブなら1の質問に10のトークで返すところを1→1ぐらいのサイクルで高速にQ&Aしていた。

Neuro-sama

Neuro-samaのデビューは2022年12月らしいがこの時期はChat Completion APIがまだないはず。 どうしてたんだろう。

Neuro-samaがosu!をプレイする様子

音声合成

VOICEVOXに寄付しているので音声合成技術の使われ方は気になる。

以下は音声をvoicevoxからStyle-Bert-VITS2に移行した記事

>voicevoxでは決められたキャラから選択をするので他のAIVtuberなどと音声が被りやすい(オリジナリティが懸念)

がなるほどと思った。確かに。

次は

技術記事がQiitaやZennにもあったので次はそれらを読んでゆく

@laiso
インターネットユーザー。lai.so