よく聞くけど意味を調べたことのなかった用語シリーズ。
なんとなく想像するとVTuberのVの部分をBOTにしたやつだと思っていた。
ストリーミングプラットフォームでライブ配信をする。
Live2D的なアバターが表示されている。
視聴者のコメントを読んで返事する。
それらを音声合成で読み上げる。
会話をLLMとかで動的に生成する。
マイクラを自動操作したりする。
この辺りが調べる前までの前提知識(想像)です。
わかったこと
だいたい想像した通りだった。
人間Tuberの雑談ライブなら1の質問に10のトークで返すところを1→1ぐらいのサイクルで高速にQ&Aしていた。
Neuro-sama
Neuro-samaのデビューは2022年12月らしいがこの時期はChat Completion APIがまだないはず。 どうしてたんだろう。
Neuro-samaがosu!をプレイする様子
音声合成
VOICEVOXに寄付しているので音声合成技術の使われ方は気になる。
以下は音声をvoicevoxからStyle-Bert-VITS2に移行した記事
>voicevoxでは決められたキャラから選択をするので他のAIVtuberなどと音声が被りやすい(オリジナリティが懸念)
がなるほどと思った。確かに。
次は
技術記事がQiitaやZennにもあったので次はそれらを読んでゆく