Style-Bert-VITS2のlitagin様がチュパ音モデルを3種類も公開してくださったので、軽く比較してみました。
軽く触った限りですが、単純なクオリティで見ると最初のモデル。キャラ性を出さない汎用性の面では後に公開された2種が良さそうです。
ただ、chupa2~3、特に2に関しては文字数が少ないとノイズが増える印象があるため、ちょっと文面を長めに工夫したほうが良さそう。
手軽に使うならchupa2~3、音声加工してでもクオリティを求めるなら初期版を使ったほうが良いように感じました。
https://github.com/litagin02/Style-Bert-VITS2
https://huggingface.co/litagin/sbv2_chupa
■謝辞
OSSおよび各種素材の制作者の皆様に感謝します
・AI関連
イラスト:Stable Diffusion
Model:ioliPony
音声:Style-Bert-VITS2
Anneli / Anneli-nsfw
sbv2_chupa / chupa2 / chupa3
フレーム補間:Flowframes
Model: RIFE
・AI以外
GIMP / Shotcut