Style-Bert-VITS2のチュパ音モデルの比較

發布於: 

11

Style-Bert-VITS2のlitagin様がチュパ音モデルを3種類も公開してくださったので、軽く比較してみました。 軽く触った限りですが、単純なクオリティで見ると最初のモデル。キャラ性を出さない汎用性の面では後に公開された2種が良さそうです。 ただ、chupa2~3、特に2に関しては文字数が少ないとノイズが増える印象があるため、ちょっと文面を長めに工夫したほうが良さそう。 手軽に使うならchupa2~3、音声加工してでもクオリティを求めるなら初期版を使ったほうが良いように感じました。 https://github.com/litagin02/Style-Bert-VITS2 https://huggingface.co/litagin/sbv2_chupa ■謝辞 OSSおよび各種素材の制作者の皆様に感謝します ・AI関連  イラスト:Stable Diffusion   Model:ioliPony  音声:Style-Bert-VITS2    Anneli / Anneli-nsfw    sbv2_chupa / chupa2 / chupa3  フレーム補間:Flowframes   Model: RIFE ・AI以外  GIMP / Shotcut