2019年7月7日日曜日

ボイスチェンジャー環境メモ

久々このネタでいきます。
ソフトウェア(VST)主体、ハードウェア主体それぞれにメリット・デメリットがありますが、現行環境は元々のソフトウェア環境に戻しました。

前がこれで...(写り切ってない機材もあり



今がこれ...


自称ミニマリストだから、やっぱりものがないのはいいですね!
オールVST(ソフトウェア)環境に戻した原因としてはRoland VT-4を常時変換モードにて運用していた背景が大きいです。

ボイスチェンジ変換部分においての常時変換と声判定変換の特徴としては

常時変換
・ささやき声の漏れ誤変換がない(VST変換はほぼこれに該当)
・声以外の環境音も常に変換する

声判定変換
・声以外と判定され素通りされた時、(ピッチ上げによる)破裂音などの甲高い音もある程度緩和できる
・声を入力しているのに声以外と判定され素通りする場合がある(大事故!!!
・クーラーなどのノイズ元になる音が常時入っている場合、声判定が甘くなる機種がある

大雑把に挙げると上記のような感じになります。
VT-4を常時変換で使っていたため、VSTでいいじゃんとなったわけですね。
また、ピッチ・フォルマントシフト変換部分を声かどうかで判定するハードウェア機材で、Roland VT-4/Degitech Vocalist Live FX/○〇-〇 ○ ○と触ってもいたのですが、ASMRなどで環境音を入れることを目的にしていない事もありました。

個人的には音響機材の針が振れていたり、ランプがついてるのをボーッと眺めるの好きなのですが、基本的にハードウェア機材を通すと音の解像度が落ちるという問題がありまして、これは機材単体で見れば問題で無くても、これらを接続する"物理的"なケーブルとその長さ、加えて両端のコネクタがネックになっていたりします。

そういった事も踏まえて、自由にオーディオインターフェース内部でこれをどこに、それをどこにと音の送り先が指定できるものが欲しくなり、TotalMix FXという専用ソフトが使えるRME Babyface Proに目をつけました。

とりあえずいつも通りハードオフで検索すると近場にて発見したので取り置きの電話...


定価10万円のオーディオインターフェースはもちろん買ったことも無いので若干緊張していましたが、その日のお昼にご対面...


財布からお金出すまで正直買うか買わないかで迷っていたけど、買わずに後悔するのは嫌なので買いました。
そして、家でとりあえず出音をAKG K701直接続で聞いてみたら中高音の立ち上がりが綺麗すぎて数日間家に帰るや音楽鑑賞を数時間してました。
そんな出音の素晴らしいBabyface Proですが、好みの問題になるところだけど、マイクプリアンプ部はGolden Age Project Pre-73 DLXの方がいい感じに聞こえていたので、
AT2050-Pre 73 DLX-VT-4-Babyface Proと物理的に繋ぎ利用していました。

...が、ここで1つ問題があります。
Roland VT-4のフォン出力は明らかにモニタリング用ステレオミニ出力より音の解像度が低い(?)ので、これを通すだけで"音質"は悪くなってしまいます。

今まで使っていた機材をリプレイスする過程で衝動買いしてしまったVT-4さんを無理に構成に組み込み使っていましたが、解像度が悪いものをよくする魔法は知らないので外すことにしました。

(電子機器・音響機材のある場所で喫煙はやめましょう)

これだけではVT-4って買う意味あるの???って思われるので色々な場所で使ってみた感想

・電池やモバイルバッテリーからの給電で動く(カラオケでも車内でも使える
・各種エフェクトやミュートが手元操作で出来る
・声判定変換/常時変換が切り替えられる
・PCと接続しイコライザ設定を入れ替えることでモニタリングと出音の性質を多少変更可

と言った感じで、筐体の小ささもあり、機動性を活かした用途にて頑張ってもらおうかなと思います!!

VT-4を外したことによってAT2050-Pre 73 DLX-Babyface Pro-DAW(にてボイスチェンジ)という構成になったわけですが、Pre 73 DLXの出音は所謂NEVEサウンドと言われてまして、Focusrite ISA ONEと似ている事と、元となっているビンテージ機材のモデリングプラグイン(VST)も複数あるので外しました。
オーディオインターフェースのマイクプリアンプ?そんなの使いません。ファンタム電源を入れる機械にしか思ってなかったりします。

あーだこーだ書いても仕方ないので、とりあえず現行のマイク-オーディオインターフェース以後のPC内のルーティングを以下にまとめます。

                    

モニタリング周りは手軽に弄れるのがいいので、アナログミキサーを用いて運用していましたが、ここでRME社オーディオインターフェースで使えるTotalMix FXの登場です。

                    

ぱっと見わかりづらいのですが、このような音の流れになっています。


Babyface Proの本体側AN1にマイクを繋ぎ、その音をDAWにて取り込んだものを2トラック用意しました。
↑の画像のDAW出力先となっているADAT 5/6から3本、PH 3/4・ADAT 5/6・Main (ADAT3/4)まで紫矢印で音を出している状態になりまして、モニタリングに使っているDAW側のトラック①からはPH 3/4に、配信に流す方の音②はADAT 5/6とMain (ADAT 3/4)に流している状態になっているので、仮に配信に流す音のモニタリング音声が遅延を感じる状態であったとしても、こちらはモニタリング用のみのトラック①の音声を聞きつつ、かつケーブルレスでルーティングが組めるものとなっております。
Voicemeeter Bananaでも同様の事が出来るかと思われますが、こちらは知覚できるレベルでの遅延はありません。これがすごい!

であるからして、配信側に流すトラック②の方がモニタリング用①と比べてほんの数10~50msec遅れを感じるものである場合でも通話にも使えます。(Little Alter Boyなど
また、歌録りの場合は後でトラックの調整で対応という感じになります。
(IRCAM Trax V3などのように400msec以上遅延のあるものである場合の通話利用は少し厳しいかも知れません)

上記のルーティング環境を構築し、DAW内のVSTはこれらを利用しております。


・マイクプリアンプ:Slate Digital FG-N/FG-73


WavesのVEQ3Scheps73、Sonimusのburnley 73なども有名なNEVE 1073アナログモデリングプラグインでおすすめですが、好きなの使え論で中音域のまるみがちょうどいいこちらを利用しています。
そこまでバリバリにかける人もいないと思いますが、FG-Nに強めにエンハンサやイコライザをかけても音が物故割れにくい気がします。
無料でNEVE 1073っぽいプリアンプを探してみたけど見つからなかったので、ただ音もれればいいっしょ的な方は適当にアンプシミュレーター系プラグインを刺せばよいと思います。

・ノイズゲート・エキスパンダー:NS1FLOORFISHGatelope


BOSSのNS-1というノイズサプレッサーをモデリングしたプラグインになります。
右のスライダーで設定した値より下の音にはノイズゲート・エキスパンダー処理(ズバッと消さずに不自然ないように消す)をするものです。
また、無料のものですとFLOORFISHやGatelopeおすすめです。
これらノイズサプレッサーとして売ってるのですが、普通に扇風機やクーラーの風切り音は声に乗ります。ですので、過度な期待はNGです。

また、iZotopeなどのノイズリダクション系プラグイン、iSP Technology Decimator IIやRocktron Hush Proなどのノイズリダクションハードウェアも試してみましたが、基本的にノイズリダクションをかけるほど声質が硬くなります。
ですので、使うとしてもゲート・エキスパンダーの方がいいと思います。何にしてもやりすぎはNGです。

・ピッチシフト/フォルマントシフト変換



ここらへんから更に有料VST祭りになりますがごめんなさい。
お手軽さと音の良さから個人的にずっとお気に入りなVSTになります。
ハードウェアで言うならDigitech Vocalit Live FXと並ぶ音質で、DAW内での動作になるのでケーブルでの問題は皆無。
トーン上げしてない地声入れてもピッチ+8~+10までは個人的に使ってもいいかなと思うレベルで破綻しづらいです。
VSTでのピッチ・フォルマントシフトは基本的に常時変換であるので、吐息やささやきももちろん変換の対象になるのですが、ピッチを上げすぎなければそこまで違和感ないと思います。
人によっては歌うことも出来るみたいですが、あくえりさんには無理でした。



1つだけ使ってくださいと言われたら喋りも歌もいけるこちらを選ぶくらい使っています。
無料VSTで挙げるならRoveeとほぼ同じくらいのレイテンシですが、吐息変換もLittle AlterBoyほどではないにせよRoveeより頑張ってくれるので、モニタリング用途として重宝させてもらっています。
体験版もあるので使ってみてほしいなと思います。


・エンハンサー/エキサイター



使うだけで音にきらめきを与えるという宣伝文句は嘘じゃないです。
しかし、こちらもやりすぎは禁物。声であれば倍音部分にかけて整えるために使ったり、直接声のキャラクターを変えるために基音部分にかけたりして利用しています。
無料のものでこちらと同様な動きをするものに、La Petite Exciteもありますので、とりあえず触ってみてどういうものか感じてみるのもいいと思います。



こちらつい最近導入してみましたが、今年買って良かったものTop 5に入ると思います。
どうやらエンハンス処理をかける部分が動的になっているようで、ボイスチェンジ用途以外にも音楽再生にもおすすめです。
また、Aphex ExciterのBig Bottom機能と同様の機能も含まれているので、単品購入出来ないのは残念ですが、Aphex Vintage Aural Exciterよりはこちらをおすすめします!


せっかく取り回しケーブルを減らしたのに、プラグイン刺しまくって音悪くするのも嫌なので、基本的にはDAW側でやることも最小限にしているつもりです。
歌う時はリミッターやイコライザも使っていることがありますが、基本的にはほんのちょっとの変化なので今回省いてます。
システム開発と同じで細かい環境構築に時間を割くのもアホらしいので、とりあえずDAW側にアンプシミュレータとピッチシフトプラグインを入れて、どんなもんかなってやってみるのもいいかなと思います。
DAWから出してるモニタリング用出力の方ですが、オールハードウェアで構築した時と何も遅延が変わらないので、Babyface Proを買うかUniversal Audio Apollo Twin MK IIを買うかAntelope Discrete 4を買うかで迷って今したが、TotalMix FXが使えることも含めてこちらでよかったなと思っております。

基本的にはピッチを上げて見て、そちらに合うフォルマントを微調整していくという感じで、裏声成分の使いすぎで入力音声がスカスカにならないあたりまでピッチを下げます。
あくえりさんの声の調整方法はVTuberの赤星ナナハ様がほぼ同様の方法でしたので勝手ながらリンクを張らせて頂きます。
ボイスチェンジャー完全に攻略しよ!!!

2019年5月13日月曜日

AmazonにRoland VT-4のレビュー投稿したけど、多分載らないからこちらに...


コピペしたら記事が出来た!(チャンチャン


ボイスチェンジャー目的で購入しました。
同社UA-100、他社のボイスプロセッサーを所有しておりますが、それらとの比較レビューになります。

まずは筐体のサイズ感ですが、ノブ部分を除けば2ch入力のオーディオインターフェイスと同等なので、机の上に置いて弄るのに良さそうです。
ドライバの設定項目にはピッチ・フォルマント・リバーブを数値で確認することが出来ないのですが、そこまで弄るものでもないので少し触ってみてシンプルな使い勝手だと理解できると思います。
Windowsのみでの確認ですが、USB接続するだけでドライバがインストールされ、出力デバイスの方に変換をかけた音声(WET)、何もかかってないもの(DRY)、前者2(MIX)が追加されており、DAW利用にてさらに環境構築も可能となっております。

マイク入力はXLR/PHONEとステレオミニプラグタイプのマイクが利用可能です。
ファンタム電源供給可能なのでコンデンサマイクも利用できます。ダイナミックマイクの場合電源は不要で、入れてしまったとしても特に問題があったことはないですが、接続の際は注意した方がよいと思われます。
また、手元にないので試せてないのですが、バイノーラルマイクでステレオミニ接続になるものは直接利用できないようです。
本体上面の左上から2番目のノブで入力ゲインの調節を行うのですが、私の手元にあるVT-4ですと、波形的には大体10時半から11時くらいのあたりからノイズが混入するようです。
そのため、基本的にはマイクプリアンプを介しての入力を行っております。こちらもピンキリですが、利用したことがある製品の価格だけを見るなら、ゲインを盛った際の音の歪みや解像度ダウンを考慮し、実売価格15000円以上のものと組み合わせることを推奨します。
入力ゲインが不足すると、後述する常時変換がOFFの場合は特に誤変換を起こしやすいので、なるべくピーク近くまでゲインを盛って利用しています。

肝心のボイスチェンジ利用において最も重視されるピッチ・フォルマントの変換精度ですが、背面のPHONE出力されたものを同社UA-55でキャプチャしたものをモニター・録音してみた限りですと、あまりよろしい感じには思えません。
VSTプラグインですと廃盤製品になるBOSS VT-1をモデリングした(間違ってたらすみません)SoundToysさんのLittle Alter Boyというプラグインがあるのですが、こちらと比較しても1ランクダウンで声の解像度が低く感じられます。
何も意識せず発声した私の声ですと150Hz前後で、VT-4で変換する際は下が180190Hz、上が大体220Hz240Hzの声を入れておりますが、それをピッチシフト変換した場合、大体3メモリ手前の2.5メモリほどから声が破綻します。
それをシフト量に換算すると大体142%ほどで、高くすればするほど吐息が入った際の音がざらつきがちなので、2メモリちょうどかその手前で利用しております。
フォルマントの方も同じく、2メモリかそれより少し上くらいになります。
こういったピッチシフトを利用した製品で利用してきたものに大体通じるのですが、喉にエッジがかった声やがなり声・リップノイズや口笛は誤変換のもとになりますので、遠くの人を呼びかける際に出す声をイメージする感じで少し高めに声を入れるようにしております。

エフェクト以外の付加機能において、ノイズゲート・ローカットフィルター・エンハンサーがありまして、ノイズゲートは周囲の空調音やリップノイズを消すのに利用しています。
これらは144段階で設定できるのですが、1のときは無効状態のようです。
BBEのエンハンサーを持っていないのでAphex 104 Type CAphex現行最新のエンハンサー(エキサイター)との比較になりますが効きは弱めなので、出力された声に厚みが足りていると感じられる方は4に設定し、抜け感を重視してもいいように思いました。
ローカットフィルターの方は、別途マイクプリアンプと接続した状態で特にノイズの混入なども見受けられないので利用しておりません。
電源ONの際に本体上面のROBOTボタンを押しながら右上のつまみをそれぞれ合わせ起動することで、いくつかの設定が変更できます。
私が変更したのは以下になります。
C#Pitch & Formant Routing(常に変換をする):吐息抜け防止のため。
D#の本体上面BYPASSボタンをミュートボタンに: BYPASS音声はBALANCEフェーダーを一番下にして流すため。
FFormant depth:フォルマントの変化範囲、調声がしやすくなる。。

ノイズの混入を未然に防ぐため、PCとはフェライトコアつきのUSBケーブルで接続しておりますが、グランドループ接続になってしまいノイズが混入してしまうケースになってしまった場合は、VT-4を乾電池で動かすかUSBハブを別途用意し、そちらから電源をとる形で対応すれば問題ないようです。

総評としまして器用貧乏な感じは否めませんが、シンプルなボタンやフェーダー構成の割に設定できる項目も多く、設置スペースに問題があり、なるべく最小構成で利用したい方や乾電池駆動可能であるためカラオケなどに持ち込んで利用したい方によさそうです。

2019年1月7日月曜日

ボイスチェンジャーで遊ぼう

お久しぶりでいきなりですが、自分でまとめておかないと忘れてしまうので、ボイスチェンジで遊ぶ際に調声するフローを書き連ねていきます。

ボイスチェンジで何をするのか・・・
基本的に音の高さとなるピッチと音色となるフォルマントを弄り、男性であれば女性のように女性であれば男性の様に聞こえるようにして遊びます。
自分の場合は男性→女性のアプローチをかける事になるので、その逆で同様にいけるかは保証できません。

まず、恋声を触ってみた後に、返しの声のディレイがきついため、巷で発売されているRoland VT-4というハードウェアを手に取るって方が多い気がしますが、これだけで環境揃うって人はほぼ見たことありません。
あれやこれやつけてやっとということになると思いますので、ボイスチェンジ機材単機運用は基本的に頭から捨て去ってください。

自分でもよくわかってない理論だかをつらつら書き連ねても仕方がないので、あれやこれや触ってこうすればこうなる(感覚)を以下に綴っていきたいと思います。
基本的にソフトでもハードでもマイク入力から流すフローは同じだと思いますので、配線であれやこれや取り回す必要のないソフトボイスチェンジから入っていくのが調声しやすいのではないかと自身考えています。

初めてボイスチェンジ的機材触れる機会の多いものとしてはメガホンが頭に浮かぶと思いますが、口を拡声器に近づけ、それをあの構造から拡散するという形になっています。
ボイスチェンジもこれと割と近いものとして認識しておりまして...

マイク-ボイスチェンジ-出力

ではなくて、口を拡声器に近づける行為に当たるマイクプリアンプが最低限必要だと思ってください。
入力するマイクで主に用いられるものとしてはダイナミックマイク・コンデンサマイク・プラグインパワーマイクが大体だと思われますが、コンデンサマイクであってもマイクプリアンプまたはその機能を内包したミキサーが欲しいところであります。
なぜその必要があるかというところですが、入力のゲインをマシマシしてしまうと、ノイズをそのまま増やす事となり、その結果ボイスチェンジする部分で誤変換をしてしまうこととなる要因になってしまうためです。

マイク-プリアンプ(該当機能を内包したミキサー)-ボイスチェンジ-出力

先ほど説明した点を踏まえますと上記のような構成になると思います。
これに加えまして、ボイスチェンジする段階で変換してほしい周波数のみを指定してやりますと、さらに誤変換の割合は減りますので、それを基にしますと...

マイク-プリアンプ(該当機能を内包したミキサー)-(グラフィック・パラメトリック)イコライザ-ボイスチェンジ-出力

上記のようになっていきます。
男性の声を例に挙げますと80~100Hzより下の周波数が含まれておりませんので、そういった部分をカットすることによって誤変換の元となる音をボイスチェンジの段階に入れないようにすることが可能になります。
ミキサーを使ってケーブルノイズを消すことはあまりよろしくないのですが、どうしようもない機器のホワイトノイズを消すことも出来るといえば出来ます。

これにて一先ずボイスチェンジ環境がそろうわけですが、とりあえずピッチを上げて出力された音と無変換で出力された音を聞いてみてください。
男性の場合で試すときは、寝起きの時の声、ほぼ地声、喉のエッジ(振動)を減らした声、喉のエッジ(振動)を減らしつつも遠くの人に通るような声、地声成分も入った低い裏声、完全に裏声を通してみてください。
どれを通してみても感じるのは、音量が小さくなっている点と声が奥に籠ったようなものになっている点だと思われます。

せっかくプリアンプやイコライザを導入しているのであれば、まずそちらから弄ってみましょう。
プリアンプもいきなり+に最大に振り切った状態にしますと音割れした出力音を出すだけになりますので、ボイスチェンジの部分で音を増幅するのではなく、その前段階のプリアンプ部分で増幅してやる感じで少しずつ調整してやるといいと思います。
また、イコライザの理解を得るために勉強するかってなりますと、英和辞書ほどの厚みがある本を手にする羽目になりますので、とりあえず弄っていく際は+にして目立たせるのではなく、強調したい周波数以外を-にして調整してください。

それでも声が奥に引っ込んだ感じがする方はエキサイター(エンハンサー)を噛ませてみるとより効果的です。その場合は...

マイク-プリアンプ(該当機能を内包したミキサー)-(グラフィック・パラメトリック)イコライザ-ボイスチェンジ-エキサイター(エンハンサー)-出力

となります。自環境ですとエキサイターが最も効果的に声の音色(声質ではない)が変わったように感じました。
仕組みはよくわかっていませんが、イコライザに表示されている波形を見てみると、基音から連なる倍音が増えていることがわかり、倍音が増えるという事は音に艶が出るということになりますので、つまりそういうことなのかなと思います。
ただし、こちらもイコライザと同じく広域部分だけ目立たせようとすると、声がギザギザになってしまうので、かけすぎに注意です。
自環境ですとAphex Exciterを使用しているのですが、こちらはベリンガーやBBEのものよりもかかりが強いみたいなので、少ししかノブを回しておりません。

ここで今更なお話になりますが、ボイスチェンジ機材を通してどのような声に変換したいかは個々人によって様々であると思われますが、すごく低い声しか出せない方がすごく高い声に変換するというプロセスは基本的にうまくいかないものと思ってください。
しかし、男性の声の高さも基本的にみんなそんなに変わらなくて、エッジ(呪怨のアアアアみたいなの)や響きの部分が音の低さとして認識される起因になっているとかいう論文をはるか昔に読んだ気がするので諦めないで欲しいです。
これに加えましてボイスチェンジ機材を通してない男性の声でも、平均200Hz~220Hzの声を出していれば、リアルで声パス出来るとかいう論文をこれまたはるか昔に見た気がしますので、ボイスチェンジ機材はそのためのアプローチに思っていただければと個人的には考えております。
また、人の構成と設定をパクったからうまくいくってこともほぼないと思われますので、ある程度試行錯誤は必要になってくる事を踏まえた上でソフトボイスチェンジ環境を紹介しようと思います。


まずはVSTの方からになりますが、基本的に通るフローは当記事で紹介したものと同じで、上記の画像ですと上から下に通っていく順序になります。
コンプレッサーやイコライザーに関しては、無料で探しても腐るほどありますので、何でもいいですよって感じです。
また、iZotope系のノイズ除去プラグインですが、始めは使っていましたが、かければかけるほど音が硬くなるし、誤変換を減らす要因としてはあまり役立っている気がしないので今は使ってすらいません。

そして、肝心のボイスチェンジに当たる部分ですが、Flux IRCAMは息抜けがたまに発生するので入力に気を遣う必要があり個人的にその点好きではないのですが、いきなり高い音を入力してしまった場合に上限補正を入れてくれる項目があり、こちらとイコライザをうまく合わせて使えばいい感じになるのではと思っているので、未だに弄れてる感じが全くありません。むしろどなたか教えてください...
SoundToys Little AlterBoyの方はよく無料ボイスチェンジプラグインで紹介されてるRoveeや恋声より音質もいい感じがして、またキーを上げてもそれらより声が物故割れにくいので個人的には気に入っています。
こちらはBOSS VT-1を元に作成されたプラグインみたいですので、自分でも使っているRoland UA-100と同様に弄れるという点が楽なのかもしれません。
神ボイスチェンジャー()などのソフト単体で動くものも試してみましたが、追加調整が出来ない点とそれらが行えないことによる声質依存の物であるという認識の為、こちらではあえて紹介いたしません。

ほぼディレイなしのハードの方も紹介したいのですが、正直適当に書いてもここまで長くなると思ってなかったので暫定記事として公開しておきます。

(19.01.30) 追記
あまりにも適当に書きすぎたので補足説明加えます。
手持ちのハードウェアボイチェン機材ですとRoland UA-100とTC-Helicon Voiceworks Plusがあるのですが、前者は声以外の周辺環境音をそのまま変換しようとし、後者は基本的には素通りです(音量によって変換かけるか判定してるっぽい)
また、現行機で流行のRoland VT-4を囁き声にも対応させるために常時変換機能をオンにしてる場合、UA-100と同様にすべての音を常時変換かけるため、ピッチを高くすればするほどそれらも釣られて高くなってしまうことになります。
声だけであれば完成度高くても、それらが入ることによる弊害もなきにしもあらずですので、それらを踏まえて以下のソフトウェアボイチェン構成をおすすめします。

マイク-プリアンプ(該当機能を内包したミキサー)-(グラフィック・パラメトリック)イコライザ-ボイスチェンジ-エキサイター(エンハンサー)-出力

前回の投稿時は上記のようにすることをおすすめしておりましたが、この場合ですと周辺音変換の問題もありますので、高めのピッチをとっている方はボイスチェンジの前段階にゲート処理プラグインをかます必要があるように思えます
吐息を変換したいのか、それとも周辺環境音を変換したくないのか、など個々人によって様々だとは思われますが、ソフトウェアボイチェンで綺麗に吐息変換しようとした場合、ピッチが高ければ高いほど電子音っぽいものが乗ってしまいます。
実際にやってみるのがわかりやすいので、後ほど音声を貼り付けてみようと思うのですが、言葉にするのであれば(ふぅー)とため息をつく音は電子音が乗りやすく、ふぅーと声になっている音であるほど電子音は乗りづらいです。
また、自分の場合は基本的に1オクターブ上げの楽したい設定を基本的に組むので、そういうことをされている方であればまず気になると思うのですが、さしすせそなどのS音がうるさく感じると思います。
ですので、この場合の対処法としてディエッサーを入れる必要があるように思います。
しかし、これもかけすぎるとiZotope系のプラグイン同様に声が固くなり電子音っぽさが全体に浸透してしまいますので、ほどほどにすることをおすすめします。
更に、ピッチを高くとればとるほどきちんと発音していない部分の変換に電子音のようなものが混じっている感覚を覚える方もいると思いますので、Transient系VST(Transient Masterなど)を挟むことでより馴染むようになると思います。

利用者の声の相性もあると思いますが手持ちのボイチェン用途に利用しているVSTを前段にVSTなしで1オクターブ上げ利用した場合の体感比較したものを下記に残しておきます。
個人的にはピッチ調整幅低めで使う場合、どれ使ってもそんなに変わらんって認識ですので、楽したい方向けの比較になると思います。

・Rovee
・AutoTune
・Throat Evo
・Manipulator
・IRCAM TRAX
・SoundToys Little ALtorBoy

エッジ効かせた声に強い順
IRCAM>SoundToys / Throat Evo>Manipulator / AutoTune>>Rovee

返し声の遅れ具合の短さ
Rovee>SoundToys / Manipulator / AutoTune>Throat Evo>>>IRCAM

ウィスパー変換時のざらつき感の度合いの強さ
Rovee>IRCAM / Manipulator / AutoTune>Throat Evo / SoundToys