2022年11月6日日曜日

【私見286%】VRC向けのPC構成を考える【2023.7月時点】

 ググってもふわっとした内容の記事が多いので自分なりの所感をまとめておこうかなと思い記事にしました。
実際に自分がハイエンド構成を使わないと見えてこない事が多いゲームなので、仮にそういった記事を投稿されている方がいれば、どういった構成を使ってきているかを見るとより参考になるかもしれません。
 
一応自分のPC構成の変遷としましては...
 という感じで、一度に構成をガラッと変えるのではなく、CPUだけ上位にしてみたり、CPUそのままでGPUだけ上位にしてみたりと、VRCでのfps低下防止に何が大きく影響を与えているか見ていました。
 
それを踏まえたうえで、PCを構成する主なパーツでVRCのパフォーマンスに影響を強く及ぼすものとしては...
 
①CPU
②GPU(グラフィックボードorグラフィックカード)
③メモリ
+電源について

上から順にVRCでのfpsへ影響力が大きいものを並べてあり、これらを選ぶ上でどういう視点で見てこういうのがいいよというのを簡易的にまとめさせてもらいます。
VRChatは他のゲームと比べ、CPU・GPU最適化という面ではほぼ期待できないです。
簡単に言えば、マシンパワーでぶん殴るゲームだと考えてもらって結構です。
これを踏まえ、ずらずらと書きなぐっていきます。

①CPUについて
基本的に確認する点としては、動作周波数(クロック)・コア数・L2/L3キャッシュ・CINEBENCHでのシングルスレッドスコアの4点になります。
 
自作とゲームと趣味の日々さんの記事より画像をお借りさせて頂いて説明を進めさせていただきます。
 
始めに動作クロックについてです。
橙枠で囲ってあるところを見て、基本的に高い数字になっていればいい感じです。
また、赤枠で囲った単コア最大の項目ですが、文字通り1コアのみを全力動作させたときは〇Ghzという事になります。VRCプレイ中は1コアのみ全力で動くことはほぼありえないので、こちら無視して問題ありません。

次にコア数になります。
青枠で囲ってあるところを見て頂くと、〇C〇Tとか書いてあります。
1番右のRyzen 9 7900Xを例にすると、12コア24スレッドという意味合いになります。
物理的なコア数は12ですが、1つのコア当たりで2つの処理を行うのでスレッド数は12×2の24スレッドになっている感じです。
 
1番左とその隣のi9 13900Kとi9 12900KはP-Core/E-Coreと項目が分かれていますが、PはパフォーマンスでEはエフィシエント(省電力)の意味合いです。
IntelのCPUは第12世代からこのPとEのコアをかけあわせた構成になっているのでややこしいですが、ゲームパフォーマンス的にはPコアのみを確認する形で大丈夫です。
 
1番右とその隣のRyzen 7900XとRyzen 7950Xについては、コア数がそれぞれ12コア/16コアとなっていますが、こちらも注意が必要です。
ザックリ説明で申し訳ないですが、9コア以上のRyzenは内部的にCPUが2個くっついてる状態になり、12コアであれば6コア×2(計12コア)で16コアであれば8コア×2(計16コア)という感じになります。

次に緑枠で囲ったL2/L3キャッシュになります。
CPUの中でデータを処理するスペースがない場合はメモリの方にデータを一時的に置く形になるのですが、CPU内部のL2/L3キャッシュに比べるとメモリはかなり遅延が大きくレスポンスが悪いです。
基本的にL2キャッシュはCPUのコア毎に割り当てられてるもので、L3キャッシュは各コア間が共有する形のキャッシュになります。
ですので、こちらの値もより多いものであるとなおいい感じになります。

最後にCINEBENCH(ベンチマーク)でのシングルスレッドスコア確認です。
ザックリですが1900pts以上あるといいと思います。
(Intel Core iシリーズだと第12世代よりでAMD Ryzenシリーズだと7000番台から)
ただし、あくまで単コア動作でのベンチマーク結果になるので、全コアを全開動作させたときの動作周波数(クロック)は高い方がよいです。
こちらはYouTubeで検索すると、各レビュアーさんが必ずと言っていいほど数値を出しています。
同じクロックでもCPU内部処理の効率がよければ、このCINEBENCHでのシングルスレッドスコアもより高いものになっていきます。
 
※レビューをとる際は基本的に何も入ってないWindowsでの測定をするのが主なので、実際に色々ソフトを走らせているとスコアは多少落ちます。その点も頭の片隅に入れておくとよいです。
 
VRCにおいてCPUが処理を担当するのはDynamic Bone(DB)やPhys Bones(PB)などの揺れ物やパーティクルと呼ばれるもので、基本的にPBの方はほぼすべてのアバターで設定されていると思います。
最初から結論を言わせてもらいますと、現状シングルスレッド性能が最高のCore i9 13900Kを利用したとしても、10~15人を超えるとCPUがボトルネックになりGPUの足を引っ張ってしまいます。
 
これらを踏まえ、表にあるCPUをよりVRC向けに特化させた動作環境を考えてみます。
 
・Intel i9 12900K/i9 13900Kの場合
Pコア(パフォーマンスコア)とEコア(省電力コア)の2つがくっついてる形になるので、ゲームの方はなるべくPコアのみで処理させてあげるといいです。

・Ryzen 9 7900X/7950X/7900X3D/7950X3Dの場合
CPUが内部的に2個くっついてる状態になるのですが、このCPU間でデータをやり取りする際に処理がモタついてしまいます。
なので、基本的には12コアの7900Xであれば6コアで16コアの7950Xであれば8コアで動作させてあげるとVRCのfpsは低下しづらくなります。

最近のVRCアップデートでVRCを動作させる場合にどのコアを使うか指定できるようになってるので、該当する9コア以上のRyzenをご利用であったり、Intel第12世代以降をご利用の方はこちらを試してみるといいと思います。
 
(2023.7.24時点)
SteamクライアントよりCPUコアのアフィニティ設定をしているとfpsが下がる現象が確認できています。現状は様子見してもいいかも知れません。 
 
 
 
②GPUについて
基本的に確認する場所としてはVRAM・シェーダーユニット数・メモリ帯域幅/メモリ転送速度とVRMarkのスコアになります。
 
PC自由帳さんの記事より一部改変した画像をお借りして進めさせていただきます。

始めにVRAM(メモリ容量)になります。
こちらはVRCをプレイしてると何かしら聞いたことがあると思いますが、結論としては最低12GBあるものを選んでおけば大丈夫です(※条件による)
条件によるとありますが、自分が大体どれくらいの人数のインスタンスにいるかであったり、使用しているHMD(ヘッドマウントディスプレイ)の解像度によっては12GBでも足りないという事になります。

こちらもザックリのもので申し訳ないですが
・Valve Index/VIVE Pro(両眼解像度合計4K未満)を利用でSteamVR内部解像度100%の場合
→とりあえずVRAM 12GBあれば20~30人のインスタンスでも十分なVRAMになります。
すごく重たいアバターの方が集まるインスタンスでは20人でも足りない可能性もあります。
自身の使用しているアバターにもよりますが、VRCデフォルトホームに入った段階で6~7GBほどVRAMを使用していると思います。

・Quest 2/VIVE Pro 2/Pimax(大体両眼解像度合計4K以上)を利用でSteamVR内部解像度100%の場合
VRAM 12GBは必須です。上記の両眼解像度4K"未満"のHMDのVRAM使用量の1.2~1.4倍のVRAMを使用するためです。
こちらも自身のアバター次第ですが、VRCデフォルトホームに独りでいる状態で8~9GBほど使用しています。


次にシェーダーユニット数になります。
主に各ピクセルごとの描画処理を担当してくれる部分の数になるので、こちらも多ければ多いほどいいです。
ただし、多ければ多いほどGPUが発熱したり消費電力を必要とする要因にもなる為、より大きなサイズとなってしまいPCケースの制約が出たり、冷却にも注意をする必要が出てきたり、電源容量もより大きいものにする必要が出てきます。
 
CPUが酷いボトルネックになっておらずGPUの使用率が8~9割になっている場合、消費電力の項目にあるワット数に近い値を常に消費し続けます。
CPUの項目で挙がっているRyzenやIntel CPUとRTX 3090を利用している場合、システムの消費電力としては大体500~800Wを利用します。
 
VR睡眠をされる方は、自身が休まれている状態で何も設定をしていない場合でもGPUはほぼ全力で稼働している状態になるので、冷却ファンのへたりやメモリに貼り付けられているサーマルパッドのオイルブリード(熱伝導シートのオイル抜け)、サーマルパッド(熱伝導シート)の劣化によるメモリ温度の上昇にも気を遣い、ご就寝の際はMSI Afterburnerなどでパワーリミット制限をかけてあげるとより長くお使いになれると思います。
 
 
次にメモリ帯域幅とメモリ転送速度です。
ザックリ説明ですとメモリ転送速度が速くてもメモリ帯域幅が小さければより大量のデータのやりとりはできません。
逆にメモリ帯域が大きくてもメモリ転送速度が遅ければ性能のバランスが取れてないと言えます。
あまり気にしなくてもいいと思いますが、知っていても損はないと思うので書いておきました。
(23.07.24追記) メモリ帯域幅が狭いと高解像度環境にてパフォーマンスが発揮できないので、こちらも忘れずチェックする事をお勧めします。

最後にVRMarkのスコアについてですが、国内の自作系YouTuberさんはあまりやっていないのでPC Watchさんより探してみるといいと思います。
https://pc.watch.impress.co.jp/docs/column/hothot/1446332.html
Orange/Cyan/Blueとそれぞれ3つのベンチマーク結果がありますが、VRC的にはBlue Roomをチェックするとよいです(HMDの両眼解像度的に近い値である為)
 
 
③メモリについて
容量は32GBあればとりあえず一安心出来ると思います。
BTOで購入する場合はあまり気にしなくてもいいですが、DDR5メモリの場合は転送速度が6000MHz以上のものを選んでおくといいと思います。 
これからPCを購入される方でDDR4メモリを選ぶメリットはほぼないと言えるので、DDR5メモリで6000MHz以上のものを選ぶようにしましょう。
また、基本的にメモリは2枚セットで動作のデュアルチャンネルにしてあげるとパフォーマンスが向上します。自身で自作を考えてる方はこちらお気をつけくださいませ。
シングルランクとかデュアルランクとかGear1/Gear2動作がどーのとかタイミングがどーのとか話が長くなるので、興味があるよって方はTwitterやVRCの方で聞いてみると答えられるかもしれません(?)
 
+電源について
確認する点としてはGPUの出力に利用するPCI 8pin(6+2)が最低3本(可能であれば4本)あるかどうかを基準に探してもらいたいです。
最低3本ないし4本のPCI 8pin出力を備える電源を探すと、大体850W超になっていると思います。
電源は容量が大きいほど消費電力も上がるわけではなくて、各パーツが要求する電力を供給する関係になります。また、フルパワーで動かないほど変換効率が上がると考えてもらうといいです。
8pin出力コネクタ数と変換効率も踏まえて考慮する場合、大体実消費電力が電源容量の60~70%前後になるようにすると電源変換効率がいいので、1000W~1200Wの電源を買うといいです。
(1000W超クラスだとPCI 8pinもほぼ4本ついてます)
~新規格:12VHPWRコネクタの件について~
RTX 4000番台より12VHPWRコネクタに変わり、PCI 8pinを何本も繋ぐ形ではなくなりました(PCI 8pinを複数本束ねる変換ケーブルがGPUに付属で提供の形)
ただ、こちら12VHPWR 融解とかで検索すると問題になっていることがわかると思います...
 
融解報告事例が出ている組み合わせとしては
・電源側(PCI 8pin×3 or ×4出力)-GPU付属8pin変換→GPU:×
・電源側(ATX 3.0/PCIe 5.0対応:12VHPWR出力)-GPU:×
・電源側(ATX 3.0/PCIe 5.0対応:8pin×2出力)-GPU:???
と言った感じで、ATX 3.0/PCIe 5.0対応電源とラベルがあるものでも融解報告が出てます。
 
(2022.11.10時点で)PCI規格策定団体が12VHPWRコネクタ側面ロック機構の変更を検討している話も出ており、現状先行き不明な新規格となっております(笑)
人柱erになる覚悟のない方は、RTX 4000番台を避ける事をおすすめします。
 
(2022.11.19追記)
NVIDIAより公式声明が発表され、グラフィックボードをマザーボードに接続する前に12VHPWRコネクタへ接続し、奥までしっかり差し込まれている事を確認したうえで取り付けするようお達しが出ています。
12VHPWRコネクタは上から4pin/6pin/6pin構成となっており、両端部分に固定ラッチがついてるわけじゃないので、なるべく真っすぐ刺すのは当然の事ですが、マザーボードに挿入後もケーブルに上下左右のテンションがかからないように利用することを個人的に推奨します。
また、電源メーカーのFSPさんの方では真っすぐ挿し込むのは当然の事、12VHPWRコネクタのケーブル根元より3~5cmは曲げて使用せず、ケースのサイドパネルで押し込むのも禁止するよう注意が出てるので、そちらも合わせて注意し利用していこうと思います。
https://www.fsplifestyle.com/FAQ221031-635F87CFE5B23/
 
検証などが気になる方はGamers Nexusさんの動画も見てみるといいかも知れません!
This is the best connection in the world!!
日本語で見たい方はこちら↓
 連日Redditをチェックして情報を確認してるのですが、公式声明=事実ではない可能性もあるので、自分だったらこういう設置方法は見てて恐いな~とか思ったりします...
思いっきり曲げてるし、せっかくこの時期の発売なんだからATX 3.0/PCIe 5.0対応電源使えば配線もスッキリするのになと思ったり...

(2023.07.24追記)
ATX 3.1の構想があってその中に12VHPWRコネクタ自体に変更が入り、12pin+4pin構成のうち4pin部分が短くなりきちんと接点させてないと動作しないような12V-2×6なるものが構想されているようです。
 ATX 3.0電源の販売当初はケーブル単体での製品は少なかったですが、CorsairやLian-LiやSeasonicなどより12VHPWR単体でのケーブル供給がなされているので、あまり気にせず使っていくことにしています。


 
 
<実際に構成を考えてみる>
ここからはご自身の環境(主にHMD)に合わせたシミュレート編になります
基本的にPCの構成よりもHMDは今何を使っていて、将来的にどれくらいの解像度のものに変える予定があるのかを頭の中でクリアにしておくと決まりやすいです。

また、fpsVRというソフトをSteamより導入しておくと、現状ご利用の環境でCPU/GPUのどちらがボトルネックになってfpsを低下させているのかが如実にわかります。ログもとれるのでテストしたいときにも使えると思います!
導入や利用法についての記事もあるので合わせてご覧になるとよいと思います。


・とにかくコストを抑えたい(+手持ちのDDR4メモリ/AM4マザーボードを使いまわしたい)
CPU:Ryzen 7 5800X3D / Core i7 12700K(13700K) or Core i9 12900K
GPU:RTX 3060 / RTX 4060 Ti (16GB) / RTX 4070
電源:850~1000W 
 
いや、↑に挙がってるCPUたけーよと思った方もいると思いますが、FPSゲームで言えばFHD環境で3~5年くらいは使えそうなものを列挙しています。
CPUは今とりあえず最低限使えればいいとかであればRyzen 7 5800XやIntel Core i5 12600K(13600K)とかも選択肢に入ってくると思いますが、長年使いたいのであればコア数(スレッド数)は正義です。どちらもAM4のRyzen 5800X3Dにしたり、LGA 1700ソケットのi9 12900Kや13900Kにする等アップグレードパスはありますが、安物買いの銭失いするくらいなら最初からある程度投資しておくことをおすすめします。
 
ググると爆熱だのなんだの引っかかると思いますが、ベンチマークと違いゲーム中は簡易水冷CPUクーラーを利用で大して温度も上がらないので気にしなくていいと思います。
空冷で冷やしたい方はツインタワーのハイエンド空冷(Noctua NH-D15/Deepcool Asassin III)を導入しないといけないと思うので、メモリの背が高くて干渉しないかだったり、マザーボードのVRMヒートシンクが干渉しないかであったり、そもそもケースの横幅的に入るか確認しておく事を推奨します。

・Valve IndexやVIVE Proなど現行機種を次世代GPUが販売される2024~2025年まで使っていくパターン
CPU:Ryzen 7 5800X3D or 7800X(3D) / Core i7 13700K or Core i9 13900K(12900K)
GPU:RTX 3080 (12GB) / RTX 3080 Ti / RTX 3090 / RTX 4070 Ti
電源:1000W~1200W 
 
解像度的にはRTX 3080 (12GB)やRTX 3080 Ti以上あれば十分で、RTX 3090があればVRAM使用量的には困りません。
ただし、HMDのSteamVR内部解像度を100%以上にしていくと、より性能が高いものが求められていく点に注意してください。
なぜRTX 3060を挙げないのか?という点についてですが、VRAMが12GBと同量というだけで処理速度は前世代のRTX 2060と大差ない為、GPUの処理速度がボトルネックとなる可能性が高い為です。
VRCを30人程度の人が多いインスタンスでも数秒以上止まったりしない形で最低動けばいいであったり、価格面を抑えたいという方にはいい選択肢だと思います。
VRC以外のある程度重たいゲームも将来的に遊ぶ予定があるであったり、今も遊んでいるという方であったり、ゲームはFHDで数年遊べれば十分だよとお考えの方はRTX 3080 (12GB)やRTX 3080 Ti以上にしましょう。

・Quest 2or3(Virtual Desktop:GodLike)/Quest Pro/VIVE Pro 2/VIVE XR ELITE/Pimax(大体両眼解像度合計4K以上)を2024~2025年までに導入する予定があるパターン
CPU:Ryzen 7 5800X3D or 7800X3D or 7950X3D / Core i7 13700K or Core i9 13900K(12900K)
GPU:RTX 4080 / RTX 4090
電源:1000~1200W(1600W:200V対応でない場合1500W動作)
 
VRAM 16GBが快適のラインと見ていて、RTX 3090があればVRAM使用量的には困りませんが、処理速度的に少し苦しくなってきます。 
この次の選択肢としてはRTX 4090やRTX 4080になるのですが、お値段が30万~/22万~となっており、いきなり導入するには躊躇する金額になると思います。
自分が何年ほど新しく導入する環境でこのゲームを遊ぶかどうかと相談してみて、値段÷利用期間で1日いくらくらいに計算するといかも知れません(?)
また、RTX 4000番台より新規に変わった点としては12VHPWRコネクタの融解問題が挙げられます。(2022.11.06時点で)NVIDIAより調査中の結果報告が出ていないので、人柱erになりたい方"以外"は様子見した方がいいと思います。
 
また、Radeon系GPUを検討する方もいると思いますが、HMDが対応してない場合もありますので、現在利用しているものと将来的に利用予定のものを確認の上購入する事をおすすめします。 
※Geforce非対応でRadeon対応というものは聞いたことないですが、Geforce対応でRadeon非対応というものがある為。
加えましてVRChatには関係ありませんが、レイトレーシングの世代がNVIDIA現行RTX 4xxxに比べて1世代古かったりします。

また、RTX 3090とRTX 4090比較で参考になる素晴らしい動画があるのでリンクを貼らせて頂きます。
※問題あればリンクを削除させて頂きます。


そして1番重要なことになるのですが...
どちらのパターンも共通で、CPUは1番高い奴かそのすぐ下のグレードを買ってください→現行最新のi9が厳しい場合はi7、1つ前の世代で見るならi9から検討(現行最新でない旧世代を考える場合は最上位)
騙されたと思ってIntelかAMD(Ryzen)の1番高い奴を導入しておけばその時点でそれ以上はありえない為です(自分を納得させる感)
※現行最上位でも10~15人ほどのインスタンスで全てのアバターを視界に入れたりするとCPUボトルネックになりだすので、予算と相談してくださいませ。

DDR4メモリが使える環境ですと、Ryzen 7 5800X3DはL3キャッシュ量が多く、ゲームパフォーマンス的に最新のRyzenやIntel CPUに肉薄する性能があるため、AM4マザーボードをご利用の方におすすめです(対応してるかはマザーボードの型番で検索し確認してください)
Intelの方ですと、第12/13世代CPUのi7とi9はPコアが同数となる為、i7でもほぼ同様なパフォーマンスが得られコスパがよいです(IntelであればPコアのみをVRCの動作に割り当てる為)
検索すると爆熱というワードがフォーカスされると思いますが、ゲーム中はCPU使用率が20~30%で、CPU自体の消費電力はデフォルトBIOS設定で使っても大したことなく、更にBIOS設定次第でかなり抑えることが出来るので、現状手持ちのDDR4メモリを使いまわしてパフォーマンスを向上させたい方にはどちらもおすすめのCPUです。
 
※重ためのソフトでVRC以外何も起動してない状態でタスクマネージャよりCPU使用率を確認してみて60%以上になってる場合はほぼCPUがボトルネックになっていると言えます


考える順序としては予算が大体いくらくらいなのかを定めてもらった上で、【CPU→GPU→電源容量/メモリ】の順番で考えてもらえれば幸いです。
 
ただ、ある程度快適に遊びたい場合は20万だと色々中古パーツとか入れていかないときついので、30万は見てもらった方がいいかもです...(円安キツイ
↑パーツ単位で言うなら最も壊れづらいのがCPUで、続いてマザーボードやメモリ、マイニングに使われている場合のグラボ(ファンが軸ブレして風が送れなくなる/メモリにあてがわれてるサーマルパッドの劣化による冷却不足)の順になります。
 
フリマやオークションサイトで購入する場合、CPUはリマーク品や中身が入っていなかったり、グラボはマイニング使用歴の記載がなかったり、その他パーツも完全動作確認が甘かったりする可能性があるので、なるべく実際に店舗を出してるPCショップさんに出向いて現物確認するかしてお考え頂いた方がトラブルは少ないと思われます(1週間の返品期間を設けているショップさんが多いです)
 
中古グラボ購入を考えている場合は、(使用期間はいくらでも噓をつける為)発売日がより新しいものであったり、ヒートシンクに白サビやバックプレート部などにサーマルパッドのオイルブリードがあるかないか(清掃で誤魔化せる点も注意)、手でファンを回してみて軸ブレしてるかどうかを確認するといいかもです。 
RTX 3000番台であれば、ELSAさんが出してるものは保証書があればレシートなしでも保証書に記載されてる期間から数えて保証期間に故障時のサポートが受けられるようです(要確認)
また、保証書があっても受けられない例で言えばドス〇ラさんで購入したものもあります(購入者本人しか受けられなかったはず???間違いあれば修正します。)
 
 
 
<現状のPCでも多少fpsの低下が防げるかも知れない対応策>
 
自分の環境でこれは有効だなと思ったものになるので、各々の環境においてはごめんなさい!保証しかねます。
VRCのメニュー画面より大体のfpsを確認する場合は、左上に表示されているfpsに+10~+15を加えた値が出ていると想定できるかも知れません(?)
正確な値を知りたい場合は、fpsVRなどの外部ツールの導入をおすすめします。


①Windows周りの設定
→なんか色々あるのでこちらのポストのツリーも見るといいかも知れません。
3行目にデバイスマネージャより各USBデバイスの電源管理→無効とありますがこういう感じです。
また、コントロールパネルより電源設定を高パフォーマンスにするといいです。
(USBセレクティブサスペンドがOFFになっているか合わせて確認)
Windows 10も11も使う前にやる事多すぎ問題ですね!

②NVIDIA Control Panel周りの設定
→ツイート画像だと【垂直同期】の項目がアプリケーション設定を利用となっていますが、垂直同期はOFF推奨です
(HMDの方にティアリング:波打ち現象が出る場合は、VRCウィンドウサイズが大体16:9のアスペクト比になっているか確認してみてください)
バーチャルリアリティ可変レートスーパーサンプリング(VRSS)は適応でもいいと思いますが、ワールドによって挙動がおかしい場合はオフにしてください。
 ※VRSS:視界の中央にスーパーサンプリングを強めにかけ、視界の端は弱めにすることでGPUリソースの節約をする機能の事
 
③SteamVR周りの設定
→これは結構効果的です!片目当たりの解像度については、 HMDに応じて設定するといいです(使用しているGPUによって同じパーセンテージでも設定解像度が変わる点に注意)
参考)VIVE Pro:1440×1600 / Valve Index:1440x1600 / VIVE Pro 2→2448×2448

④VRChatの起動オプション設定でCPUの使用するコア割り当てをつける
→内容被っててすみません。割と変わるので試して比較してみるといいかもです!
設定するといいかも知れない対象CPUとしては...
 
・AMD Ryzen 3000番台(1ccx:4coreのCPU)
例)コア数が8なら0/1/2/3、コア数が12なら0/1/2/3/4/5、コア数が16なら0/1/2/3/4/5/6
 
・AMD Ryzen 5000/7000番台の9コア以上のCPU(1ccx:8coreの為8core未満は不要)
例)コア数が12なら0~11、コア数が16なら0~15
 
・Intel 第12/13世代(パフォーマンスコアと省電力コアに分かれている為)
例)Pコアのみを割り当てるので0~15のコアを割り当てる

⑤VRChatのウィンドウを小さくする
→大体でいいのでアスペクト比が16:9になるように小さくします。
大体16:9にする理由ですが、自分の環境だと変なアスペクト比にするとHMDの方に酷いティアリング(波打ち現象)が止まらなくなったためです。
こちらを試すと、デスクトップ上での処理解像度が小さくなるのでfps低下が防げるかもしれません(?)
 
⑥GPUを2枚刺し or CPU内臓のグラフィックス機能を利用する
→メインのグラボにはVRChat.exeを全力で処理してもらうために、別途GPUを足したり内臓GPUを使うって話なのですが、ちょっとだけ設定が面倒だったり、Win 11とWin 10で設定出来る内容について多少違いがあったりします
こちらはハードウェアアクセラレーション等を他GPUに任せたら、メインGPUに全力で頑張ってもらえるという発想です。
Windows側でGPU処理を分けるのが不安定な場合、別途ディスプレイを追加し、そちらにブラウザやDiscordなどのハードウェアアクセラレーションを利用するアプリケーションを固めておくだけでも変わります。
 
参考になるかも知れない駄文こちら↓
 色々書いてるので、前後ポストを見てもらえたら幸いです。
 
BIOSよりCPUのクロックが下がらないようにする
→PC起動時にF2/Delキーを押下することに入れるBIOS画面で設定するのですが、各PCによって項目名が違ったり、最悪起動しなくなったりも出来るので、調べながら出来る自信があるとか慣れてる方はやってみてもいいかもです。
主に省電力機能を無効化したり、IntelだとPL1=PL2の値を同じにする、AMDなら動作クロックを固定するとかなので試して遊んでみると違いが見えるかもしれません(?)←効果あるかは保証できません! 

⑧(Intel第12/13世代限定)レジストリを修正しWindowsの電源設定に異種間ポリシー設定を追加する
→タスクマネージャを見てるとPコアを優先的に動かすようになりますが、パフォーマンス的にどれくらい向上してるかは未検証です!

 
 
 
暇つぶしに書いたので内容があっちこっち行って申し訳ないですが、気になる事あればTwitterやVRCの方で聞いてもらえればわかる範囲で答えさせてもらいます。
(自作やってみたいんだけどとかパーツ購入して自分で変えてみたいんだけど等)


2022年9月3日土曜日

Furutech変換プラグ比較試聴してみました

 使ってみないとわからない製品をまた紹介してみようかなと思います。
今回は標準フォンをステレオミニに変換するFurutechさんの変換プラグ三銃士になります。
あー、オーディオインターフェースとかのヘッドホン端子に刺すやつねとすぐ思いついた方に試して頂きたいです(モニター環境はすでにある為)
 
ケーブルとかプラグとか同じ金属なら変わるわけないじゃんって自分も考えてるのですが、その金属が変わったらどうでしょう...聴き比べてもはっきりわかるくらい違うんですよね。

(左から素材が違っています)
F63-SG:ゴールド \1,500
音質は市販されてる変換プラグ(Audio-Technica AT501CS等)と似ています。
変に味付けされてる感じじゃなく、以降の2つに比べるとマイルドな感じに聞こえます。

F63-S(R):ロジウム \2,000
F63-SGに比べるとかなり中高音がきれいめな音になります。
特にイヤホンで高音がキレイに鳴らしきれないものだとシャリシャリした感じになっちゃうかもです。

CF63-S(R):ロジウムカーボン \3,500
 ゴールドとロジウムを足したような音質になります。 
比較試聴だとロジウムタイプはあからさまに中高音が目立ったように感じましたが、1番バランスよく聞くことが出来ました。


とりあえず先に特徴を書いておきましたが、Fireface UCXにイヤホンだとEtymoticResearch ER-4S(P)とKZ ZEXとSennheisor IE 100 Pro、ヘッドホンだとAKG K701とAKG K550とK275で視聴してみました。
 
K701/K550のような元々中高音がキレイ目に聞こえるものにはゴールドタイプでバランスをとったり、ER-4S(P)のような低音の主張が抑え目なイヤホンにはゴールドやロジウムカーボンタイプを合わせてみるなどしてみても面白い感じです。
(音は足し算引き算の感覚で変わると思わないけど)


最近YouTubeでアンチ音響オタク的な検証を交えた内容の動画を上げてる方を漁っていて、各者大体共通してる結論が...
 
『ケーブルは同じ素材で同じ太さで同じ抵抗なら違いはない(ただし、シールド処理による違いはある)』

であれば素材が変わったらどうなるのって比較試聴を改めてしてみた感じでした。
いつも聞いてる音が違って聞こえるので、気分転換に試してみてはいかがでしょうか(?)

2022年8月24日水曜日

【数日使用レビュー】RME Babyface ProからRME Fireface UCXに変えてみて (+無線環境を構築した話)

 Antelope Discrete 4にするかUniversal Audio Apollo TwinにするかRME Babyface Pro(またはUCX)にするか悩んでいた時が懐かしいですね
3年ちょい前に買ってほぼ毎日頑張ってもらったBabyface Proに旅立ってもらいました
K&Mのスタンドと使ってました
買った当初はDAWボイチェンがメインだったので、TotalMix FXにエキスパンダーもコンプレッサーも要らなかったし、もし必要ならBabyface Proへ入力前にチャンネルストリップとか使ってやればいいと思ってました。
最終候補としてはBabyface ProとFireface UCXになったのですが、見た目がダサいという理由でUCXは見送りとなりその後...

今はどうでしょうか?DAW起動してCPUリソース喰われるのも嫌だし、そもそも起動するのが面倒だし...何の苦労もなくバ美声ポチッで起動してVRCやりたい感じです。
某海遊性大型魚みたいな名前の方の影響もあり(?)より広くバ美肉勢に認知されることとなったBabyface Proをバ美声で使う場合に気になる点を羅列していきます。


①TotalMix FXにノイズゲート(エキスパンダー)がない
これはもう致命的です。
どれぐらい致命的かというと、今日は暑いからクーラーの風を強めに...こんな事するともちろんファンノイズみたいなのが入ります。声を出してない時も入るので、VRCやってる時ももちろんずっと聞こえます。
バ美声の適応型ノイズ除去フィルタを使えよって思った方もいるかもしれません。
ノイズゲート(エキスパンダー)があれば無言時このようにならない上に、サンプルを長時間取得してもシュルシュルシュルって音は残りがちです。
 
自分はそれをなんとかするためにiSP Decimator IIとかRocktron Hush Proとか買いました。
iSP Decimator II(ピッカピカでカッコイイ)
どちらも優秀なノイズリダクション機材ではありましたが、やはりどちらも声質が劣化気味になります。これはiZotopeのリダクション系VST使ってもなる事なので、やはり無言時はノイズゲートやエキスパンダーで原音にほぼ影響がない形で音声をカットするのがいいと考えました。
このようなハードウェアをオーディオインターフェース前に追加する場合であれば、DBX 286シリーズを検討してみてもいいと思います。
マイクプリアンプ/エキスパンダー/コンプレッサー/ディエッサー/エンハンサーと1ch入出力ですが、必要な機能が搭載されてるため選択肢として有効です。
 
②TotalMix FXにコンプレッサー(レベラー)がない
これは音声入力時に大音量を入れないよう気を付ければいいレベルなので致命的ではないですが出力時に気になるケースがあります。
例えばYouTubeを見ているとします...自分は特に心霊系の動画を見る事が多いのですが、普段は音が小さいのにいきなり大きな音が流れたりとか当たり前のようにあります。
これをスピーカーで再現すると絶対に壁ドンが来ます。なので落ち着いて動画を見ることも出来なかったので年中ヘッドホン使ってました...
後々DBX 266XSという2ch入出力のコンプレッサーを使っていましたが、これも①のケースと同様にハードウェアを追加することが可能であれば検討してみてもいいと思います。 

※DBX 286とDBX 266を新品で買った場合は追加資金が4万円弱かかるので、エキスパンダーとコンプ目当てなら最初からUCXシリーズでよくない(?)となるのですが、今は中古UCX/新品UCX IIともに高騰してるので悩ましいところですね
(5年以上使うつもりなら安い年間サブスク代金だと思える声)

③バ美声→DAW→ループバックの順序で使う
無言時に音が鳴ってるのが気になるのであれば、バ美声の音声をDAWに入れてノイズゲートかければいいじゃないともなりました。
恐らくBabyfaceシリーズはこの使い方がいいんじゃないかと最終的になりましたが、DAWに割かれるCPUリソースも起動時のひと手間もかかります...VRCやる時に元気だったらいいんですけど、当時は疲労困憊してログインしてることが多かったのでそれすらもしたくなかったのを覚えてます。
ただし、バ美声からDAWに入れた音をモニタリングに回す場合は少なからず遅延が付与されます。自分にはこれが結構きつかったです。 (遅延を考慮するならBabyface Proに入力前にDBX 286シリーズを使うしかないでしょう。1ch入力のみですが...)
また、Babyface Proは本体の4in4outに別途ADAT対応機器を接続し+8in8out構成になってるので、本体のみでどうこうしようとするとすぐに入出力が不足しがちです。

④Equalizer APOを導入してノイズゲートをかける
サードパーティ製の仮想ミキサーが嫌でRME製品を導入したのでもはやアベコベですが、検索してみるとEqualizer APOを跨ぐ方法で利用されてる方もいるようです。(結果的に自分の環境では動作させることが出来ませんでした)
ただ、動作出来たとしてもマイク→TotalMix→Equalizer APO→Windowsカーネルドライバーの順番で流れるようで遅延が多少増えるようです...
こちらの方法を確立出来てる方がいればご教授願いたい限りなのでお願いいたします。

今時の2万円台のオーディオインターフェースってノイズゲートとか載ってたりしますよね?
でも、Babyfaceシリーズにはありません。せっかく高いお金を出して買ったのに、余計に機材を繋いであれこれするか、結局DAW使ってあれこれするしかないとなって、使えば使うほどあの機材ならこんなことしなくていいのに...という不満が少しずつ溜まっていました。

そんな折、Babyface Proを購入した当時に低価格帯でルーティングとループバックの自由度がそれなりにある製品が欲しいと言ってたら出てたので買いました。
Presonus Revelator io 24

結果的にFireface UCXとほぼ同じタイミングでの購入になってしまい、こちらが先に届いて試す結果になったのですが、こちらはインプットのみですがノイズゲート(エキスパンダー)/EQ/ローカット/コンプレッサー/リミッターがコンソールミキサー画面で適用できます。
久々にノイズゲート使ったけどこんなに感動したのはないんじゃないかってくらいでした。
無言時に何も音がしない...当たり前だけど当たり前じゃない機材だってあるんですよね。 

Babyface Proに入れる前にノイズゲートついてるオーディオインターフェースでも繋いで処理してからやればいいんじゃないかと考えた事もありますが、ハードウェアって繋ぐほど音痩せしていくんですよね...勿体ないと思ってしまいます。

そんなこんなでなかなか届かなくて半ギレ状態でしたが、大体今は設置してから数日ほど使ってみてます。
もちろんですが、先ほど羅列した①/②/③すべてをTotalMix FXで解決できるんですよね。
RME Fireface UCX(交換ノブ届くまでRoland製品のゴム足つけます)
 当時はマイクプリアンプやイコライザーやらエキサイターやらコンプレッサーやらの実機を周りに飾ってたので気にならなかったんですが、引っ越しの時に思ったけどめちゃくちゃスペース取ってたんだなって教えられたんですよね。
今の自分はせっかく高いお金出すんだから、対症療法的にああすればこれもできるをやるのは嫌だなと考えてます。元々できるけどハードウェア足しても出来るよなら納得できます。
Expander/Complessor/Levelerあり

長々と書いてますが世のボイチェンおじさんへ
「BabyfaceシリーズじゃなくてFireface UCXシリーズを買ってください」
DBX 286シリーズだったりハードウェア足してあれこれするのもいいけど、周りにものが増えるといやだって人は特に。

ここまで機能的な面しか触れてなくて音質はどう変わったの?と思われた方もいるかも知れません。
基本的にRMEの分離感高めの解像度の高い音質で、ヘッドルームが狭くなったなとか定位がブレるとかはほぼ感じません。また、Babyface Proに比べてFireface UCXの方が低音が聞き取りやすいです。そして、中高音に関してはBabyface Proの方が立ち上がりすっきりしてる印象になります。
音質の感想なんて正直当てにならないので、実際の店舗に行って聞いてみるのが一番です。
旧世代機と言っても当時のハイエンド製品なのでめちゃくちゃ悪いってわけでもなく、初見の感想はBabyface Proとほぼ変わらんなでした。
 
 
こういう製品を購入する際、どうしても最新世代のSteadyClock FS搭載じゃないと嫌だとか現行最新Fireface UCX IIじゃないと嫌だとか中古は絶対に嫌だとか仰る方もいると思います(RME製品の無償保証は1年)
ただ、自分はRolandのUA-101/UA-4FX/FA-66/Quad-Capture、RMEのBabyface Proと使ってきましたが壊したり壊れた機材がひとつもないです(電子機器なのでもちろん寿命はあります)
 
中古で買えとは言わないけど、中古でしか買えない機材もあるので飲める方は中古の初代UCX(または高騰してるUCX II)いいんじゃないの?という記事でした(個人売買が嫌なら楽器店経由で買うとか)
 
そして、RME製品が高騰しているのもあり9万弱で買ったBabyface Proを8万ちょいで売ったので、手元からは2万円しか出してないです(中古ノブ折れUCXは10万でした→交換部品あり)
たった2万円払うだけで数年あれこれしてたのが解決するんだったら最初からそうしておけばよかった...解決方法がわかっているのに踏みとどまっていた自分は何をしてたんだろうという反省でした。

VR x ボイチェンに関するクソ長い記事も投稿してるので、VRはやらないけどボイチェン興味あるとかやってみてる方いましたら読んでいただけると幸いです。
そして、ボイチェン何もわからないおじさんなのでコメントやTwitterで何かツッコミあればして頂けると嬉しいです。

将来的なオーディオインターフェース道のゴールとして、UCXを導入することもBabyface Pro購入後1年くらいが経過してから想定してましたが、もっと早めにやってもよかったと思ってます。
見た目ダサいとか言ってた自分を1万2千回殴っておきます。そして今度オーディオインターフェースを買うことがあるとすれば、UCXが壊れた時にUCX IIにしようかなと思います。
RME以外にも同等なルーティング機能を搭載した製品が出回ることを願うばかりです。
ここまで読んでいただきありがとうございました。


(2022.08.29)追記
Fireface UCXのCoaxial出力からSennheiserのBluetoothトランスミッター(送信機)にデジタル接続し、同社IE 100 Pro(+BT Connector)で使ってみました。
CoaxialからS/PDIFへの変換はAmazonに売ってた謎メーカー製品を使用しています。
Sennheiser IE 100 Pro (イヤーチップはSpinFit CP800)
KZ ZEXとの比較ですが、音質はかなりフラットでイコライザを弄ることなく聞ける感じです。ドンシャリ系が好みの方はZEXの方が好きかなと思いますが、低音~中音~高音までフラットな感じで解像度高めの音が好きなのでこちらの方が使いやすそうです(KZ ZEXの方はイコライザで調整して使えます)
 
Sennheiser BT T100というUSBから電源をとるタイプのBluetoothトランスミッターを使ってますが、安定して低遅延で使用できており、ほぼほぼ有線と同じ感じで動画鑑賞出来る感じです(Mixは難しいと思われます)
バ美声で利用した場合は(感覚的に)50ms遅延のLittle Alter Boyよりは遅れる感じです。
Amazonでよく販売されてるバッテリー内臓中華トランスミッターにありがちな無音時に音が完全にミュートされることはないです。
Sennheiser BT T100
IE 100 Proの方はコネクタの形状が上位機種のIE 400 Pro/IE 500 Proと同等なようですので、とりあえずお試しでバンドルセットを購入してみて気に入ったらそちらも手にしてみるといいように思いました。

Babyface Proの場合だとデジタル入出力はS/PDIFのみなので、デジタルでトランスミッターと接続する場合はADAT接続が不可になってしまいますが、UCXシリーズはS/PDIF以外にもデジタル入出力を備えているので、ADAT環境を構築しながらトランスミッターとデジタル接続が出来るので非常に助かりました。

2022年7月10日日曜日

【VRChat】VR環境でボイチェンを使いたい方向け (ボイチェン)

 お久しぶりです。こんにちわ。

ずっと書こうと思っては忘れ、また思い出したように書こうとは思っては忘れを繰り返してた事を書きなぐって行こうかと思います。
 
まずVR環境ってどんな感じなのって話ですが、このような機材を頭に被ってゴーグル内のディスプレイを覗く感じです。
大体デカいし重たいです(500g前後~600g前後)
HMDを装着し声にボイチェンをかけて利用する場合、大まかに下記の構成が挙げられます。
 
①HMD(ヘッドマウントディスプレイ)付属のマイクを利用する

②外部マイク(有線)を利用する

③外部マイク(無線)を利用する

 

 まず、①に関してですが、オーディオインターフェースに搭載されているASIOという機能が使えない為、ボイチェン後の声をモニタリング使用するとWindowsのオーディオドライバーを経由する事になり、400ms(0.4秒)程の遅延が発生してしまい、まともに聞きながら話すのが非常に困難です。

自分の声を聞かずにボイチェンを利用する事はあまりおすすめしません。

ヘッドホンを被らずに声の収録に臨む声優さんやナレーターさんを見たことがありますでしょうか???...つまりそういうことです(納得) 

次に、②に関してですが、今回はこちらをメインに取り扱っていければと思います。当方はHMD(ヘッドマウントディスプレイ)として、VIVE Pro 2を利用しているのですが、無線にて利用する事が国内では難しい為、PCとは必ず有線接続になる為こちらの案を採用しております。

また、③に関してですが、現状手持ちHMDとして、Meta Quest 2を所持してるので、こちらで完全無線環境を構築した際にマイク環境も改める必要があるので、その際にうまくいったら追記しておこうかなと思います。

 

 

【おすすめのマイクについて】

HMDを被った状態では鼻の下の隙間からギリギリ足元が見えるかな(?)くらいの視界不良環境になります。
そのため、通常のボーカル用マイクを運用していくのは非常に難しい為、耳掛け型のマイクであったり、襟もとにクリップで固定するタイプのマイクを利用していくことになります。
 
マイクに関しまして、今まで触ってきたマイクでとりあえずこういうものがあるよという紹介スタイルよりは、これらのどれかをとりあえず買っとけスタイルで列挙していきます。
念の為前提として頭に入れておいていただきたい情報になりますが、マイクには大まかに分けてコンデンサータイプ(①)とダイナミックタイプ(②)があり、コンデンサータイプでもバックエレクトットコンデンサー(③)というものが細かく分けると存在し、②のダイナミックタイプはマイクの動作に48Vファンタム電源を必要としませんが、①と③に関してはオーディオインターフェースやマイクプリアンプ、ミキサーなどから48Vファンタム電源の供給が必要になります。
↑を踏まえた上で下記のマイク紹介より気に入ったものをご検討いただけますと幸いです。

 

・AKG C520 (https://www.soundhouse.co.jp/products/detail/item/99372/)

価格:2万円前後

タイプ:バックエレクトットコンデンサータイプ

指向性:単一指向性

ケーブルの長さ:3mくらい⇐これくらいは最低限欲しい

ケーブルの接続:XLR

AKG C520

ネットのレビューを検索すると低音が強いだの耳が痛いだの価格の割にどうなのと酷評されまくってます。

まず、低音が強いに関してですが、マイクは音源(口元など)に近づければ近づけるほど、低音が強く強調される傾向が強いです(近接効果と言われます)。加えて、マイクの集音部分のダイアフラムというパーツが小さければ小さいほどその傾向は強く出るように感じます。
ですので、口元にぴったりくっつける形ではなく、少し離して利用する事をおすすめします。それでも、他社のマイクと比べた場合に低音が強く出る事に関しては間違いはないのですが、それは他社のマイクが周波数の低い部分をかなり削ってるような音の調整になっているためです。
つまり気に入らなければ、ご自身のオーディオインターフェースなどを利用して下の周波数をローカットしてもらえれば同じような傾向の音になります。
ローカットをきつめにかけてます
加えまして、こちらマイク部分が息の吹かれ(ポップノイズ)にかなり強いので、VRで激しい運動をされる方にもおすすめです。
次に、こういった耳にかけるタイプのマイクですが、がっちり固定できるほど音は綺麗にいれやすいのですが、すんごい耳が痛くなる事は間違いないです。ですので、耳に当たる部分に形状記憶耳栓などに穴をあけたものを通しておくとかな~り改善します。
 

・JTS CM-808UL (https://www.soundhouse.co.jp/products/detail/item/258143/)
価格:8千円前後(本体のみ)
タイプ:バックエレクトットコンデンサータイプ

指向性:単一指向性
ケーブルの長さ:1.5mくらい⇐ちょっと短い
ケーブルの接続:XLR(別途JTS MA500という変換アダプタ利用)

JTS CM-808UL
耳掛け型マイクで付け心地と音質とコストパフォーマンスという面においてはこちらのマイクは恐らくトップクラスだと思われます。
ただしケーブルが短いので、VRCをプレイする際にはXLRケーブルを別途購入し、延長する必要があるのですが、XLRケーブルはそこそこな重量があるために引っ張られるような感覚を覚える方もいるかも知れません。
先ほどのAKG C520のイヤーフックと比べると、HMDとこちらのマイクを装着した状態で仰向けになっても全然痛くなりません。
また、他社のマイクと違ってケーブル部分が着脱可能になっているので、断線した場合でも交換する事が可能になっています(Amazon/サウンドハウスでは取扱していません) 
吹かれ(ポップノイズ)耐性に関しましては、AKG C520ほどは強くないですが、後述のTOMOCA EM-700よりは強いです。

 

 ・TOMOCA EM-700 (https://www.soundhouse.co.jp/products/detail/item/227199/)
価格:4千円前後
タイプ:ラベリア型コンデンサータイプ

指向性:無指向性⇐と記載はあるけど使ってみたら単一指向性に近いです
ケーブルの長さ:4mくらい⇐十分な長さ
ケーブルの接続:XLR

TOMOCA EM-700
有名どころのクリップ利用できるマイクだとSONY ECM-PC60がありますが、そちらの方はXLR接続が難しい為ノイズに比較的弱いです。
VRCユーザーの方から割と好評なValve Index HMDの無指向性マイクみたいな音が好きな方はこちらを選ばれるとよいかも知れません。
ただし、無指向性マイクは部屋の反響音やHMDの反響音も平気で入れてしまうので、入力ゲインモリモリで使うと大変な事になるのでお気を付けくださいませ。
ケーブルの方もCANONケーブルではなく比較的タッチノイズには弱い為 、HMDのケーブルと一緒にタイラップなどで一緒にまとめておくとよいです。

また、こちらのマイクはクリップ部にねじ止めされている台座を外し、Boothなどで販売されているHMDにマイクを固定するための台座ブーム部分を購入する事で、HMD付属マイクのように扱うことが可能になります。

こちらの別途導入した台座部分には、AKG C520の固定用台座を瞬間接着剤などで固定する事も可能なので、VIVE CE/VIVE Pro/VIVE Pro 2をご利用の方は導入頂けると幸せになれると思います。
Valve Indexをご利用の方はこちらがいいかも知れません(当方未検証)
瞬間接着剤は熱湯につけると簡単にはがすことが出来るので、固定に失敗した場合でも容易にやり直しが効く上にガッチリ固定出来るのでおすすめです。

 

 ・SONY ECM-PC60 (https://www.sony.jp/microphone/products/ECM-PC60/)

価格:3千円未満

タイプ:プラグインパワータイプ

指向性:無指向性

ケーブルの長さ:1.5m程度(ステレオミニ接続のケーブルを用いる事で延長する事が可能)

ケーブルの接続:ステレオミニ

SONY ECM-PC60
もう15年以上もマイナーチェンジされ販売されている配信者なら誰でも知っているようなマイクです。
付属スタンドで設置して利用する事も出来ますが、VR用途だと付属クリップを利用して襟元などに固定したり、先ほど紹介させてもらったHMDにマイクを固定するための台座ブーム部分を利用する事で簡単にHMD付属マイクのように利用する事が可能です。 
先ほどのTOMOCA EM-700と比べると音質的にはあまり変わらない感じで利用できますが、特に子音(さしすせそ)を強く拾ってしまう為、利用に関しては少し気を遣う必要があります。
また、TOMOCA EM-700同様に吹かれ(ポップノイズ)には弱い為、口の真正面ではなく少し離した斜めの位置に設置すると使い易いです。

加えまして、ケーブルのタッチノイズにも比較的弱いので、HMDより生えているケーブルとまとめておくことを推奨します。 付属の延長ケーブルのみではVR用途として実用に耐えない長さだと思うので、音質も比較的クリアで3mまで延長できるAudio-Technica AT8345を使うといいです。

※オーディオインターフェースによってはプラグインパワー供給可能なステレオミニ入力がない場合もありますので、その際は写真左に写ってるAudio-Technica AT-MA2というプラグインパワー電源を供給可能なマイクプリアンプを別途使用する必要があります。



おすすめのマイクをいくつか挙げさせてもらいましたが、VR環境で外部マイクを利用する際に覚えておいて欲しいことがいくつかあります。

 

①口元に対してマイクの位置や向きがほぼ同じであるように出来る環境である事

②マイク入力の段階でゲイン(入力音量)を大きくとってしまう事により入ったノイズ対策は非常に面倒くさい

③VRCは音声ビットレートがかなり低く、自分がモニタリングしてる音声と違いが生じやすい


①に関してですが、先ほど挙げたマイクに関しては近接効果が非常に発生しやすいです。

そのため、今日は低音がなんか強めだな?と感じる時は位置や向きが以前と変わっている可能性が非常に高いです。なので、ある程度固定がきっちりできるようなものを買うことが音質云々よりまず大事です。

※AKG C520やJTS CM-808ULなどのマイクブームは比較的自由に動かしやすいので、気になる場合は模型用の針金やハンガーなどを加工し、添え木みたいな形で固定して上げるとよいです

 

②に関してですが、マイクから見てクーラーやパソコンの音が自分の声より大きく入ってしまう場合、マイクの位置や向きを見直した方がよいです。
ただ、VRをプレイしている際に部屋を移動してファンノイズなどが入ってしまうと思います。
その場合は、あえて入力ゲインを設定している値より5~10dB下げて、ボイチェン後に5~10dB上げてみてください。ある程度ボイチェン側がファンノイズなどを無視してくれる場合もあります。

ノイズリダクションプラグインやバ美声などのノイズリダクションを使うという対応法もありますが、基本的に声が丸くモコモコとしていき洞窟内で話してるような聞き取りづらい音声になってしまいます。(特に高ピッチ設定だと影響を受けやすいです)

ノイズゲートで声を出してない際は無音に出来ていても、話している声にサーというホワイトノイズやファーというノイズが乗っていては非常にもったいないです。

 

③に関しては、皆さんご存じだと思います。

自分の声を自身で聞いてみた印象と相手が聞いてみた印象は結構ズレがあるものなので、お世辞抜きで聞いてみた印象を教えてくれるフレンドさんを何人か捕まえましょう(それぞれ視聴環境も聞き方も違うから結構難しいよね)

に関して、参考になる動画があるので貼らせて頂きます。

 
1つ目の和尚様の動画は、マイクの位置を変えた時の部屋の反響音や環境音の入り具合を実践交えて比較してる内容なので特に見ていただきたいです。
2本目の動画では、マイクから見て周囲の環境音と入力したい自身の声量とのギャップがあればあるほど、発声時に後ろでサーッとか音が目立たないようになる仕組みを説明されてます。
どちらもノイズゲート利用で無理やり無言時の環境ノイズを消してる方に特に見ていただきたいです。

 

 【おすすめのボイチェンソフトやVSTプラグインについて】

ソフトウェア単体で動くものから、DAWなどのアプリケーションと併用する事による動作するものがありますが、こちらもとりあえずこれ使っとけ形式で列挙させて頂きます。
以下に紹介するものに割と共通する点として、先ほどファンノイズなど環境ノイズが気になる場合は5~10dB下げ、後から5~10dB上げるという手法を紹介しましたが、このような設定をした場合にボイチェン特有のアタック強め感が薄まる傾向があるよう(?)ですので、 気になる方はそちらの意味でも試してみてもよいと思います。


・バ美声 製品版 (https://booth.pm/ja/items/3432497)

価格:2000円

ループバックと出力デバイスで音声を2系統出力する事が可能になっている点が最大の特徴だと思います。
ループバックの方は出力デバイスから出る音声より遅延が少ないので、こちらをモニタリングの方に回して上げると歌えるくらいには遅延が少ないです。
TotalMix FXのEQと同様なカーブをバ美声の高度な設定より作成し比較してみたのですが、効き具合がどうにも薄すぎます。こちらはおまけくらいに思った方がいいと思います。


・SoundToys Little Alter Boy (https://www.soundtoys.com/product/little-alterboy/)

価格:1万5千円前後 (セール時半額以下)

ここ数年ピッチシフターVSTプラグインを漁って試せてないですが、2018年時点だとぶっちぎりで音が一番解像度高めに聞こえてたのがこちらになります。
セールもよくやってるので、買っておいて絶対に損はしません。
ただ、後述するVSTプラグインがプラグイン自体のレイテンシ(遅延)が0msなのに対し、こちらはプラグイン単体で50ms(0.05秒)あるため、こちらの音をモニタリングしながら歌うのはちょっと難しいかも知れません(話す程度であれば慣れれば大丈夫)。


・POLYVERSER Manipulator (https://dirigent.jp/polyverse/manipulator/)

価格:1万8千円前後 (セールが稀にあり)

音質はLittle Alter Boyには及びませんが、プラグイン自体の遅延が0msである点が最大の魅力です。
大体DAWを通した時の遅延は44/48kのバッファサイズ512で20ms(0.02秒)を切ってると考えてもらって大丈夫です。
 
遅延最速()とか言われてるVT-4と並べてもほぼほぼ同じタイミングで声が聞こえてるのがわかると思います。モニタリング環境がよくなるとモチベも上がるし気になるところもすぐ見つけやすかったりするので、VT-4を選ぶ理由は自分にはもう残っていませんでした。
Gformという無料プラグインもプラグイン自体の遅延が0msなのですが、そちらより多少音が綺麗かな?くらいのものなので、現状はあまり課金する魅力はないように思われます。
(VRCで視聴比較してもらっても絶対にわからないレベルの違い)

 

 

【オーディオインターフェースについて】

Voice Meeter BananaとかSyncRoomとかループバック環境がオーディオインターフェースのデフォルトの機能のみでは構築できない方向けのアプリケーションはありますが、当方これらを全く信用していません(おま環でしょうが実際に使用していて不安定だった経験しかないです)
これは音声入力デバイス・アプリケーションはいついかなる時も確実に動く信頼性が求められるためです。
(再起動やハードウェア構成の変更、OSのアップデートで不安定になるなんてコリゴリです)
サードパーティソフトを使わずともボイチェンで再生し出力される音をルーティングし、アウトプットからループバック動作が可能なオーディオインターフェースを紹介させてもらえればと思います。(当方未検証:ESI U22 XT)
 
※音質の話になると個人の主観になりますが、スペックシートの情報的にRMEのオーディオインターフェースは他社高級製品と比べて特別ずば抜けていいという事はないです(3万クラスのMOTU M2/M4にスペックシート上で劣ってる部分はある)
後述するTotalMixでのルーティング・DSP処理・ループバックの親和性が高くていいよという意味でおすすめさせてもらってます。 
また、スペックシート情報=実際の音質のよさに直結しない事も多いので、実機試聴をおすすめします(YouTubeでもあまり音質はよくない為)

全然関係ないけど、ルーティングのやりやすさとかDSPの機能面とか完全に抜きの音質的な面で見れば、PrismSoundのLyra2とかOrpheusとかがすさまじくいいらしいです...30万コースで持ち腐れになるけど一度使ってみたいですね!

 

・RME Babyface Pro (https://synthax.jp/babyface-pro.html)

価格:11万弱

RME Babyface Pro (FSじゃない方)

現在はBabyface Pro FSというクロックジェネレーターを更新したものが販売されています。

また、工場の火災や半導体の不足による部品単価の高騰もあり、新品で11万弱で購入できたものが2万円ほど値上がりしております。中古価格もそれに釣られている傾向にあるため、急ぎでない方はしばらく様子見する事をおすすめします。

こちらはマグ〇ナ先生が紹介したことによりボイチェンユーザーに広く浸透した製品(?)です。

私自身が所属していたコミュニティではそれより早く情報が共有されていたので、彼より一足先に使っていましたが、オーディオインターフェースとしての信頼性は太鼓判を押せるので、お金を出せるのならおすすめできます。

ただ、マイク-Babyface Pro-PCという接続環境に於いてバ美声のノイズリダクションを使いたくない場合は、同社のFireface UCXやFireface UCX IIなどのダイナミクス系機能が使えるTotalMix FXが搭載されている上位モデルを利用する事をおすすめします。
(1Uラック型のDBX 286Sの導入やバ美声でループバックされた音声をDAWに入れてからノイズゲートVSTをかける対応法もあります)
※Babyface Pro/Pro FSのTotalMix FXにはダイナミクス系が非搭載

オーディオインターフェースは価格帯によって、入れ音や出音の分解能や解像度が大きく変わりますが、大体10万円近辺からそういったクラスになると言われています。

私もRME Babyface ProかUniversal Audio Apollo XかAntelope Discrete 4 SCかMOTU Ultralight Mk4かApogee Duetで悩みましたが、店舗で実際によく聞く音楽とヘッドホン・マイクを持って行き視聴した上でこちらに決めました。

10万クラスのオーディオインターフェースであれば、大体どれもルーティングの自由度は高いため必ずRME製品でなければいけないという事もないと考えているので、イケベ楽器やRockONなどの試聴可能な店舗がお近くにある場合は、実際に試されてから購入する事を強くおすすめします。(安い製品ではない為)

また、ミキサーソフトのコンソール画面のUIは各社の色が出ているので、触れたことがなかったり慣れてない方は何が何だかわからないと思います

RME Babyface ProのTotalMix FXの場合
その場合は、迷っていても仕方がないので、こういうことがやりたいと店員さんに伝え、その様な用途で使えるか実際に確認しましょう。 
(YouTubeでDTM関連の動画をアップしてる方でもTwitter DMや動画のコメント等で答えてくれる場合がありますが、公式サポートではありませんのであまり頼り切らないようにしましょう...)

※家電販売員やPCショップ店員等と同様ですが、楽器店の店員さんも今売りたいものを売る傾向が強いそうです。ある程度の知識がある方と一緒にお店まで足を運ぶのもよいと思われます

(↑2022.08.21時点でFireface UCXをメイン、何かあった時用にRevelator io 24利用環境へ移行したため売り飛ばしました) 
Babyface ProとFireface UCXの使用感比較レビューも書いてるので、よろしければ合わせてご覧になるとよいかもです。

 

・RME Fireface UCX (https://synthax.jp/fireface-ucx.html

価格:10~12万(中古の場合)
↑廃盤製品になるため、現行最新のUCX IIを新品購入しようとすると品薄の影響のため20万超になっています(品薄なので2023年9月くらいまで安定的な入荷予定がないそうです)
RME Fireface UCX (熱対策ヒートシンク載せ)
 Babyface Proよりは世代が古い為、入出力回りの音質はスペックシート上で気持ちレベル劣りますが(ぱっと聞いた感じでは違いはほぼない)、上位のFireface UFXシリーズの省スペース版と言われるだけあって、このサイズで入出力が充実しています。
Babyface Proとのハードウェア的な大きな違いは、アナログ入力が背面部で4つ増えている点とアナログ出力部がヘッドホンアウトを除き4つ増え、ADATとは別に同軸IN/OUT(右上赤白部分)が増えています。
個人使用だと十分な入出力
 (ヘッドホンアウトは1つ減ってますがヘッドホンアンプ等使って分配すれば足ります)

ソフトウェア的な違いで言えば、Babyface ProのTotalMix FXでは扱えなかったダイナミクス(エキスパンダー/コンプレッサー/オートレベラー)が使えるようになっている点です。

バ美声は多少音が丸くなる適応型ノイズフィルターで環境/ホワイトノイズにある程度対処できるけど(完全に消すのは難しい)、エキスパンダーで無音時のノイズを全てカットしつつ音質を変えずに入力したいであったり、囁き声と平時の声の音量を均一化させたいであったり(オートレベラー)、音割れしないようにコンプレッサーを入れたいという方はBabyfaceシリーズよりUCXシリーズの方がいいです。

(↑もちろんバ美声からPlaybackされる音をルーティングした後にDAWに入れ、そこで後処理をかけるとかもBabyface Proでできますが、自分は面倒なので避けたいです!)

 

<Tips>
UCX/UCX IIのエキスパンダーとバ美声の適応型ノイズ除去フィルタを併用する場合

VRCプレイ時にクーラーと扇風機の風量を強くしないときつい時がある時用に下記の手法を試してます

①エキスパンダーなしの状態で声質が変わらない10秒未満程度ノイズサンプルを採取する

②適応型ノイズ除去を無効にし、無発声時に環境ノイズが入らない程度にエキスパンダーのスレッショルドを弄る(アタックとリリースは早めがいいかもです)

③適応型ノイズ除去フィルタを有効にする(無発声時は何も音がせず、話してる時の声の裏の環境ノイズも薄まってる)


上位機種にあたるFireface UFX/UFX+/UFX IIは前面のXLRコンボジャック入力が4つに増えていますが、多分普通の人はそこまで必要としない点と、前面コンボジャック入力部の割り当て番号が9/10/11/12になっており、バ美声で使用する場合は物理的に背面の出力から背面の入力1/2にケーブルを繋ぐか、TotalMixでルーティングが必要になります(↓のFireface UFX II参考)

RME Fireface UFX II
また、現在は前面にカラー液晶ディスプレイ、背面に録音可能なUSBポートが接続可能で音質もBabyface Pro FSと同世代のクロックジェネレータを搭載し向上したFireface UCX IIが現行最新となります。
RME Fireface UCX II

2022.08.13時点でFireface UCX IIの国内正規品を購入する場合は、転売価格か稀に入荷したものの取り合いをしている状態です。海外ストアより個人輸入の場合はサポートが購入店次第になりますので、購入する場合はきちんと問い合わせ等した方がよいと思います。

※これまでの場合ですと、輸入したRME製品の故障時は国内代理店のシンタックスはサポートしてくれない可能性が非常に高いです。


【TotalMix FX×バ美声の設定例】
すごく丁寧に解説されてる記事もありますが、とりあえず簡易的にまとめさせてもらいます。
こんな感じで設定するのかという感触を掴めてもらえたら幸いです。

<概要>
RMEのオーディオインターフェースはドライバと一緒にTotalMix FXというソフトをインストールして利用することにより、物理入力音と再生音を好きなデバイスに出力することが可能になっています
(別オーディオインターフェースの音声を取り回す事も可能ですが、Windowsのカーネルミキサーを通るので遅延が発生するため非推奨です)
 
TotalMix FXを開いてみると、下図のようなミキサー画面が現れると思います。
最初見た時ナニコレってなるやつ
色々並んでますが、この3つの配置関係を覚えてもらえれば大丈夫です。
左側の赤青緑の方を見ると、上段から入力/再生/出力となっています↓
オーディオインターフェースに入力した音声再生してる音声をどこにでも出せるよって仕組みになっています。
次に、ミキサー画面を表示してる状態でXキーを押下すると、Matrix画面に遷移します(Matrix画面からミキサー画面に変える時はMキー押下)
Matrix Viewも初見だとナニコレってなるやつ
こちらも基本的な見方は先ほどのMixer Viewと同様で、上段から入力/再生/出力となっています↓
 上図は設定済みの一例になりますが、音声の流れを設定するだけならこちらのMatrix Viewが全体像を掴みやすいと思うので、今回はこちらをベースにバ美声の設定をしていきます。


<設定手順>
①バ美声の入力デバイスをマイクの接続口に合わせ、IFch:1LかIFch:2Rのどちらかに合わせます

②出力デバイスは選択なしにします(利用しない為)
 
③ループバックにチェックをつけます
 
④ASIOにチェックを入れ、ASIO Fireface USBを選択します
①~④の手順後
⑤TotalMix FXでXキーを押下後Matrix Viewにし、中段の再生段(Software Playback)で横軸のAN 1/2と縦軸で見てヘッドホンアウトにあたるPH 7/8とループバック用に使用するADAT 3/4の箇所をダブルクリックします
青枠と緑枠が交わる橙丸部分をダブルクリック
⑥TotalMix FXウィンドウにてMキーを押下後Mixer Viewにし、下段のHardware OutputよりADAT 3/4の箇所のスパナみたいなボタンを押下すると開く設定項目よりLoopBackを有効化します
⑦バ美声に戻りStartボタンを押下すると変換された声のみが聞こえてると思います。
(そうでない場合は一旦Matrix Viewに移行し、最上段の入力段にチェックが入ってるか確認)
 
⑧DiscordやVRChatの入力デバイスをADAT 3/4に設定します -完-
 
※めんどくせーよって方のために設定済みファイルを置いておきます(動作保証しません)
TotalMix左上のメニューより、File>LordWorkspaceで下記ファイルを読み込み後、ADAT 5/6をWindows既定再生デバイス、ADAT 3/4をWindows既定録音デバイスにすると使えます 
・Babyfaceシリーズ向け
・Fireface UCX向け(UCX IIはハードウェア構成が一部違う為動作しない可能性高いです)


(参考サイト)
BabyfaceとTotalMix FXでボイチェン環境を作ろう!!(2)
https://myuxeno.fanbox.cc/posts/556146

Babyface Pro FSでボイチェン環境を作ったメモ
https://note.com/citron_vr/n/n5313e0eb0143

【備忘録】Babyface Pro FS(TotalMix)のボイチェン設定
https://yaguramoya.fanbox.cc/posts/2032221
 
 
※マイク入力が片耳しか聞こえない場合の参考
(スレッド関連ポストも読んだ方がいいかもです)
 


・Focusrite Scarlett 18i20 (https://focusrite.com/ja/usb-audio-interface/scarlett/scarlett-18i20)

価格:中古だと2万円前後 (第3世代の新品は5~6万)

Focusrite Scarlett 18i20 gen.1 (前面)
 
Focusrite Scarlett 18i20 gen.1 (背面)
宅録ならこのマイクプリアンプ使っておけ(Isa One/Isa Two)を出している、Focusriteの販売していたオーディオインターフェースになります。

第1世代から第3世代まであり、第2世代までは内臓ミキサーによるループバックは出来ませんが、本体背面のSPDIF OUT→SPDIF INと物理的に配線することにより ループバック環境を構築する事が可能です。

音質や解像度に関してはRME Babyface Proには及びませんが、設置場所があってマイク以外にもゲーム機などを繋ぎたいけどお金はかけられない方にはおすすめです。

(↑2022.08.21時点でFireface UCXをメイン、何かあった時用にRevelator io 24利用環境へ移行したため売り飛ばしました)


・Presonus Revelator io24 (https://www.mi7.co.jp/products/presonus/revelatorio24/)

価格:3万円弱

Presonus Revelator io 24
 StudioOneなどの有名DAWを手掛けるPresonusがリリースした配信者向けにルーティングの自由度を高めたオーディオインターフェースです。

Windowsサウンド設定(録音タブ)にMic/Inst 1/2以外にループバックにて利用可能な仮想デバイス(画像ではStream Mix A L/R・Stream Mix B L/R)が2つ追加されます。

Revelator io 24のコンソール画面よりミキサー画面が現れます。

下図の赤/青/黄の枠あたりを押下することにより、各デバイス出力に反映させたいInput/Playback(PC内再生音)をフェーダー(つまみ)を上下させることにより設定することが可能になっています。(ループバック用にMain/Stream Mix A/Stream Mix Bの独立したデバイスレイヤーが3つあるイメージ)

Revelator io 24コンソール画面を開いた直後

また、橙色の丸枠部分を押下することにより、背面ヘッドホン端子より出力する音源を選択可能になっています(ヘッドホンアイコンが黄色く点灯しているレイヤーが出力されます。画像ではStream Mix Aが出力されている状態です。)

仮想デバイス2つによる柔軟なループバック機能ともう1つの目玉はDSP機能によるハイパスフィルター(ローカット)/エキスパンダー(ノイズゲート)/EQ/Compressor/Limitter/各種ボイスエフェクトです。

右上Fatボタンを押下後設定画面に遷移

※これらの各種機能は入力した音声のみに適用可能で、出力する音声には変更を加えることが出来ないので、例えばスピーカーの低音が物足りない為イコライザーで低音部分を強調した設定にして出力音声に反映させるといった利用は出来ませんのでご注意くださいませ(Babyface Pro/Fireface UCXは可能)

また、これらのエフェクトは右上の設定ボタンより、前面コンボジャック入力の1番または2番のどちらに適用するか適宜切り替える必要がある場合もあるのでご注意ください(下図参照)

マイクを2本接続し、両方ともエフェクトをかけることはできません

小さいですが見た目以上に視認性の高いInputボリュームの確認可能なカラー液晶ディスプレイもついてます。また、ユーザー毎に設定したプリセットを保存可能な点に加え、これを前面ボタンより簡単に切り替え可能となっています。

意外と見やすいディスプレイ
 配信特化を謳ってるだけあり、3万円弱と思えないくらい機能が充実しております。

※レビューを見てると内部的にUSB 2.0動作だからとUSB 2.0ポートに繋ぐと起動時に見失っていたり、(2021年ロットに多いそうですが)環境的にヘッドホンアウト(メインアウト)にホワイトノイズが薄っすら乗るなどの報告がされているので、届き次第確認してみようと思います。

↑に関してですが、2022年製造ロットにて付属ケーブルのUSB Type C接続で確認してみたところ無音時のノイズはヘッドホン/モニターアウトともに確認できませんでした。

(対策方法としては後述の)起動時に見失ってる問題ですが、バスパワー接続時に当方の環境でも確認できています。(内部的にはUSB 2.0動作みたいですが)USB 3.0接続で電源を別にとってるUSBハブに繋いだところ症状が見られなくなったようです。

 

【バ美声利用の場合の設定例】

手順の紹介前に、まず簡易的にミキサー画面を操作するための必要な知識を羅列しておきます

マイク入力部のフェーダーを下げモニタリングに流れてないから安心じゃないです
・フェーダーはモニタリング(ヘッドホン)出力にどれぐらいの音量で反映するか設定するもので、最小にしていてもモニタリング出力されてないだけで、きちんとデバイス側には入力されています

・Muteボタンは完全にデバイス側も含め音が入力されてない状態になります(ボイチェン時に地声を入力しないので必ずこちら利用)

 <手順>

①Stream Mix Aのレイヤーを選択します

②(本体前面マイク入力1にマイクを繋ぐ場合)上図のChannel 1をMuteします

↑こちら忘れると、地声が配信等に乗ります

手順①~②までの操作で↑のようになっているか確認願います

③バ美声を起動し、IFチャンネルを1Lにする

④ループバックにチェックを入れる

⑤高度な設定より、ASIO入力デバイスをRevelator ASIOにする

手順③~⑤までのバ美声側の設定

 ⑥バ美声のStartを押下し、ゲイン等を調整した上でマイクに向かって何か話してみると多分何も聞こえないと思います(それで大丈夫です)

続いてPlaybackのフェーダーを上げてみると、ボイチェンとして変換された声のみが聞こえると思います(下図参照)←地声も聞こえてる場合は②の操作を確認してください

⑥までの操作でこのような画面構成になります

⑦最後にOBSやDiscord等のサウンド設定にて、入力デバイスをStream Mix A L/R (Revelator IO 24)に指定する

※ボイチェンの音声をミュートする場合は、先ほど説明したようにPlaybackフェーダーを下げるだけではモニター音声から聞こえなくなるだけで、デバイス側には入力されていますので、必ずPlaybackのMuteボタンを押下してください。

 

<Tips>ボイチェン声以外にPCの再生音もループバックとして載せたい場合

サウンドコントロールパネルよりVirtual Output A L/R (Revelator IO 24)かVirtual Output B L/R (Revelator IO 24)を既定の再生デバイスとし、上図の規定再生デバイスとして指定したフェーダーを上げると相手にも聞こえるようになります。


・ESI U22 XT (https://dirigent.jp/esi/u22-xt)

価格:1万5千円前後

ESI U22 XT

Presonus Revelator io24が出るまでは、低価格帯でルーティング可能なオーディオインターフェースはこちらのみでした。

ループバック可能な仮想デバイスがメインアウトとは別で2つあり、これらをDirectWireを使うことで自由にルーティング可能なようです。

Revelator io24と比較すると、XLRマイク入力が1系統しかない為、Discord用とVR用で分けたい方はRevelator io24の方がいいかも知れません。

また、環境によっては仮想デバイスにルーティングさせたボイチェン音声に遅延が出る事もあるようなので要注意です。

コストを抑えVoicemeeterやSyncRoomなしで環境構築してみたい方におすすめできます。

 

EDIROL(Roland) VT-4 (https://www.roland.com/jp/products/vt-4/)

価格:2万5千円前後

EDIROL(Roland) VT-4

オーディオインターフェースじゃなくてボコーダーだろってツッコミはお受けします。

Roland製品が好きな方は読み飛ばした方がいいかも知れませんが、こちらは絶対に買わないでください。

実際にAmazonのレビューにも載ってた気がしますが、これくらい文句書くくらいには人にはおすすめできません。

よくYAMAHA AG03をコンプ代わりにマイク-AG03-PCと繋いでる方を見ましたが、こちらの背面フォンアウトは通すだけでめちゃくちゃ音が悪くなる(ピッチ・フォルマントシフトの音質もお笑いレベル)ので、もしどうしても使うのであればハードウェア部分の最も最後尾にルーティングするようにした方が無難です。

例)マイク-別の機材-【VT-4 】-PC

マイク入力もしてない状態なのに、なぜかサーっとホワイトノイズみたいな音を聞くこともできるので、どうしても眠らないといけない時はこちらを使ってみるのもいいかも知れません。本体のボタンを押下しノイズゲートの強度を上げることでノイズを薄めることは可能ですが、完全には消える事はありません。明らかに欠陥商品ではないかと2回目の購入で再確認できました。

Razer製品のお供(黒と緑の配色)にすごくよさそうという事でお部屋のインテリアとして2回目の購入をしたのですが、いつもと同じピッチ125%くらいでVRCに入ってみたら声が全然違う(詳細に感想を聞くとボヤけて聞き取りづらい傾向)と複数人の方から挨拶しただけですぐ言われるレベルです。

よほどの修行僧じゃない限りボイチェン目的では絶対に買わないでください。

これとほぼ同額のPresonus Revelator io 24/44でバ美声やその他VST使う方が1万2千倍マシな音質です。

 ちなみにRazer製品と合わせるとめちゃデスク周りがかっこよくなります。

1分間でスリープモード(点灯状態)になるようにしてます

インテリア目的での購入に関してはおすすめします。高いですが...


※オーディオI/F入出力にノイズが乗ったり、起動時認識などが安定しない場合

①接続先のポートを変えてみる

②ACアダプタより電源供給可能なUSBハブに繋いでみる

AC電源より供給している図

③フェライトコアをケーブルに取り付ける

付属ケーブルにフェライトコアはついてなかったので...

 ④Renesas製のコントローラーが搭載されているPCIeインターフェースカードに繋いでみる

・玄人志向 USB3.0RA-P4-PCIE (https://www.amazon.co.jp/dp/B07KTYMRZS)

・StarTech PEXUSB3S44V (https://www.amazon.co.jp/dp/B00HJZEA2S)

⑤Windowsの電源管理設定のUSB関連設定よりセレクティブサスペンドを無効化する

⑥デバイスマネージャのユニバーサルシリアルバスコントローラーより各デバイスの電源の管理設定を無効化する



【VSTプラグインについて】

これらはDAW導入環境でしか利用できない上に、VRCを通して比較視聴してもらっても違いが分からないと言われるレベルのものになってしまいますが、一応メモ書きとして残しておきます。

 

<プリアンプ系VST>

・Arturia 1973-Pre (https://arturia.jp/products/item/3preamps/)

価格:単品だと1万円ほど

Neve系マイクプリアンプVSTは10種類ほど試してみましたが、聞こえ方的にも波形的にも倍音が最も強く、声に輪郭を与えはっきり聞こえさせてくれるプラグインになります。

すごいわかりやすく言うなら、勝手にイケボになるようなプラグインです。

単品でも1万円ほどとお高いですが、セットで含まれる他のプリアンプ系プラグインも非常に使い勝手のいいものになっているので、ぜひお試しいただきたいです 


<コンプ系VST>

・Arturia Comp TUBE-STA (https://arturia.jp/products/item/3-compressors-youll-actually-use/)

価格:忘れました

こちらも先ほどのArturiaより販売されているプラグインですが、通すだけで声に温かみが付与されます。

こちらも1973-Pre同様に難しい設定などせず効果が実感できるので一度試していただきたいです!

ただ、プリアンプやコンプレッサー系の音のウォーム感(温かみ)やエッジの際立ちはVRCの音声ビットレートでは違いを認識する事が非常に難しいと思われるため、これらのVSTプラグインの導入順序としては後回しにしてもらって構わないと考えております。


<ディエッサー系VST>

・Fabfilter Pro-DS (https://dirigent.jp/fabfilter/pro-ds)

価格:バンドルセットで買ったので忘れました

さしすせその音がきつく刺さって聞こえるのを抑制するプラグインです

初めてディエッサーを触る方でもとりあえず入れるだけで使え、視覚的にわかりやすい波形よりリアルタイムで確認できるため非常におすすめしやすいです

特に「し」の音が強めに出やすい人が多いと思うので、何も考えずとりあえず入れとこくらいで大丈夫です


<EQ系VST>

・SONIC WIRE Gullfoss (https://sonicwire.com/product/A9347)

価格:セール時で1万5千円くらい

イコライザのプラグインは様々ありますが、こちらで弄るパラメータは5つのみで非常に触りやすいと思います

イコライザを反映する前にAIが頑張って数百回試行した中でいいものを反映してくれるみたいです

どちらかというとエンハンサやディエッサーみたいな使い方をしていますが、どちらに使っても間違いなく使えるプラグインだと思いました

ただ、声がすごい近い位置で話してる感じ(音が前に出てる感じ)に聞こえるので、距離感をつけたい人にはちょっと微妙かも知れません

 

・ A.O.M. tranQuilizr (https://aom-factory.jp/ja/products/tranquilizr/)

価格:無期限ライセンスで15kくらい

Fab filterのイコライザが多分有名どころ(?)と思いますが、こちらの方が出音がすごいパキッとしてわかりやすく好みなので紹介させてもらいます

ただ、出音以外に関しては他のEqプラグインと何も変わらないので特に書くこともないです()
 

<ノイズリダクション系VST>

・iZotope Voice De-noise (https://s3.amazonaws.com/izotopedownloads/docs/rx700/ja/voice-de-noise/index.html)

価格:年に数回、無料でバラまいてます

ノイズゲートやエキスパンダーを貫通し、声に多少乗ってるノイズを消すのに使うといいと思います

自動的にかけてくれるAdaptive modeと声を出さない状態で入るノイズを学習させ抑制する2つのモードがあります

プラグイン自体の遅延も0で大げさにかけると声がぼやっとしてしまいますが、浅くかける分には気兼ねなく利用しやすいと思います


・Waves NS1 Noise Suppressor (https://wavesjapan.jp/plugins/ns1-noise-suppressor)

価格:4千円くらい

こちらは↑のiZotopeのVoice De-noiseよりも更にわかりやすい1フェーダー製品です

自分の耳だと5以上かけると声が丸くなってボヤッとした感じになってるので、それ以上にならないようにして使っています

Voice De-noiseで十分かと思われますが、他の奴使ってみたいという方にはいいかも知れません

 

<レベラー系VST>

・Waves MaxxVolume (https://wavesjapan.jp/plugins/maxxvolume)

価格:4千円くらい


コンプレッサーが閾値を超えた音声を圧縮する挙動に対し、こちらは小さい音を増幅し、大きい音を小さくするという挙動でラウドネス効果のようなものが得られます

これをVRCに用いると、囁き声でもある程度綺麗に入れることが可能になります

 

<エンハンサ系VST>

こちらにまとめてあります

上記の記事でもわけのわからん事を書いてるので、気になる方は合わせてご覧いただけますと幸いです


※なんで有料のプラグインばかり紹介するんだよ?
試しづらいだろと思われた方へ
無料のプラグインで有料版同等の機能・効果というものはあまり少なく、環境構築が甘いから設定詰めたり、プラグインを複数かけあわせればなんとかなるという希望にすがるのを避けるためと言うのもあります

これ使ってダメなら自分がダメというものを列挙させて頂きました(何かあればTwitterやコメント欄までお願いいたします)




(220711追記)

【声の調声手法について】

長々書いてきましたが、恐らくここからが一番大事かも知れません。

まずボイスチェンジャーについてですが、ピッチやフォルマントを変換する仕組みについては頭のいい方が色々書いてる記事がググると見つかるのですが、20年前とほぼ手法は変わってないようです。

以下は自分が録音した音声を確認したりして経験的にそれっぽいと認識してるものなので、話半分のオカルト情報として念頭に置いた上、ご自身で試されるとよいかも知れません。

※〇〇さんがこうするといいと書いてたからこうするのがいいんだ!みたいな考えは捨ててください。この考えは高いオーディオインターフェースやヘッドホンやマイクの音を比較する際も頭の片隅にあるといいかも知れません。


これらの文章を書いていくうえで、挙がっている言葉の意味の違いに齟齬があってはいけない為、前もっていくつか書いておきます。

 

ガビる:喉鳴り声を入れたことにより音声がガビガビして聞こえる事

ケロる:設定したフォルマントが高めに取られているため、普段話してる時はいい感じでもテンションが上がって気持ち入力音声のフォルマントが上がった時にカエルっぽい(犯罪者っぽい)声になる事。

ループバック:オーディオインターフェースの音の流れとしてはInput(物理的入力)→Playback(PC内部再生)→Output(物理的出力)となっており、通常PCで動作するDiscordなどの通話アプリケーションにはInputの音声しか指定できません。

Playbackで再生されたボイチェンや音楽などの音声がOutputされた後、仮想的にInputに音を返す機能の事(モニタリングではありません)

モニタリング:InputされてPlaybackした後ヘッドホン出力端子などからOutputされている音声の事。

Roland(ローランド)病:Roland VT-4を使用時、地声でも裏声でもいいので200Hz付近の状態から400Hz付近の音声を入力した後、いきなり200Hzまで落とした声を入れるとガビる感じとは別で声がロボ声になる現象の事。実はVT-4以外のボイチェンでも大体再現可能です。


↑を踏まえた上で記述していきます。何か不明点あれば、コメントやTwitterの方にDM・リプライ頂ければお力になれるかも知れません(音響エンジニアでも何でもないのでアテにしない方がよいです)


①ピッチとフォルマントの関係について

声を調声する順序は人によって違うと思いますが、ピッチを先に決めるのかフォルマントを先に決めるのかは好みによって分かれると思います。

 

ピッチを先に決め打ち→ピッチ0で出したい声の高さまで出しづらい人向け(?)

フォルマントを先に決め打ち→裏声やチェストまたはミックスボイスなどで出したい声の高さが出るので声色だけ変えたい人向け(?)

 

長々と書いてはみましたが、自分としては正直どちらでもいいです。

ただ、ピッチとフォルマントの値は同じにしてください。微々たる差ではあると思いますが、どのボイスチェンジャーでもピッチの値=フォルマントの値とすると解像度が低くなり辛い傾向が見られます(体感には個人差があります)

そうした場合にピッチ:フォルマントとして取れる値としては、(1~12の範囲がある場合)1:1/2:2/3:3/4:4の4択になると思います。

VT-4であれば0~6、Little Alter Boyであれば0~12と割合が違う場合は100÷6とか100÷12とかして、その範囲のパーセンテージを出せばよいです(前者は16.6666...%/後者は8.3333...%)

自分としては最終的に常時2:2まで持って行ければ十分だと思ってます(妥協感)



②入力する音声について

下記は必ずこうしろという正解はないので、個人の好みや妥協点なども鑑みた上でご判断いただけましたら幸いです。

 

 ・ほぼ地声の高さで発声

自分も最初はこちらでやってみてましたが、最も難易度が高いです。

ボイスチェンジャーは基本的に喉鳴り声に弱い点と変換後の声の抑揚が一本調子になりやすいので、男性の抑揚が少なく喉鳴り気味な話し方と相性が劇悪なためです。

また、ボイスチェンジャーで変換するピッチやフォルマント量が大きくなればなるほど実声部分は失われて行き、合成音声成分が聞いてる感じでは増えていきます。

その仕組みはきちんと理解できてないですが、波形とかを見てるとピッチの変化幅を大きくした際、通常150Hz前後が基音になっている声の基音が250Hzになってる場合、249Hz以下の部分に存在しない周波数帯域が生まれてしまっているのが原因かなと考えています。

ですので、余程発声にエッジがなく喉鳴りとか全くさせずに抑揚つけて話すことが可能な方以外はおすすめしづらいです。

 

・地声(6~7割)+裏声(2~3割)くらいの割合で発声

 長時間利用していく場合はこちらが楽だし採用している方も多いのではないでしょうか(?)

単純に裏声の割合を増やしてしまうと声の抑揚が自分の場合はなくなるので、こちらでやっています。

先ほどのVR環境で外部マイクを利用する際に覚えておいて欲しい事で記載した、可能な限り近接効果が発生しづらい距離までマイクを近づけて、入力ゲインを下げた上で発声しようという事をしようとした場合、声のボリュームの大小もつけやすく音の高さとしての抑揚も綺麗に入れやすいと思います。

また、ボイチェンには地声高い人が有利?と言われるのもこれが所以に思います。


・裏声(9~10割)の割合で発声

イメージ的には↑の気持ち裏声を入れた声が甲高い声のグーフィー(プーさん)みたいな声とした場合、こちらは鬼ミッキーっていう感じでしょうか(?)

裏声で声量も稼ぎつつ、声の高さとしての抑揚もきっちりつけられるよという方であればいいと思いますが、すごい難しいしすごい疲れるだろうからおすすめしません。

また、裏声の割合が高い声を入力してる方のボイチェン声は、ボイチェン声に聞きなれてない方でも裏声でしゃべってるのが何となくわかるようです。(自身の声を聞いてもらった感じ)


※声楽家でもボイトレコーチでもなんでもないので、詳しく書くことも教える事も出来ないですが、興味ある方はロジャー式または弓場式で検索してみるといいかも知れません。

一般的にロジャー式は地声アプローチと言われるもので、弓場式は裏声アプローチと言われる高い音域での発声法のトレーニングになります。

 


③マイクやインターフェースなどの機材との関係について 

これはすごくありがちな事なのですが、いいマイクやいいオーディオインターフェースを買えば、声が全ての領域においてクオリティがよくなるとお考えの方がすごく多いです。

いい機材は基本的にいいところも悪いところもはっきりさせてくれる虫眼鏡みたいなものとして捉えて頂けましたら幸いです。

入れてしまった喉鳴りはきちんと拾ってくれるし、裏声主体の声はきっちり裏声主体として入れてくれます。

私としては、プロも使ってるような機材を導入する最大のメリットとしては性能や使い勝手もさることながら、プロも使ってる機材でダメなら自分のやり方が悪いと判断できる基準になるからと考えています。

では、逆にすごくショボい機材でもいいのか(?)という案に関しては、ある程度使える最低レベルはあると思うので、勘違いなさらぬようお気をつけ頂けましたら幸いです。


④ハードウェア構成?ソフトウェア構成?

音響機材が身の回りにあるとテンションが上がるタイプのバ美肉お兄さんやおじさんいると思います。

私もそのタイプなので最初はハードウェア主体の構成でやっていましたが、やはり機器由来のノイズやケーブルを何本も連結する事による音痩せや解像度の低下は絶対に避けられません

 声のキャラクターを大きく変えるマイクプリアンプやコンプレッサーは、名機と言われる実機のような挙動をするプラグインも出ていますが、実機じゃないと出せない音というのもあると考えているので、実際に構成を組んでみて録音→視聴をし、ずっと聞き続けてると脳がおかしくなるので一旦休憩した後に再度録音→視聴という形で自身の求める環境を構築する方がいいのかなと考えています。(自身の経験上ではハードウェアで組んでもソフトウェアで組んでもVRCの低ビットレート音声ではほぼほぼ違いが分かりづらいです)

※Roland VT-4についてですが、背面フォンアウトより音出しされた音声については、前面のステレオミニ出力端子よりなぜか解像度がぐんっと下がってしまいます。そういったこともあるので構成を変えて録音後確認をおすすめします。

 

⑤イコライジングやエンハンサーなどでの調声について

特定の発声をしているときはこの調整はいいけど、普通に話してる時に叫んだりテンションが上がったりして、そうじゃない話し方とかもすると思います。

なので、素人がわけもわからずやった特定の発声のみに効果があるかも知れないこだわりのイコライジングに時間をかけるくらいなら、実際に声出しして人と話したりする時間を取った方がいいと思います。

私としては発声もそうですが、話し方がすごく大事だと考えているためです。

よく言われたのが男性の一本調子な話し方から、頭出しと語尾を上げ気味にし、溜息を出すくらいの音域から電話口くらいで話す声の高さをぐわんぐわん大げさに使いつつ、なるべく短い言葉で言いきらないようにした方がいいというアドバイスでした。

でありますので、これらをやった場合は普段と話し方も選択する単語も全然違うと思います。

女声やボイチェンで可愛らしい方を見ていると、抑揚のつけ方や間の置き方もそうですが、笑い方とか叫び方がすごくうまいです。観察して気が向いた時に真似するようにしています。


⑥ノイズリダクションやディエッサーの取り扱いについて

VR環境で使用するマイクの性質上、子音が強めに入りやすくディエッサーで抑えたくなったり、周囲の環境によっては声に空調音などが乗ってしまっておりノイズリダクションを使いたくなったりすると思います。

ただ、こういった元の音声に加工を加える処理を重ねたり強くかけてしまうと、音が籠って抜けが悪くなったり、不自然に特定周波数が強調されラジオみたいな音声になってしまったりするはずです。

何事も程ほどが肝心なので、あまりこだわってやらない方が精神的にも優しいと考えています。 


⑦第4基音について

まずはこちらの画像をご覧くださいませ。

こちらはボイチェンで変換後のあーという声を出しているときの波形になりまして、よくわかってないですが男性と女性の声を聞き比べて女性の声が明るめに聞こえるのは声の高さもそうですがF4あたりの周波数が高めに出ている事が大きな要因みたいです。

波形ばかり見て練習したいと思った事はないですが、参考までにこういう情報もあるよくらいに思っていてもいいかも知れません。

一般ボイチェンおじさんの声ですが、通常時と意図的にF4あたりの周波数帯域をイコライザで持ち上げてる比較動画を録っている動画も貼り付けておきます


⑧声について

声はその人のキャラクター(個性)であると自身は考えています。

いくらボイチェンを使って声を変えてるとは言え、元の声がなければその声は出せません。延長線上みたいなものとして捉えています。

つまり、その人の変換前や変換後の声に対して何かしら点数やランク付けをつける発言をしたり、ダメ出しをするという行為を求めてもいないのにする事は非常に危険だと想定されます。加えて、他人を貶めても自身の声がよくなったり悪くなったりするわけでもないです。

知識を得て実践したり、練習などによって自身が出来るようになったことを相手に伝えたり教えたりする事は非常に素晴らしい事だと思いますが、くれぐれも相手を傷つけるような言葉遣いや行動はとらない方がよろしいかと考えています。



(220720) 追記

【VSTプラグインの順序について】

 

①マイク

②プリアンプ

③ノイズゲート/エキスパンダー

(必要あればノイズリダクション)

(必要あればイコライザーやエンハンサー/エキサイター)

⑤ボイチェン(ピッチシフトプラグイン)

(必要あれば後処理用イコライザーやエンハンサー/エキサイター)

⑥コンプレッサー/レベラー


自分は大体上からこの順番でかけています

VRCの音質では、大きく声の聞こえ方が変わるプリアンプとコンプレッサーをこだわっても相手に伝わりづらいですが、モニタリングの方には反映されるので好きなプラグインを使ってもいいと思います

重ね重ねではありますが、入力ゲインを大きめにとったことにより声に乗ってしまった環境ノイズを処理する事は大変面倒くさいので、プリアンプ部分ではあまり盛らず、⑤のピッチシフト後のコンプレッサーやレベラーで最終的な音量調整をした方がいいと思います

コンプレッサーとレベラーのざっくりな違いですが、前者のコンプレッサーは閾値より大きな音を圧縮するものに対し、後者のレベラーは小さな音を大きくし大きな音を小さくするラウドネス効果のあるものとして考えてもらえれば大丈夫です

なので、囁き声を綺麗に入れたい方はどちらかというとレベラーの方がいいと思います

参考になるかはわかりませんが、VRCより多少マシに聞こえるTwitter音質()でこれくらいのエアコンの音であれば、VRCを通すとほぼ聞こえないようです(動画の方はバ美声のオリジナル音声出力で適応型ノイズ除去フィルタなしの状態です)

(2022.08.13時点)VRC Open Beta環境でノイズゲートのかけ具合を調整する設定項目が追加され、より小さな音でも容易に入力可能になっています。

ただ、レベラーなしだと話し声に比べて小さい音は小さく相手に聞こえるので、ある程度均一に相手に届けたいのであれば、今でもレベラーの重要性は高いと考えています。

 

 

サードパーティ製のソフトでループバックさせるVoice Meeter BananaとかSyncRoomとかについて一切の記載がないですが、当方Babyface ProのTotalMix FXでループバックさせてるので今回は省かせてもらいます。

また長々文章が書き足したくなったら追記させてもらえればと思います。

ここまでご覧いただきありがとうございました!