ティアのホームページ☆ミ:Page 14 oC
<<< << < prev3$F? 14/554ページ(1661件) $FAnext3 > >> >>>
To Close..Voidolの限界? 2021年12月08日11時22分
Voidolは人の声を入力して、AIが設定したボイスモデルの声に変換するソフトですが、
大事な物の一つに入力があり、入力が綺麗でなければ、当然の如く変換も上手くは行きません。

もし、これが上手く行けば、自分が出した声のニュアンスのまま、別の声に変換出来るという、願ってもない機能なのですが?

・声が酷く歪む
・声が酷く途切れる

という問題が有ります。

まず、ボイスモデル自体の問題もあるかも知れませんが?
未調整のミクよりも、酷い感じで、声が2重、3重に聞こえたり、何を発音しているのか全く分からないレベルです。

喋り言葉が上手く行かないのであればと、「あーーーー」の用な長音を出したとしても、1秒に数回途切れるレベルで、音声が断続する。

生成する音声と音声の間が不適切に長いって感じですよね?

たとえば、
AIが入力に対して100msごとに音声を作成していたとして、100m間隔で、音の生成と再生を行っていれば、音質はともかく、途切れること無く続くはずです。

しかし、これが100msの音声生成してって行為を120m間隔で行っているような感じがする。

そういう感じのブツブツ感なのです。

CPUパワーが足りないとか、メモリが足りないとか、そういう事で起きるらしいのですが?
Ryzen9を使っているPCで足りないのであれば、何を使っても出来ないでしょう?

それに、テストしている時は、他のアプリは使っていませんから。
遅延が大きいという事もありません。


さて、もう一つの問題が有るかもしれない入力その物です。

ヘッドセットのマイクは、良くも悪くも、いい音ではありません。

人にとっては普通に聞こえたとしても、音声を加工して聞こえやすくしていたりしますので、AIで音を判別するのに必要な部分がなくなっているかも知れません。

なので、入力デバイスその物を変更するほかありません。

また、VoidolはASIOでの入力を推奨していることもあり、なんとか用意しないとダメです。

ASIOというと、知らない人の方が多いかもしれませんが、簡単に言うと、OSの機能を使わない音声機能です。
そのため、機能は少ないですが、レイテンシが少なく、原音のまま処理出来るという利点があります。


と言うことで、買ったのはこちら

マランツのコンデンサーマイク

です。
(リンク先はアマゾン)



M-AudioのUSB オーディオインターフェースです。

まずは、コンデンサーマイクの説明からでしょうか?

一般的なマイクは、ダイナミックマイクと言われる物です。

磁石とコイルの巻かれた板がありまして。音があると、空気の振動により板が揺れて、板に巻かれてコイルが、磁石との左様により、電気信号が流れます。

まぁ、一般的なスピーカーと同じです。
スピーカーは音を出すためにその機構を利用しますが、マイクは集音するためにその機構を利用します。

構造的にとてもシンプルであり、特別な物が必要なく、使える物になります。

で、コンデンサーマイクとは・・・・と説明出来るほどの知識は無いのですが
コンデンサを使って音を拾う物になります。

特徴としては、ダイナミックマイクよりも音が綺麗に撮れる。
指向性を持つ。

くらいでしょうか?

また、コンデンサーを使うために、電源を必要とすること、
コンデンサーの特性上、入力が小さい事が挙げられます。

また、端子にXLRが使われていることが多いですね。

結果的に、低ノイズで録音出来ることになります。


今回買ったコンデンサーマイクも、XLRの端子しか付いていません。
XLRの端子をオーディオインターフェースに繋いで、それをPCで録音することになります。

コンデンサーマイクを使うためには、電力供給が必要になりますので、
ファンタム電源機能がついている必要があります。

ファンタム電源は、電源専用の装置もありますが、コンデンサーマイクは入力が小さいので、なるべく入力に近い場所にプリアンプも必要になります。

ですから、ファンタム電源付きでプリアンプ機能も付いているミキサーかオーディオインターフェースが望ましいことになります。

あたしの環境では、SoundBlasterにASIO機能が付いているので、
・XLRを3.5mmに変換する
・ファンタム電源が供給出来る
・プリアンプ
の3つで良かったのですが?

これらを満たす物が、数万を超える高額の物しか無かったのです。

ですので、格安のオーディオインターフェースを買った方が、結果的に安くなると言う、良く分からない現象になりました。

MPM-1000 →(XLR) M-Track Duo →(USB) PCとなりました。

M-Track Duoは標準ではただのUSB音源ですが、ドライバをインストールすることでASIOとして動作させることが出来ます。

さっそく・・・・(以下略)



で、SoundBlasterに付いている標準のマイクよりは格段に綺麗に音が取れるようにはなりましたが、ゆかりねっとでの認識率がとても良くなったくらいですかね?

それ以外には、特に違いはありません。



まぁ、それはそれとして、気になり記述もあるのです。

特にPRO版に
「ご使用になる方(ナレーター)とキャラクター(ターゲット)双方の声を収録・学習し、高い精度で変換できるプロ版も用意。」

学習して、少しずつ綺麗になっていくのでしょうか??
1週間くらい話し続けてきましょうか?

閉じる
テーマ:日記 URL:https://tsukiyori.sakura.ne.jp/index_m.cgi?ID=1622
 
To Close..Windows11にして ※追加×1 2021年11月28日14時47分
昨日、重い腰を上げてってことでもなく、懸案だった、

・色がおかしい件、
・Ryzenで遅くなる件
・Explorerが遅くなる件

等が解消したため、Windows11へアップデートすることにしました。

Windows11で何が変わるかと言うことについて、
これまでにも何度か書いてきたように、セキュリティ面の底上げと、UIの更新です。

UIの更新については、いつの時もあれこれと言われることなので、この際置いておきましょう。

では、セキュリティ面がどの程度良くなったのか・・・・?

これについては・・・

最近のWindows10と比較するのであれば、実は全く変わっていません。


TPM2.0に対応したことで、Windows11が動かないPCが多数出て来たことで、Windows11について、ネガティブなイメージを持つ人も多いかもしれませんが?

最近のWindows10であれば、これらの機能はとっくに使っています。

Windows11は、これらが「必須」になっただけです。

Windows10であれば、対応してたとしても、”無効”にして、”使用しない”で動作させることも何の問題も無く、一切の違和感も無いくらいで通常使用することが出来ます。
しかし、Windows11では、起動しなかったり、入力したPINが無効になったり、そう言った問題が多数出てくるのです。

そう、最悪全く使えなくなります。


まぁ、それだけの差です。

UIを気にしなければWindows11もWindows10もセキュリティ面ではほぼ同じです。
まぁ、今はその程度の差ですが、今後22H1等が出て来た後も同程度のセキュリティレベルかは分かりません。
PCへの攻撃が様々ある現状、OSがハードウェアにより強固にガードされている方が望ましいのは、言うまでもありません。

まぁ、Windows11は未だ出たばかりですから、そう言う意味では致命的な脆弱性が有るかもしれません。
でも、長きにわたり使われてきたWindows10の既に発見されている脆弱性を突かれるよりは、安全かも知れません。

まぁ、この辺りはイタチごっこではあるので、どちらが良いのかと言われても分からないのですが、良さそうな方を選んでいくしかないのでは無いでしょうか?


Windows11の今後について?

で、使った感じは、大体同じです。
UIの変更はそれほどではありませんが、マルチモニタを使用すると不具合がいくつかありますのでそれに目をつむれば、スタートメニューの形が変わった程度でしょうか?

スタートメニューをメニューとしか使わなかったり、デスクトップをアイコンだらけにする人にとっては、殆ど使い心地は変わらないでしょう。
センターにしておくとスタートの位置が変わるので、これを左寄せにすれば、アイコンの見た目がちょこっと変わった程度じゃ無いでしょうか?

あたしは、スタートのランチャーを使っていたので、これがまとめられてしまうと、ちょっと面倒だと感じます。でも、大概の物はタスクバーにピン止めをしてあるので、それら以外は殆ど使わないので、まぁ、このままでも良いでしょうか??

ただ、Explorerに表示されるファイルやフォルダの間がWindows10等に比べて、広い感じがします。
広い感じがするのは、文字が小さくなったのか、間が広がったのかは分かりません。
もし、間が広がったのだとすれば、表示される数が減っていることになりますから、これは「使いやすいように変更」ではなく「改悪」に当たるかと思います。

まだ2日目なのでそれほど問題には当たっていませんが?
10日で元に戻せなくなりますので、それまでに見極めなければなりませんね?

なお、マルチモニタでの不具合は、
タスクバーを「隠す」に設定してある時、サブモニタのタスクバーがマウスでポインとしても、左クリックしても表示されないことです。

ちなみに、右クリックをすると、コンテキストメニューが表示されてしまいますが、一応タスクバーが表示されます。

※追加×1
Windows11にした後、10日でWindows10に戻せなくなる原因は、元に戻すように保存してあるWindows10のフォルダ(改名されて”Windows.old”等に変更されている)が削除されるからです。
このフォルダを、消されないようにすれば、10日以上経っても元に戻す機能が使えるらしいです。10日以上迷いたい人は、その辺り工夫してみたらどうでしょうか?

ちょこっと改名した程度では10日後に消されてしまうらしいので、ちゃんと保存して置いた方が良いですよ?ただ、これはWindows11がでた割と当初の情報なので、現時点(2021/11/28)においても、同じ仕様かは分かりません。ご注意ください。
閉じる
テーマ:日記 URL:https://tsukiyori.sakura.ne.jp/index_m.cgi?ID=1621
 
To Close..VSeeFaceは結構使いやすい 2021年11月25日16時09分
VSeeFaceには、細かいことを言うと不具合が有る。

特に何もしていなくてもキャラが少しずつ回転して行ってしまうこと、1,2時間なら全く問題は無いけれど、
あたしのように数時間の配信を、何度も行っていると、見過ごせないレベルの角度になっている。

まぁ、その度に位置をリセットすれば良いとか、画面内のキャラを回転させれば良いとか、解消方法はいくらでもあるので、現状困っていない。
数日に一度リセットすれば良いだけ。

ということで、現在の本命はAnimazeからVSeeFaceに移りました。

まず、体が良く動く。

どちらも、フェイストラッキングしかしていないけれど、それでも頭しか動かず、体が殆ど動かなかったAnimaze。これはこれで一つの有りだけれど、あれやこれやとやっているのにも拘わらず、首から上しか殆ど動かなかったのはちょっと悲しい。
VSeeFaceは、faceの位置により体の動きをある程度再現してくれる。
トラッキング外れとかしたときに、体が大きくブレてしまうけれど、カメラから外れなければ早々そういう事も起きないから良いかな?
BGMとかでノリノリになっているときに、アバターがしっかり動いていてくれる方が、あたしとしては嬉しいからね。(VSeeFaceには、わざと、からだや首が動かないようにする設定はあるので、Animazeと同じ用な運用は可能です。)

あと、Animazeには無い機能。
課金しなくても、設定が保存されるのです。

Animazeはサブスクで払い続けないと、ちょっとした設定すら全く保存されず、常に初期化位置から始まる。
あと、絶対的な問題として、Animaze Editorを使って、Avater形式に変換しないと使えない。
BoneのClliderが正常に動かない。

等々、色々と問題が有ったので、代替を探していたあたしとしては、このVSeeFaceはとても良い感じ。

まぁ、まだβ版ですけれどね。

あとは、モーションとか対応して欲しいな。

トラッキングだけでは無く、3teneみたいに、選択したモーションをしてくれるとか、そういうのが有ると良い。
それ自体はAnimazeにもあったんだけど、どうもね?動きが良くない。
あぁ、モーションを動かす性能が良くないという意味では無いよ?
モーション自体が良くない。
ルシナは女の子だから、もうちょっと女の子っぽいモーションをして欲しい。

何だったら高価なVR機器とか買っても良いんだけど、ゲーム中のあたしは、腕と指くらいしか動いていないから、全く無意味だよね?

PSO2の大量のロビアクがみたいなのが、有料無料で大量にあって、それらを選択して実行させるって言うのがいいと思うんだ?


まぁ、VSeeFaceにも要望は在ると言うこと。

それでも、Colliderが正常に動くVSeeFaceをメインに使うことにしました。


次、
voidol2

これ、何度もテストして、何度も設定し直して、やっと動く様になりました。

ただ、声が割れる。

これ、おそらく声が割れているんじゃ無くて、声を拾えていないので、音声の出力が止まっているだけだと思う。

そう言う人は、ノイズが乗らないマイクや、S/N比の良いマイク、声が大きく入力出来るマイクを使うと良いです。

まず、自分の声は正しく、大きな声で発音しましょう。

そうすれば、ちゃんと声を出してくれます。

設定に女性1、女性2とか、複数ありますが、これは、入力音声のどの辺りを使用するかという感じみたいです。

全般的に女性1の方が高めの声の人
女性2はそうでも無い人、
女性3があれば、声が低めの人

そんな風になっている感じがします。

それ以外にも、あえてAIに高めに発音させる設定見たいのもあるようです。

何はともあれ、この設定の女性/男性は入力音声に対する追随機能に対する設定ですから、
男性は、男性を、女性は、女性を選択しないと、まともな声は出ません。

AIはそれを基準に、Voiceを生成しますので、男→女みたいな変換の設定ではありません。

ボイスモデルを選択した時点で、男声なのか女声なのかは決まっています。

ボイスモデルとして、紲星あかりを選択したら、男声を出すことは不可能なのです。

恋声の様にSynth系ではありません。地声を加工している訳ではないので、全て紲星あかりの声で出されると言う事ですね。

紲星あかりにめっちゃ低い声を出させて、男声っぽくすることは不可能じゃ無いかも知れません。

でもまぁ、その程度です。

まぁ、それはそれとして、あたしも未だ発音が慣れません。

それに、チャットを読ませるのに紲星あかりを使用しているので、
自分の声も紲星あかりに変換してしまったら、区別が付かなくならないかな? とか思うのです。

あと、当たり前な話しですが、あたしの声が文字として残ることはありません。

そこも気になります。

自分で入力しないと、チャット欄がスカスカのままになってしまうのが悲しい感じがします。

まぁ、ボイスモデルも決まっていませんし、音声デビューは当面先です。
閉じる
テーマ:日記 URL:https://tsukiyori.sakura.ne.jp/index_m.cgi?ID=1620
 
<<< << < prev3$F? 14/554ページ(1661件) $FAnext3 > >> >>>