ティアのたわごと４☆其の４１２

お風呂でいいこと

お風呂と言えば

最近は、コミケへ向けてダイエット中なので、運動したりとかで、良くはいるのですが

入ってると眠くなりますよね～

仕事のこととか、あれこれ考えていると、考えているはずでもそのまま寝てたりして・・・

おぼれると大変だし・・・

そこであたしは色々考えました。

以前は片腕を引っかけていたりもしたんですが、起きるとしびれきっているので良くない

あれこれ試した結果、一番効率的で危険の少ないのが首をふたに挟む

挟むと行っても、ふたとふたの間じゃなくて

浴槽に寄りかかって座り、首だけ出すようにしてぎりぎりまでふたを閉めちゃうんです。

見目悪いかもしれませんが、上半身もしっかり支えられ、湯冷めもさけられ、寝てて幸せ☆

是非おためしを！！

さぁ、書くこと無いぞ～（笑

最近秋葉原とか行ってないし、買う物もないし・・・

さて、それではここから、ちょっと難しいかもしれないお話をしましょう。

あたしは、大学で人工知能の研究をしていました。これは某社と共同研究の実は当時最先端のことだったので、それなりにすごかっただよ～っていいたいのですが、今回は、あたしの研究内容とは関係有りません。

さて、

アニメや漫画では良くあるメイドアンドロイドとか、可愛いですよね～

実は研究資材を全部持ち帰っていれば、作れたかもしれないのは確かなのですが
（実際の作業はＴＥＡ.mil☆ミちゃんかな（笑）

あくまで知能的な部分で、目で見たり、物を聞いたりって事とは根本的に違うんですよね

今回は、この聞くことについて焦点を当ててみましょう。

人がどのように声や音を判別しているかご存じですか？

ＰＣなどを利用して音楽を再生するとき、もちろんＣＤとかも含みますが、

これは、音の波形データを用いて再生します。

要するに空気中に伝播する音そのものを（空気の粗密を）電圧の高低にそのまま置き換えたものです。

この場合、非常にきれいに音の録音復元が可能ですが、問題点として、なんの音だか分からないって事です。

波形が著しく変化していれば、高い音が含まれているのは分かりますが、そこから低音の情報を読み取れる人はいないでしょう。

音の波形は全て足しあわされて表示されているので、さっぱりな訳です。

人工知能が、人間などとコミュニケーションを取ろうとするときも、これは大きな障害です。

でも、人間同士の場合、声の高い人低い人、ハスキーな人、小さい人大きい人、アニメ声の人・・・どれをとっても「あ」は「あ」に聞こえますし

「い」は「い」に聞こえる訳です。

人間の耳は、そして脳は外から来る音の波形で声や音楽などを認識している訳ではありません。

耳の奥にある、組織は無数に分かれていて、それぞれはただ一つの周波数に対して反応を示します。

そう、人はどの周波数の音が来たかがわかり、その組み合わせでなんの音かを判別します。

まぁ無数にあると面倒なので適当に五分割します。

１はとっても低音２は低音３は中音４は高音５はとっても高音

たとえば、１、２、５の組み合わせで反応があると、人は「あ」と認識し

２、３の組み合わせだと「い」と認識する

そんな感じです。楽器などの種類とかいろいろ、どれもこの方法です。

また、音の高低は・・・いま１～５でしたが、これを１～１００にしましょう。

低い「う」に反応したのが１０，２０だとすると、
それよりもちょこっと高い「う」には　１５，３０が反応するとか、そういうことです。

反応した組み合わせに対し、記憶にある組み合わせを当てはめる訳です。

ＰＣでも、このようにすれば簡単に話し言葉を理解出来るようになりますが

一般的なＰＣが備える音声の入力装置はマイクなどの音の波形データとして読み込みます。

波形データから周波数成分に分割するには「フーリエ変換」というとても面倒な動作をしなければならない他

この変換式はとても制約があります。

周期的な波形しか分割出来ないのです。

まぁそれはそれで、数学者が色々式を作ってくれているので、それらの制約もかなり減っていますが、三角関数の計算などがあり、結局リアルタイム処理には向かない。

そうです、入力する時点でもうダメなんですよ。

そこであたしは考えました。

ハードウェアで、先に周波数成分に分割済みのデータを入力する。

根本的な所として・・・、波形データでの入力をリアルタイムに周波数成分に分割する方法は・・・・

難しいことは考えられなかったので、ハイパスフィルタ、ローパスフィルタを利用した、バンドパスフィルタ（特定の帯域だけ通過する）を各周波数毎に用意し（おそらく数百は必要）入力値を量子化して成分を抜き取る。

あとは、ＡＩがわが、それを分析する

さて、これはこれでまた問題があります。

声は瞬間的に出ているのではなく継続して発声します。

そのさいに、イントネーションもありますし・・・途中で電話のベルも鳴るかもしれません。

声を解析するには、周波数成分に分割したデータを、時系列に並べて空間処理する必要があります。

あたしには、何がなんだかさっぱりです（笑

ＰＣと対話する日は、まだまだ遠そうです

☆ティア☆
2004/6/21

前へ　　次へ

たわごと☆のメニューに戻る時はここを押してね☆

ホームページに戻る時はここを押してね☆