nshdot:blog: ファミコンに喋らせる(3)

前回の方法は、矩形波を2チャンネル使って片方は1オクターブ上の周波数にし、それぞれのデューティを変化させるのだった。その組み合わせを表にするとこうなる。縦方向のx2というのが1オクターブ上の方。

矩形波に含まれる倍音の量は、デューティが 50% < 25% < 12.5% の順に多くなるはずなので、乱暴に言うとその順番で高音成分が多くなるともいえる。そう考えると、こういうフォルマントの図によく似た並びになっているのだ。

やや強引な感じもするけど、一応それらしく聞こえる根拠とはいえるだろう。

ところで、よくあるフォルマントの説明では、たとえば「あ」の第1フォルマントの周波数は何Hz、みたいな記述になってるけど、これは喋るときのもの。では歌うときはどうなんだろう。音階によって周波数はぜんぜん違うのにフォルマントの周波数は固定。ということは音階とは関係ない周波数の音を付加する必要があるのだろうか? ...みたいな素朴な疑問があったので、あらためて調べてみた。

声帯から出てくる音自体は「あいうえお」のどれでも同じ比率で倍音成分が含まれた周波数分布になっている。もちろん基本周波数によって倍音の周波数も違う。音階というのはこの周波数の話。
声帯から出た音は口というフィルタを通過して声として出てくる。このとき口の中の形などによってフィルタの周波数特性が決まる。フォルマントというのはこのフィルタの周波数特性の話。

この2つを掛け合わせたものが、声として出てくる音の周波数分布ということになる。フォルマントの周波数というのはあくまでもフィルタの周波数特性上のピーク周波数、ということを理解してないと私のように「音階とは関係ない周波数の音を付加するのか」みたいな誤解をしてしまうわけだ。

声として出せる音階はけっこう幅がある一方、フォルマント周波数は固定なので、その基本周波数によって何倍音がフォルマント周波数にあたるかが異なったりする。なので同じ「あ」に聞こえる音でも音階によって周波数分布の形としては違うということになる。

いま考えている方法はそういう仕組みではなく、基本周波数によらず倍音の比率が固定なので、周波数分布としては同じ形で基本周波数に応じて全体が平行移動したような分布になるはず。なので倍音成分がうまくフォルマント近辺に収まるような音域じゃないと声らしくは聞こえないだろう。

nshdot:blog

2023/12/23

ファミコンに喋らせる(3)

0 件のコメント:

アーカイブ

関連サイト

プロフィール