2024 11,23 06:09 |
|
× [PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。 |
|
2016 12,19 06:16 |
|
◆気になるボイスコラム◆ vol.046 2016.12.19号 より
☆声にこだわりを持つ筆者がこだわってお届けします☆ ちょっと謎っぽいタイトルですが、その話はとりあえず置いといて。 要するにコンピュータで作る人工音声のお話です。 コンピュータがしゃべる声ってどんなイメージでしょうか? ちょっと古典的ですが、一音一音とぎれとぎれで抑揚なくしゃべる、といったイメージが浮かびますよね。 ピンとこない方は一度やってみてください。確かにいかにも機械的な感じでしょう。誰でもこんなシーンを映画やテレビで一度は見たことがあると思います。 さて、ここで疑問です。どうしてとぎれとぎれ声だとコンピュータの声、という気がするのでしょうか。 昔テレビで観たから、というのなら、テレビのディレクターはどうしてそんな設定にしたんでしょう。ちょっと気になります。 そもそもコンピュータで人工的に声を作り、コンピュータ自身にしゃべらせようというのはずいぶん昔から色々と試みられていました。 コンピュータやロボットがしゃべったら面白いし便利だろうな、という訳です。 コンピュータで「ピー」というような音を出すことは昔でもさほど難しくありませんでした。でもこれでは声になりません。 声は色々な高さの音の集合です。では人間の声を分析して、色々な高さの音を重ねて出せば人間と同じ声になるじゃないか。 というわけで音を重ねたら、ちょっと独特な機械的響きですが、なんとか声に聴こえるような音を出せました。この方法をフォルマント合成といいます。 さてこれでコンピュータがしゃべれるようになったかというと、さにあらず。 例えばこの方法で「あ」と「め」を組み合わせて出しても、自然な「あめ」に聴こえず、「あ」「め」とバラバラに聴こえてしまうのです。 しかも「雨」なのか「飴」なのかわからない、というおまけつき。 実は人間がしゃべる「あめ」は、「あ」と「め」の間に「渡り」という部分があって、この「渡り」の間にも声は出ているのです。 フォルマント合成方式では渡りがないためバラバラに聴こえてしまった、という訳です。ですからこの「渡り」の部分に声を当てはめないといけないのです。 ところがこの音の組み合わせは膨大な数に上ります。50音ぐらいならいいのですが、膨大な組み合わせを全てコンピュータが処理して実行するのは当時としてはとてもじゃないが無理、 しかも抑揚の情報まで入れるなんて夢のまた夢、ということになりました。 でもせっかくなので、とりあえずとぎれとぎれでいいからしゃべらせようじゃないか、となって、コンピュータはとぎれとぎれの言葉を発し始めました。 それをリアル志向の映画がネタにしました。そして、コンピュータの声ってああなのか、と人々に刻み込まれた、というわけです。 しかし、そこから時代は移って2007年、ボーカロイドというコンピュータ人工音声システムが発売されました。 これは音符と歌詞を入力すると「初音ミク」というキャラクターが人工音声で歌ってくれるというソフトです。 しかも音の強弱・ビブラート・息継ぎなどを設定すると、人間が歌っているような、なめらかな旋律に編集できる、というので瞬く間に世界中に広まりました。 どうしてそんなに自然な人工音声が作れたかというと、実は実際の声優さんの声を使っているのです。 つまり声優さんに実際に声を出してもらって、それを録音してつなぎ合わせたというわけ。そして音がバラバラに聴こえる弱点を補うために、全ての組み合わせの「渡り」部分も収録しました。しかも何通りもの高さで。 それなら確かに自然になるでしょう。単純な力技と言われればそうですが、コンピュータの記憶容量と処理速度が飛躍的に向上したからこそできたことです。 この方式を「素片連結型」といいます。これで制作された楽曲はボーカロイド曲とよばれ、盛んに自作曲が動画サイトに投稿されるようになりました。 ちなみに最初から単語や文を録音して場面によって切り替えて合成する方式もあります。 これはもっと自然でなめらかですが、当然容量は比べものにならないくらい膨大になります。今はまだ実用的な方式とはいえません。 ただししゃべる言葉が「10時です」のように限られていればどうってことはありません。すでに時計とかカーナビとかの家電などで実用化されています。iPhoneのSiriもこれです。 このように人工音声はどんどん進化し、人の声に近づいてきています。コンピュータはいずれ人のようにペラペラとしゃべり出すのでしょうか。 今はマウスやタップで操作するだけのパソコンやスマホとも、言葉で自由に会話できるようになるのでしょうか。 人工音声の技術が進むと今後どうなっていくのでしょう。後編では現実にどんなことができるようになるのか、そんなお話をしたいと思います。 電気羊の歌、という謎のタイトルの意味も後編で。 PR |
|
忍者ブログ [PR] |