2024 11,23 06:39 |
|
× [PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。 |
|
2017 01,04 08:29 |
|
◆気になるボイスコラム◆ vol.047 2017.01.04号より
☆声にこだわりを持つ筆者がこだわってお届けします☆ 前回の続きです。人工音声はいまやどんどん進化しています。コンピュータの声も、だんだん人の声と区別がつかなくなるでしょう。 人工音声の技術が進むと今後どうなるのでしょうか。ちょっと考えてみたいと思います。 といってもずっと先のことは分かりません。あまり先のことは実感もわかないですし、外れる公算が大きいですから意味も乏しくなってしまいます。 ですからおよそ10年後、今の技術から推定して現実的に可能で、市販できて広まりそうなこと。それはなにか。 とりあえず、すでに失われた過去の人の歌声を蘇らせることなんかどうでしょう。 もちろんある程度の声のサンプルが揃っていることが前提です。 ボーカロイドと同じ原理で、音をつなぎ合わせて作り出せると思われますが、技術が進めばボーカロイドの時のようにすべての音の組み合わせが揃っていなくても、 サンプルから推定して、足りない渡り部分の音は作り出せるようになるのではないかと思います。 これにより、例えばビートルズやマイケル・ジャクソンなどの、多くの人々にとって懐かしく、 もう一度聴きたいと願うようなアーティストに、新しい現代の曲を歌わせたり、新譜を歌わせる、といったことができます。 もちろん楽曲の新発売というようなことではなく、お遊びアプリとしての使い方、 例えば、個人的にこの人にこの曲を歌わせてみたい、あるいは自分で作った歌を歌わせてみたい、という使い方になるでしょう。 ラインナップの揃え方では充分商品として通用すると思います。 ところで、歌だけじゃつまらない、どうせならあの憧れの俳優や歌手と会話できたらいいのに、と思われる向きがあるかもしれません。 確かにそうです。ただ結論からいうと、コンピュータに実在の特定の人らしく自由にしゃべらせることはかなり難しいでしょう。 コンピュータに、実在の特定の人の声をもっと完全に出させることはできると思います。 必要なものはある程度の量の音声サンプル、そして3-D CTを使った声道の立体構造のデータです。 このデータがあれば、その人の声の特徴をシミュレーションして声の響き具合などを計算で割り出せます。おそらく完全に近い形で声を再現できるでしょう。 しかし声が再現できればその人のしゃべりになるかというと、残念ながらそうはいきません。 しゃべり声には、速さとか間とか、使う言葉のくせとか、なまりとか、イントネーションとか、いろいろと個人特有の特徴があります。 ですから、コンピュータがいくらその人と同じ声を出せても、その人らしいしゃべりを創出することは非常に難しいと思われます。 もちろんその人のしゃべりの膨大なサンプルがあり、その特徴を自動分析してコンピュータが自己学習する、といったことは理論的にはできなくないかもしれません。 ただそれができるようになるのはまだかなり先のことでしょう。 とはいうものの、長い会話は無理ですが、もっと簡単な、「おはよう」とか、「いってらっしゃい」「お疲れさま」みたいな短いフレーズの会話なら、 今のシステムの延長で充分実現できると思います。 iPhoneのSiri程度の簡単な会話ですね。 その程度の会話であっても憧れの俳優やタレントの声と、一方的でなく双方向でお話できる、となれば、意外に売れるんじゃないでしょうか。 さて、タイトルの電気羊という謎のワードですが、人工知能の精度を判定する方法としてチューリング・テストというものがあります。 チューリング・テストとは、人間の判定者が、人工知能と会話をして、人間と区別できなければ、その人工知能は本物の知能があると考えて良い、というものです。 しかし人工知能は「電気羊」のような実在しないものについて訊かれた場合、「見たことないが不味そうだな」とか「人造ウールでひと儲けするのか」みたいに想像力豊かな応答ができず、 「電気羊など現実に存在しない」というようなぎこちない反応を返してしまいがち、と言われています。 つまり人工音声は今後も進化を続けるでしょうが、コンピュータに電気羊の歌をリクエストしても「知らない」と歌ってはくれないでしょう。 コンピュータは過去のデータから類推してしゃべることはできても、何もないところから創造することは苦手なのです。 少なくとも今の技術の延長線上ではそう考えられます。残念ながらボーカロイドは電気羊の歌は歌わないのです。 PR |
|
忍者ブログ [PR] |