まだ未発売ではあるが、期待できる製品のご紹介。 DirectVoxxを手持ちのiPodにつなげると、なんと音声操作が可能になる、というものだ。 しかも自然言語処理っぽいことをしてくれるらしいので、DJにリクエストするような感覚で使えるという。 「ビートルズがいいな」「マイケル・ジャクソンにしよう」といった言葉にちゃんと反応してくれるらしい(英語だけど)。なかなか便利なのでは。 音声操作が可能になればぐっと便利になるガジェット・・・他にもありそうですな。
まだ未発売ではあるが、期待できる製品のご紹介。 DirectVoxxを手持ちのiPodにつなげると、なんと音声操作が可能になる、というものだ。 しかも自然言語処理っぽいことをしてくれるらしいので、DJにリクエストするような感覚で使えるという。 「ビートルズがいいな」「マイケル・ジャクソンにしよう」といった言葉にちゃんと反応してくれるらしい(英語だけど)。なかなか便利なのでは。 音声操作が可能になればぐっと便利になるガジェット・・・他にもありそうですな。
数ヶ月前に、桃音モモの音源から歌声をワンフレーズ作った(モモ - IHARA Note)。 今回はその続きとして、話者が変わっても合成できるかなと波音リツで試してみた。ただし、歌声ではなく話し声であり、「忘れ物」という単語である。手作業である(古典的な信号処理による合成。非UTAU、非VOCALOID、非機械学習、非STRAIGHT・WORLD系手法、非LPC)。 20210125_wasuremono.wav - Google ドライブ 機械らしさはぬぐえないが、そこそこ満足のいく合成音となった。ただし、波音リツっぽさは消えてしまっている。波音リツには、「高音」「通常音」「低音」の三種類が用意されていたが、その「低音」の音源だけで合成しているせいだろうと思われる。 ところでこれは別の目的の研究から派生したものなのであるが、そのメインであるはずの別の研究のほうに大した知見が得られず、音声合
初音ミクという歌声合成ソフトが売り出されてから約半年が経つ。その間、様々な初音ミクに対する言説を見てきたが、社会的・心理的・哲学的な観点からの言及ばかりで、科学的な観点からの言及が少なかったので、科学的な観点から簡単な解説を書いた。絵本を読むようなつもりで眺めていただければ幸いである。 リンク先のページに誤りがありましたので、訂正記事にて訂正させていただきました(2008年3月26日)。 初音ミクとかの音声合成のしくみ また、音声合成ではなく、音声認識についてもかなり前に書いたので、合わせて読んでいただけると幸いである。 音声認識のしくみ 簡単にしか書いていないので、詳しいことを知りたい方は、専門書を読んでください。板橋先生の本には音声のことが情報工学的な観点から詳しく書かれており、古井先生の本には物理的な音波としての音と情報工学的な音声のことが半分ずつくらい書かれています。どちらも理工系
久々だと思うのだが、音声認識の話題である。異論はあるかもしれないが、現在の自動音声認識は母音やある種の有声子音を中心に発達してきたように思える。DPマッチングや隠れマルコフモデルやデルタ特徴量などで、時間変化も見られるようにはなっているが、基本的にはスペクトルエンヴェロープを見ており、エンヴェロープから読みとりやすいのは母音や有声子音の種類である。 スペクトログラムを目視して、/k/,/t/,/p/などの無声破裂音、/g/,/d/,/b/などの有声破裂音を区別するのは難しい。文献を読めば、「第二フォルマントにそれらを区別する特徴が現れる」などと書かれてはいるが、それをスペクトログラムから読みとるのは相当難しいことである。「かきくけこ」と「ぱぴぷぺぽ」をスペクトログラム上で区別するのは難しいのである。また、/s/,/sh/を区別するのも難しい。 また、「やゆよ」は日本語や英語では半母音を伴っ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く