オープンソースVOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。 製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。 ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。 追加したい・改善したい機能があれば、ぜひ開発にご参加ください。
オープンソースVOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。 製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。 ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。 追加したい・改善したい機能があれば、ぜひ開発にご参加ください。
これは、僕のYouTube動画の台本です。台本、というと、これを朗読しているみたいですが、これをこのまま読み上げているわけではなく、話す内容を整理したり、それを頭に入れるために、まずこのくらい書かないといけないので、コツコツと文字を打って、何度も読み返して、それから話すようにしています。 普段はもう少しメモ書きに近いのですが、今回はしっかり書いたので、noteに置いてみます。 動画はこちらです。あっ、台本の時とタイトル違う……。 これは、僕の予備校時代のある気づきに関する話です。漫画やイラストではなく、鉛筆の石膏デッサンの話ですが、イラストでもこの考え方はそのまま使えます。 絵は基本的には手を動かさないと上手くなりません。でも、ただ枚数をこなしても、上手くなるとは限りません。予備校時代、何年も浪人していて、でもあるレベルで止まってしまう人もいたし、現役生でスイスイと上達していく人もいました
自慢じゃないけどネットストーカーが得意。彼氏の元カノのインスタグラムとか秒速で見つけちゃう。マジで自慢じゃないです。このあいだ、友人がVJをやっているというので1分でそのVJユニットのツイッターアカウントを特定して送り付けたら「ネトスト1級?」と聞かれた。粘着質の賜物ですわよ。 まあそれにしたってアカウント特定にはある程度の手がかりが必要になってくる。名前、居住地、出身大学、エトセトラ。なんらかのヒントが無いとさすがに難儀。別に特別な技術があるわけでもないし、本当にただ粘着質なだけで。 人生で特定したアカウントは数知れず、その中でも一番厄介で一番時間がかかった相手がいました。 かかった年数、約2年。 名前も居住地も知らなかった。知っているのは出身大学と顔だけ。共通の知人なんて1人もいない。 それでも絶対に見つけたかった。 2年間、ずっと膨大なネットの海を潜ってはきょろきょろと探し続けていた
注意:AI批判目的ではありません。単なる考察結果の共有です。どちらかというと私は思想的にはAI推進過激派です。また、ここでの推測はすべて外れている可能性はあります、あくまで推測です。 DMMボイス最近AI界隈(?)で話題になっている、20人分のアニメ調キャラクターの声で感情的な音声を簡単に生成することができるAIサービス。 https://ai-voice.dmm.com/ それの学習元に、エロゲーのテキスト音声データが使われているのではないかという話。 まずは性能がかなり高くて楽しいのでみんな遊んでみてください。(そして知ってる声優がいないか探してみてください。) 追記11/7現在アクセス増大でサービス一時停止しており、サンプルボイスさえ聞けないので、サンプルボイス集を作っておいた: https://whyp.it/collections/3281/dmm利用規約についてのツッコミ動画が
鬼龍院翔(40歳) @kiryuintw 1984年生まれのネズミ年のおじさんです。細々とバンドをやっております。童顔ですが中身は真逆の冷血で生々しい脳味噌です、生々しいツイートを見るのが嫌な方は申し訳ないですが見ないで頂けましたら幸いです。いつまで続くかわからないですがやってみます。呟きたいことを呟きます。ゴールデンボンバーのボーカルです。ドスケベです。 youtube.com/user/goldenbom… リンク ゴールデンボンバー 鬼龍院翔オフィシャルブログ「キリショー☆ブログ」Powered by Ameba ゴールデンボンバー 鬼龍院翔『こんばんは、今ひとりですか?ちょっとお時間宜しいですか?』 キスミー!全国27人の鬼龍院大好きっ子の皆さんこんにちは(^-^)鬼龍院翔です今日は沖縄ライブ1日目でした既にヘトヘトだぜセンキュー!明日も頑張るぜ!(^-^… 鬼龍院翔(39歳) @
今年に入り、AI歌声合成の動きが激しく、その進化のすごさ、クオリティーの高さには驚くばかりです。中でも注目すべきは今年2月に彗星のように登場し、フリーウェアとして公開されたNEUTRINO(ニュートリノ)です。これはSHACHI(@SHACHI_NEUTRINO)さんが開発するフリーのソフトであり、これまで東北きりたん、謡子、そしてJSUT(いずれも学術的に公開されている歌声データベースを利用して開発している)の3つの歌声ライブラリが同梱されてました。そこに9月18日、新たに東北イタコが追加されたのです(9月18日現在、公開されている0.400には東北きりたん、東北イタコのみが同梱。それ以外については後日公開される模様です)。 先日、「AIきりたんに次ぐ第2のAIシンガー、東北イタコの歌唱データベース制作プロジェクトのクラウドファンディングスタート」という記事でも紹介し、無事にクラウドファ
はじめにこの投稿は比較的若手の声優が書いています。また、個人的な意見ですので正しいと思うかは各自の判断でお願いします。 簡単な自己紹介声優養成所で講師をしています。講師歴は5年程度。声優としては吹き替えをメインで活動しています。 もしあなたのお子さんが声優になりたいと言い出したら皆さん、どうします? ここ数年ずっと人気な声優業ですが、鬼滅パワーで再び人気を博しています。ですので、年頃のお子さんをお持ちの親御さんから 「子供が声優になりたいって言い出してね〜。増田さん、どう思う?」と質問を受けることがあります。 個人的には応援してあげてほしいですが、人生がかかっていますので簡単な話ではありませんよね。そこで、講師業の経験から声優になれる人、なれない人の違いを説明しています。(正確には声優になれた人、なれなかった人の特徴) 養成所から声優になれる倍率さて、声優になるのに避けては通れないのが声優
警視庁が公開している「警視庁犯罪情報マップ」が、ネットで「活用したい!」と話題になっている。東京都内の治安を簡単に調べられるサイトになっており、時期的に引っ越しの物件探しなどで役立ちそうだ。 東京都内の治安を調べられる「警視庁犯罪情報マップ」 「警視庁犯罪情報マップ」(リンクで外部サイトが開きます)では、調べたい住所を入力すると、その場所の犯罪情報や、不審者情報などを確認することができる。具体的には、子供や女性に対する声かけやつきまとい事案などをまとめた「前兆事案情報」、特殊詐欺の犯行予兆電話である「アポ電情報」、侵入やひったくりなどの「犯罪情報」の発生状況を地図上に表示してくれるのだ。また、パソコンだけでなくスマートフォンでも閲覧可能で、歩きながら治安状況を確認できる。 このサイトを使えば、ちょうど新生活前のこの時期であれば、引っ越しを検討している人にとって、その地域の治安を知ったり、犯
自分の声をまったく別のキャラクタの声に変えることを実現するAIボイスチェンジャー。エフェクトを使って自分の声を加工する従来のボイスチェンジャーとは異なり、自分の声は完全に消えて、まったく別人になりきれるのが特徴で、これまでもVoidolやCoeFontボイスチェンジャーといったものを記事でも紹介してきたほか、中国系のフリーウェアでもかなりの精度を持ったものがいろいろ登場してきています。 そうした中、12月25日、まったく新たなAIボイスチェンジャー、Parakeet.VC(パラキート・ブイシー)が、福島県のベンチャー企業、Parakeet株式会社からリリースされました。ここには東北ずん子や東北きりたん、またずんだもんをはじめ、計109種類の声が収録されており、ユーザーはそれらを選んで、マイクで話せばリアルタイムにキャラクタの声に変換することが可能です。既存のAIボイスチェンジャーと比較して
いよいよ明日、決戦の日、東京都知事選の投開票日を迎えます。 まずはここまで私と一緒に走ってきてくださったボランティアスタッフの皆さん、応援してくださった皆さんに、最大級の感謝と敬意をお伝えさせてください。 6月6日に出馬会見をした時には、「政治経験がないくせに、無謀な戦いだ」と言われました。最初は、都内14000か所にあるポスター掲示板に、自分ひとりで貼りにいこうと思っていました。 ただ、「東京は、もっとよくなる。もっとワクワクできる街になる」という思いは、誰よりも強い自負がありました。 まず集まってくれたのは、私の東大時代の友人たちと、私が創業した2つの技術系企業で出逢った仲間たちでした。中高時代からの友人や、新卒で入社したコンサルティング企業・BCGの先輩・同僚も集結しました。さらに、経産省のIT人材支援「未踏」メンバーのエンジニアたちが、強力な技術サポートをしてくれることになりました
2022年8月20~21日に開催されたロックフェスティバル「SUMMER SONIC 2022」で、ロックバンド「ONE OK ROCK」のボーカル・Takaさんがステージ上で客の声出しを煽るようなMCをしていたことが、音楽ファンらの間で物議を醸している。 「謝るから俺が、最後もし怒られたら」 ONE OK ROCKは、20日の大阪公演と21日の東京(千葉)公演に出演。ステージの撮影は禁止されているが、インターネット上では観客らによって撮影されたとみられる複数の動画が拡散されている。動画には大勢の観客に向かい声出しを煽るTakaさんの姿や、コールアンドレスポンスで声をあげる観客らの姿が映っている。 MC中、Takaさんが「前のアーティストのメーガン(MEGAN THEE STALLION)でもあんだけ声出してたんだから、いくら出したって関係ねぇだろこれもう」と切り出すと、会場は歓声に包まれ
Vtuberをある程度日常的に見てる人、今若い人で特にSNSや通話アプリで顔なし声オンリーでコミュニケーションを取る文化に浸かったことがある人なら納得してもらいやすいと思うんだけど、モテとそれに付随するコミュニケーションにおいて、イケボやカワボであることがめちゃくちゃ重要な要素になりつつある。ぶっちゃけ恋愛に向いてる声質と向いてない声質がある。 会話が長く続く条件として、お互いの声が良いorどちらか一方の声が良いor普通ボイス同士でもお互いの声の相性が良いのどれかが必要で、ブスボとブサボが会話しようとしても本当に絶望的なくらいに続かない。ネットの通話会議入ったことある人ならわかるんじゃないかな。 彼氏と長く続いてて惚気話が出てくる幸せそうにしてる女の人と話すと、大抵声が良い。愛されボイスというか。なんだか幸せがこっちまで伝わってくるような声質をしてる。 街を歩いていて顔面差のあるカップルと
p-shirokuma.hatenadiary.com 先週、怒鳴り声がどんどん社会のなかでストレスフルなものとみなされるようになり、他人に害をなすものとして浮かび上がってくる話をした。昭和時代には怒鳴り声、ひいては大きな声が溢れていたが、令和時代の日本社会はそうではない。令和の日本人は、自分が怒鳴られると大きなストレスを自覚するのはもちろん、ただ怒鳴り声が聞こえただけで大きなストレスを自覚する。 だが、振り返って考えてみると、怒鳴り声だけがストレス源として社会のなかで浮かび上がっているわけではない。およそストレス源となりそうな感情表出ならなんでも、交感神経を亢進させる感情表出ならなんでも、忌むべきストレス源とみなされ、できるだけそれをなくすよう、なくせなければ迷惑であり危害であり排除すべきもののように扱われる。 たとえば泣き声などもそうだ。職場では、怒鳴っている人が浮かび上がるだけでなく
40代地方在住独身。ぱっとしない生活が一変した話をどこかに吐き出したくて書く。 ひょんなことから数ヶ月前は考えられない毎日を送っている。 いわゆるロスジェネ世代なので就職は苦労したが、都会で働いてからUターンして、ちょっとした専門分野で奮闘してなんとか生き延びている。裕福ではないがまあ生活に困ることはない。 田舎暮らしは嫌いでもないが、若い頃から文化的な面が乏しいのには辟易していた。その反動で都会にいた頃はライブやイベント、美術館などにもよく通ったが、地元に戻ってからは同世代と話題が合わないことにやっぱり困った。もう諦めたけど。 周囲はギャンブル(パチンコ)とか、女性のいる店の話ばかりの人が多い。そういうのが趣味じゃないので、仕事以外はせいぜい家で映画見るかゲームしてるか、くらいの日々だった。 漫画はもともと少し読む習慣があった。といっても最近はアプリで無料作品を中心に物色するくらい。 勧
正直、今までアニメ見てきて「このキャラ声合ってないな」と感じたことがないから皆どういう基準でキャラの声の合致を判断しているのか不思議 ジョジョとか同じキャラをいろんな声優さんが演じてるけどみんな違和感ない みんなちがってみんないい 特に不思議なのがオリジナルアニメのキャラに声合ってない判定下す人 え、君はそのキャラの何なの?原作者でもないのになんで声の合致を判定できるの?って毎回思う 最近見たオリジナルアニメだとオッドタクシーっていうキャストに芸人だらけのアニメがキャラの声についてあれこれ言う人多かった記憶ある あと関係ないけどさ、現実で人に面と向かって「お前、声合ってないな、もうちょっと声を(低く)or(高く)しろよ」って言ったらこれヘイトスピーチで大問題でしょ 海外の番組で司会が喉の手術をした声の高い男の人が喋る度に大勢の前で何度も大爆笑して炎上してクビになったっていう事件があったよね
直感的なエディター画面CoeFontを選択して読み上げたいテキストを入力するだけ!直感的な操作で、簡単AI音声作成! 直感的なAI音声生成を試してみる! 自分の声のAI音声を無料で作成CoeFontではたったの「50文」で、あなたのAI音声が作成可能。 無料で、より作成が簡単になったCoeFontであなたのAI音声を世界中に公開しよう! 5分録音するだけ!無料でAI音声を作成 言語の壁を超えろ、リアルタイム翻訳ツール CoeFont通訳CoeFontの最新プロダクトついに登場! アプリを起動し、簡単な設定をするだけで、あなたの声を最新のAI技術で翻訳! 「ミーティングを英語で話せない」そんなお悩み全て解決できます。 CoeFont通訳を試してみる
Ado @ado1024imokenp アドです。niconico:nicovideo.jp/mylist/58569901 YouTube : youtube.com/c/Ado1024 イラストは「#Adoart」DMは事務所が管理しています。contact→ cloud9pro.co.jp/contact/ …o-dokidokihimitsukichi-daigakuimo.com Ado @ado1024imokenp コラボに対してマイナス意見を言ってる方やそれに賛同してる方々へ 私は私の好きな方や尊敬してる方とコラボさせていただいています。 それに対してマイナスの意見を持つのも構いません。 ただ、ご本人達が見える場所に書き込んだり、それに対してまた見える形でリアクションして賛同の声を上げてしまうような想像力も優しさも配慮もない無神経な方々に私は作品を届けたいとは思いません。
2年ほど前に、自分の声を結月ゆかりにする声質変換技術を作り、動画を投稿しました。この技術には利用者の音声データが大量に必要であるという欠点があり、ゆかりさんになりたいというみなさんの願いを叶えるのが難しい状態でした。そこで、この技術を利用者の音声データが不要になるように改良し、誰でも簡単に使えるようにしました。ここではその技術について解説します。 手法 音声を直接変換しようとすると、利用者の音声データが必要になってしまいます。そこで、音声を直接変換するのをやめて、①音声を構成する要素である音素と音高に分解し、②音素と音高を目標の声(ゆかりさん)に再合成することを考えました。 ①は、音素の抽出に音声認識とOpenJTalkとJuliusを、音高の抽出にWORLDを用いれば簡単に実現できます。そのため、②さえ実現できれば、利用者の声のデータを用意することなく、誰でもゆかりさんの声に変換すること
それを、完全とは言えないまでも、かなり元の人に肉薄する品質で再現できる技術がDiff-SVCです。元になる音声データが1時間くらいあれば、与えた音声を、希望する声質に変換することが可能になるのです。 しかも、基本的にお金はかかりません。AI歌声合成が、ちょっとハードルは高いものの、無料で使えて、データさえ集めてくれば誰でも手が出せる。AI歌声合成の民主化と言っていいでしょう。 筆者は10年近く前に旅立った妻の歌声を、UTAU-Synthという、短く切り出した音素をピッチや長さを合わせながら組み合わせていくソフトウェアで再構成しています。1フレーズずつ音素を繋いで、できるだけ不自然にならないように調整していくため、短くて数日、長いと数カ月も時間をかけて完成させていきますが、もうその作業をしなくてもよくなります。 ただ、自分で歌って、もしくは他のボーカルシンセソフトでボーカルトラックをDiff
他人の声になりすますことができる「AI音声」が注目を集めている。TBS系情報番組「ひるおび」では、スタジオで岸田文雄総理に似せた声を再現したものの、あまりの悪ノリに《不謹慎すぎる》《シャレになっていない》などと批判の声が殺到している。 5月24日の放送では、スタジオにAIスタートアップ創業者の安野貴博氏を招いて、AIによる音声の変換を実演。宇内梨沙アナウンサーが白いマイクを手に取って紹介すると、安野氏は「その機器はマイクなんですけど、向こうのノートパソコンの中で動くAIの学習をさせていただきました」と解説。マイクに音声を吹き込むと、ほぼリアルタイムで岸田総理そっくりの声に変換されていくという。 宇内アナがマイクに向かって声を吹き込むと、スタジオには「こんにちは。恵さん、どうですか」と総理そっくりの声が響く。司会の恵俊彰をはじめ、出演者からは驚きの声があがった。 司会の恵は「『G7サミット、
NATURAL & SMOOTH実際に歌手が楽曲を歌ったデータから特徴を抽出しており、本人の声質だけではなく癖・歌いまわしなどを最新の歌声生成AIで再現します。歌詞とメロディーを入力するだけで簡単に歌わせることができ、実在の歌手に依頼するような感覚で制作を進めることができます。 QUICK STARTインストールはワンクリックで完了。すぐに制作を開始いただけます。 Windows / MacOS / Linux / Onlineでの動作に対応しており、環境を問わずご利用いただけます。 CLEAN DATA & CLEAN MODELモデルの学習には声優・演者様の許諾の上収録した音声データ、もしくは大学などの公的機関から公開されている音声データのみを利用しております。既存の学習済みモデルは利用しておらず、上記データを用いてフルスクラッチで学習を行っております。権利的・倫理的にクリーンな
数年前の今頃、登録者20人程度のVtuberを何となく見つけた。 同接2人(要は本人+自分?)の配信で何となくめっちゃ褒めてみた。 めっちゃ調子良くなっちゃったのか、トークのトーンがめっちゃ上がって行った。 翌日以降も何となく在宅仕事しながら配信見てて、コメントしてたら喜んでた。 それ以降、在宅ワークのお供に彼女の配信が定番となった。 ぶっちゃけトークは下手だし、声も別に良いとは思わないし、ガワもぶっちゃけ安っぽい上に大して動かない。 けど、何となく居心地のいい空間だった。というか、自分以外に殆どコメントが来ない配信だった。 趣味で絵を描いていたので、何となくファンアをプレゼントした。 クオリティとしては、いいねが20付くかなくらいのクソザコレベル。 それでもめっちゃ喜んでた。というか、配信で泣きそうになってた。 配信自体は自分が知る1年前からやっていたようだけど、全然伸びなくてつらかった
先日の兵庫県知事選挙や米国大統領選挙の結果に違和感を持つ人々が増えている。そして、その原因としてSNSやYouTubeなどのスマホベースのメディアが批判されることが目立つ。若者が新聞を読まず、正しい情報が広まらないことが選挙結果に影響しているという主張である。一方で、それに真っ向からの反論もある。既存メディアも偏見に満ち、真実を伝えていないというのだ。このような対立は、なにか、この問題の重要な部分を捉えていないように思える。 現代の情報環境 SNSやYouTubeは情報を即時に広範囲に共有できる点で非常に便利であると言っていい。私自身そのなかにすっぽりといる。世界中の出来事やニュースを瞬時に知ることができるという点では、旧来メディアとは変わりないが、その面では、SNSやYouTubeで二番煎じのことが多い。むしろ、旧来メディアでは知ることのできない、奇妙ともいえるディテールがわかることがあ
HIGHBALL PTE. LTD. は9月11日(月)、自分の好きなアバターと声でビデオ通話できる「Vme!」を正式リリースした。 本ツールは、基本無料で自分の好きなアバターと声でビデオ通話に参加できるGoogle Chromeの拡張機能で、対応ツールはDiscordとGoogle Meetとなっている。HIGHBALL PTE. LTD.によるWeb3×VTuberプロジェクト「Vhigh!」のひとつで、同プロジェクトではファンとクリエイターが一体となってVTuberを制作する「分散型」への変革を掲げている。 また、カメラの映像だけではなく声も変えられることが大きな特徴。公開されているサンプル映像では男性の声が「ずんだもん」のキュートな声に変化している様子が確認できる。なお、リアルタイムのボイスチェンジャーで遅延が気になる場合は、声のピッチのみを変更する機能を使用することで遅延を軽減し
2023年4月18日にMicrosoft Research AsiaとMicrosoft Azureのカイ・シェン氏らの研究チームが拡散モデルを使用した小品質の音声合成システム(TTS)である「NaturalSpeech 2」を発表しました。NaturalSpeech 2では数秒の短い音声サンプルを利用する事で、人の声だけでなく歌声までも忠実にシミュレートすることが可能になっています。 [2304.09116] NaturalSpeech 2: Latent Diffusion Models are Natural and Zero-Shot Speech and Singing Synthesizers https://doi.org/10.48550/arXiv.2304.09116 NaturalSpeech 2 https://speechresearch.github.io/na
新キン肉マン宮野真守×初代キン肉マン神谷明 声優超人の友情パワー対談 2024年1月4日公開! TVアニメ『キン肉マン』完璧超人始祖編2024年放送! ■キャスト キン肉マン:宮野真守 キン肉真弓/プリンス・カメハメ:神谷 明 ■スタッフ 原作:ゆでたまご(集英社『週刊プレイボーイ』『週プレNEWS』連載中) 監督:さとう 陽 シリーズ構成:深見 真 キャラクターデザイン:丸藤広貴 音楽:高梨康治 アニメーション制作:Production I.G TVアニメ『キン肉マン』完璧超人始祖編公式サイト:https://kin29man-anime.com TVアニメ『キン肉マン』完璧超人始祖編公式X(旧Twitter):https://twitter.com/kin29man_anime #キン肉マン #kinnikuman #完璧超人始祖編 #宮野真守 #神谷明
アメリカ人歌手、ティム・ストームズさん(48歳)は、「世界で最も低音の声域を持つ人物」としてギネス世界記録に認定されている。 その声の低さは、もはや非人間的ともいわれており、彼が出せる一番低い音域はまるでティラノサウルスの唸り声のようだとも言われているし、象のような大型動物にしか聞き取り不能とすら言われている。 以下の動画は彼が2012年3月にミズーリ州ブランソンにあるスタジオで録音したアメリカの古いフォークソング『The Lonesome Road』だ。 地面から響くような低音の凄さを堪能しよう。 ALPHA STREAM – Tim Storms – Lonesome Road 世界で最も低い声を持つギネス記録保持者 アメリカのオクラホマ州で生まれ、インディアナ州で育ったティム・ストームズさん(48歳)は、「男性による世界で最も低い音声を出せる人物」として、2002年にギネス世界記録に
地方の主婦が家事中に「ながらバーチャル配信」している理由。しゃべり相手のいない子育て主婦が「VTuber」になることで声で寂しさと愚痴りたいニーズを解消してる話 2名のスマホユーザーにインタビューしました。 目次: 1、地方の主婦が家事中に「ながらバーチャル配信」をしている話 2、女性向けASMRを「精神的なリストカット」として視聴する20代女性 ※このシリーズは定性調査を通じて、ユーザー行動や隠れたニーズを学ぶことを主目的としています。全体を正確に調査したものではありません。1、地方の主婦が家事しながら「バーチャル配信」する理由※東北地方のNさん(30代 主婦)にお話を伺いました。 ○ 「バーチャル配信アプリ」をはじめた経緯は?REALITYという、バーチャルライブ配信アプリで、自宅でご飯をつくりながらとか、アバターで配信をしています。 わたし専業主婦でずっと家にいて。息子も1歳でまだ喋
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く