タグ

自動化に関するcoldcupのブックマーク (52)

  • Netflixの視聴を左右する「アートワーク」はどのように生成されているのか?

    Netflixによると、ユーザーが新しい作品を探している時、視聴するかどうかの決定には作品ページの背景に表示される「アートワーク」が非常に大きな役割を果たしているとのこと。アートワークは作品中の一場面を切り取って生成されたものなのですが、ユーザーを引き付けるべく、生成にはNetflix独自の技術が詰め込まれています。一体どのようにしてアートワークを生成しているのかについて、Netflixが解説しています。 AVA: The Art and Science of Image Discovery at Netflix https://medium.com/netflix-techblog/ava-the-art-and-science-of-image-discovery-at-netflix-a442f163af6 新たな作品が次々と登場していく中で、Netflixはその作品のユニークな要素

    Netflixの視聴を左右する「アートワーク」はどのように生成されているのか?
  • [SIGGRAPH ASIA]オブジェクトの物理的性質と動きから効果音を自動生成するサウンドエンジンの時代が来るか

    [SIGGRAPH ASIA]オブジェクトの物理的性質と動きから効果音を自動生成するサウンドエンジンの時代が来るか 編集部:aueki Laurent Pruvost氏(Centre National de la Recherche Scientifique) 兵庫県・神戸コンベンションセンターで行われた「SIGGRAPH ASIA 2015」から,ゲームにも関連のあるサウンド処理関係の講演をお届けしてみたい。「SIGGRAPHでサウンド?」と,思う人もいるだろうが,アニメーション系をテーマとした講演の1つとして行われたセッションだ。 講演を担当したのは,仏CNRS(フランス国立科学研究センター)のLaurent Pruvost氏。テーマは「Perceived-Based Interactive Sound Synthesis of Solids' Interaction Sounds」と

    [SIGGRAPH ASIA]オブジェクトの物理的性質と動きから効果音を自動生成するサウンドエンジンの時代が来るか
  • コンテンツIDの誤爆じゃなかった・・・Youtubeの著作権侵害警告の原因判明 | MusMus ブログ

    MusMusの楽曲を使用した動画をYoutubeにアップロードすると「第3者の著作物を使用している可能性がある」※と警告されることがあることを以前にも記事にしました。 MusMusのBGMを使った動画にYoutubeから著作権侵害の警告がきたときの対処※警告の実際の文章はいただいた報告によってまちまちで、確認できたのは以下の三つです。(2014/4/21追記) 第三者のコンテンツを確認しました第三者のコンテンツと一致したため~著作権で保護されたコンテンツが動画に含まれている可能性があります2013年末辺りからずっと引きずっていたこの問題、Victor Entertamentさんに問い合わせたところ綺麗にさっぱり解決しました。 と同時に、MusMusどころかどんな音楽を使っても起こりうる問題ということもわかってしまったんですけどね・・・。 状況を整理フリー音楽素材しか使っていないのに著作権侵

    コンテンツIDの誤爆じゃなかった・・・Youtubeの著作権侵害警告の原因判明 | MusMus ブログ
  • Sign in - Google Accounts

    Not your computer? Use a private browsing window to sign in. Learn more about using Guest mode

  • 論文『画像補完技術による衣服の除去』を刊行します | ぱろすけのメモ帳

    査読付き学術論文誌「あの人の研究論文集 Vol.4 No.2」に、私の執筆した論文「画像補完技術による衣服の除去」が採録されました。私が水面下で開発していた真に革新的なプロダクトに関するものです。人類のロマンであるところの、着衣の透視を実現します。具体的には、以下の画像のようなシステムを実現します。記事に掲載した画像には強いモザイクをかけていますが、実際の紙面ではモザイクはありません。(一部黒塗りがあります。)上の画像が二次元画像を用いた例、下の画像が三次元画像を用いた例です。この図ではモザイクが粗すぎてわかりにくいかもしれませんが、お察しください。英語力に自信がないのであれなのですが、論文の概要は以下の通りです。Abstract: This paper proposes a novel method to remove clothes in images. When an image

    論文『画像補完技術による衣服の除去』を刊行します | ぱろすけのメモ帳
    coldcup
    coldcup 2013/12/26
    局部修正対策にも使えるのかな
  • 相次ぐトラブル、「著作権監視ボット」の行き過ぎ

  • Ustreamのヒューゴー賞授賞式生中継が中断 原因は著作権侵害検出ツール

    米Ustreamは9月3日(現地時間)、2日夜のヒューゴー賞授賞式の生中継が中断してしまったことを謝罪した。原因は、サードパーティー製著作権侵害自動検出ツールが授賞式で放映された動画が著作権で保護されているものであることを検知したことによるという。 ヒューゴー賞は、SF界のアカデミー賞と称される権威ある賞。シカゴで開催された授賞式の様子がWorldcon UStream Channelでライブ中継されたが、短編映像部門受賞作品の脚を書いた作家のニール・ゲイマン氏のスピーチの最中に中断した。 同氏のスピーチの前に放映された受賞作品(BBCのテレビドラマ「ドクター・フー」の「The Doctor’s Wife」というエピソード)動画を、米Vobileのツールが著作権侵害と判断して中継を切ったという。Ustreamのチームは大量の怒りのツイートでトラブルに気付いて復旧しようとしたが、授賞式終了

    Ustreamのヒューゴー賞授賞式生中継が中断 原因は著作権侵害検出ツール
  • Volvoが半自動運転「ロードトレイン」の試験に成功

  • 音楽とかソフトとか 歌声wavからUTAU音源を作ってみる

    ツール公開と同時の方が良いのかもしれませんがデモデータが出来ましたので現状報告で上げておきます。 <はじめに> 現状のUTAU音源制作では「あいうえお~」などと念仏を詠唱するかのようなやり方で音声収録します。このやり方の長所は、効率的に全モーラを網羅できること、それなりに安定した発声の音源になりやすいこと、原音設定がしやすいことだと思います。逆に短所としては、(個人差はあると思いますが)、収録していて楽しくない、声の演技表現を入れ辛く棒読みになりがち、といったところかと思います。 この短所を解消する一案として歌声を音源化することが考えられます。端的には好きな歌を歌っているとそれが音源になるというアプローチです。このやり方の長所・短所は既存手法の長所・短所と逆になり、効率が悪い反面楽しさや表現の入れやすさなどのメリットが出てくると期待されます。実際には既存の音源を拡張する形で歌声音源を追加す

  • 大量の画像で出来ること - n_hidekeyの日記

    世の中はビッグデータ一色のようですね。コンピュータビジョン界隈でも大量の画像データで何が出来るかは盛んに議論されています。今日は有名なのを軽くまとめてみたいと思います。 画像内容認識 一番分かりやすいのは、大量のラベル付画像データを用いたパターン認識です。"More data beats better algorithm" はあちこちで言われていますが、画像認識の分野もこの方向へ進んでいます。あまり面倒くさいことしなくても、単純なノンパラメトリック手法(k最近傍法とか)で十分なんじゃないか、みたいなお話です。 いろいろあるのですが、特に有名なのはMITのTorralbaさんの研究でしょうか。 A. Torralba, R. Fergus, W. T. Freeman, 80 million tiny images: a large dataset for non-parametric ob

    大量の画像で出来ること - n_hidekeyの日記
  • TechCrunch | Startup and Technology News

    Live Nation says its Ticketmaster subsidiary was hacked. A hacker claims to be selling 560 million customer records. An autonomous pod. A solid-state battery-powered sports car. An electric pickup truck. A convertible grand tourer EV with up to 600 miles of range. A “fully connected mobility device” for young urban innovators to be built by Foxconn and priced under $30,000. The next Popemobile. Ov

    TechCrunch | Startup and Technology News
  • 産総研:インターネット上の動画音声データの検索・書き起こしシステムを実現

    発表・掲載日:2011/10/12 インターネット上の動画音声データの検索・書き起こしシステムを実現 -動画中の発言内容を音声認識でテキストに書き起こして全文検索が可能に- ポイント 動画共有サービスの動画中の音声を認識して全文検索できるウェブ上のサービスを公開 誰でも簡単な操作で音声認識誤りを訂正して読みやすい書き起こしを作成できる 日語に加えて英語の動画音声データの検索・書き起こしにも対応 独立行政法人 産業技術総合研究所【理事長 野間口 有】(以下「産総研」という)情報技術研究部門【研究部門長 関口 智嗣】後藤 真孝 上席研究員 兼メディアインタラクション研究グループ 研究グループ長と緒方 淳 研究員らは、ユーザーに協力してもらうことで日々性能が向上する音声情報検索技術を開発し、インターネット上にある日語と英語の動画音声データ(動画共有サービスやポッドキャストによって公開されてい

  • スマートフォンのカメラに映った人の名前・趣味や社会保障番号を特定する技術

    (この写真は2009年に別の人が作ったコンセプト) カーネギーメロン大学のAlessandro Acquistiさんのチームが、市販の顔認識ソフトウェア、クラウドコンピューティングサービス、ソーシャルネットワークサービス […] (この写真は2009年に別の人が作ったコンセプト) カーネギーメロン大学のAlessandro Acquistiさんのチームが、市販の顔認識ソフトウェア、クラウドコンピューティングサービス、ソーシャルネットワークサービスの三つを組み合わせることで、オフラインの人物の顔と、オンライン側の情報を突き合わせるという実験を行なったそうです。 「自分の名前のタグがオンラインの写真につけられるようになったことで、これまで匿名性が守られると思われていた状況でも、他人があなたの名前とあなたの情報を結びつけることができるようになりつつあります」というコメント。近い将来は、あなたの友

    スマートフォンのカメラに映った人の名前・趣味や社会保障番号を特定する技術
  • YouTube、日本語動画に自動で字幕つけられる新機能

    グーグルは7月14日、YouTube動画に自動で字幕をつける「自動キャプション機能」の日語版を公開した。音声認識技術を使って日語の動画に自動で字幕がつけられるようになった。自動翻訳機能も組み合わせると、手間をかけずに多言語の翻訳字幕もつけられる。 YouTubeにアップロードされる動画は1分間に48時間にのぼる。この膨大な量の動画を広く視聴してもらうために、グーグルは3年前からキャプション機能の開発に取り組んできた。キャプション機能を実装することで、検索性を向上させること、言語の壁を越えること、耳の不自由な人にも楽しんでもらえるようにすることが可能になるという。 たとえば東日大震災の被災地である南相馬市の桜井市長が語るYouTube動画は、英語の字幕がつけられたことで、世界中に発信され、多くの関心を集めた。 ただし字幕の作成と編集は煩雑な作業を要する。グーグルは「キャプションエディタ

    YouTube、日本語動画に自動で字幕つけられる新機能
    coldcup
    coldcup 2011/07/15
    試してみたけど英語のよりひどかった
  • YouTube違法動画をブロックする権利者用ツールは「シンプル」

    1分間に35時間分以上の動画が投稿されているというYouTube。著作権対策は当初から大きな課題となっており、Googleはさまざまな対策を講じてきた。Google法人は11月24日、著作権侵害対策に関する記者説明会を開き、権利者向け管理ツールの画面の一部を公開。著作権を重視する姿勢を改めてアピールした。 YouTubeでは従来から、過去に削除した違法動画のハッシュ値と照合して同じ動画の投稿を阻止する仕組みや、規約違反の動画を複数回投稿したIDは無効にするといった対策を実施。権利者向けには、キーワードに合致した動画を一覧表示し、一括で削除できるツールも提供している。 2007年からは「Content ID」(コンテンツID)を導入。数十億円かけて開発したというシステムで、権利者が事前に登録した動画について、全く同じ動画だけでなく、似た動画や、一部が一致する動画も自動でピックアップし、権

    YouTube違法動画をブロックする権利者用ツールは「シンプル」
  • IDEA * IDEA

    ドットインストール代表のライフハックブログ

    IDEA * IDEA
  • Think of Silicon Valley Model

    シリコンバレー、ベンチャー、テクノロジー、サイエンス、投資を主要テーマとする海外のブログの中から読み応えのあるものを選んで日語に翻訳(抄訳)して紹介するサイト。ときどきオリジナルも書きます。 一度読むとまさに粘りつくように記憶に残るエピソードがある。アタマの中にはそんなのがいくつも転がっていると、時には目から入ってくる情報とおもしろい邂逅をみせてくれる。 『その数学が戦略を決める (文春文庫)』(イアン・エアーズ 著 |山形 浩生・訳|2007)というがある。 ぼくが気になっていたエピソードはその著書の中にでてくる「6.6 大コケ映画を探せ」という一章だった。これがここ数年ずっと頭のどこかに転がっていた。 簡単にいうと、映画の興収が巨額になるか、鳴かず飛ばずでおわるかを決定づけるのは、役者や監督あるいは宣伝費の大小なんかではない、シナリオの出来しだいなのだ。しかもそれは事前に数式でもっ

  • YouTube - Gmail Priority Inbox

    Get through your email faster. Learn more at http://www.gmail.com/priorityinbox

    YouTube - Gmail Priority Inbox
  • reCAPTCHAにいつのまにか手伝わされているのは腹立たしい

    IT系界隈では有名な話でものっすごい今更感漂うのですが。 なんかのWebサービスの登録の最後に、こういう感じで、画像の文字を読んで入力させるタイプの認証が掛かっていることがあります。 これは、プログラムとかで人間以外のものが自動で登録するのを防ぐために、登録者が「人間」であることを確かめているわけで。 いろいろなタイプのものがあるんですけど、例えばreCAPTCHAっていう会社が出してるこれ、読ませる単語が絶対に2個なんです。 で、なんで2個かっていうと、一つはreCAPTCHAが読み方(答え)を知っている単語、もう一つは、昔の書籍などから引っ張ってきた画像で、reCAPTCHAが読み方を知らないもの。 何がしたいかっていうと、reCAPTCHAは、2つ目の単語の答えを知りたいんです。 昔の書籍などの文字の情報をスキャンして電子化したいときに、読めない文字がいくつかあるとして、それを問題と

  • 広告の歴史を変える?「iogous(イオゴス)」 | isologue

    広告の歴史を変える?「iogous(イオゴス)」 | isologue