⽯川 博 名古屋市⽴⼤学 ⼤学院システム⾃然科学研究科 グラフカットの理論と応⽤ ⽬次 応⽤例の紹介・歴史 エネルギー最⼩化 実装例 グラフとその切断 グラフカットによるエネルギー最⼩化 2値の場合 多値の場合(⼤域最⼩化できる場合) 多値の場合(近似アルゴリズム) まとめ 応⽤例の紹介・歴史 グラフカット 別名 s-t mincut エネルギー最⼩化をする⽅法 トレードオフをエネルギーとして表現 応⽤分野 画像復元 ステレオ セグメンテーション 動画像解析 テクスチャ合成 フォトモンタージュ インタラクティブ・セグメンテーション Rother et.al. SIGGRAPH2004 インタラクティブ・セグメンテーション Boykov&Jolly ICCV2001 インタラクティブ・セグメンテーション Wang et.al. SIGGRAPH2005 テクスチャ合成 Kwatra et.a
ここで説明するグラフカットは、画像の領域抽出などで使用される手法の1つ。 ■ 用途 たとえば、写真画像から背景と前景物を分離したいとか http://www.insight-journal.org/browse/publication/777 CT画像 から臓器の領域だけ取り出したい、という用途で使用される。 http://www.grand-challenge2008.bigr.nl/proceedings/pdfs/lts08/02_cmm.pdf ほかにも、複数の画像をシームレスに接続するとか、ノイズを除去するとか、画像処理に関する幅広い用途で用いられている。 ■ 問題設定 次のエネルギーを最小化する「最小化問題」とみなす。 なるべくデータに忠実に(データ項)、でも、できるだけ滑らかに(平滑化項)領域分けしましょう。と考える。 たとえば、CT画像のなかで、「ある画素値をもつ部分は肝臓
勉強しているところなので、間違っている箇所もあるかもしれません. 機械学習は、高度な数学知識を使って、多数のデータから、有用な特徴を算出するいくつかのアルゴリズムを使った技法のことをいう. 例えば、ニューラルネットワークを使った深層学習は、機械学習の一分野である. 集合知プログラミングは、そんな機械学習のサンプルがたくさんある書籍だったけど、もうさすがに古い内容かも. anacondaanacondaは、Pythonの主要なライブラリをパッケージしたオープンデータサイエンスのプラットフォーム. だいたいこれをインストールしておけば、環境が整う. Anaconda jupyterjupyterは、インタラクティブなプログラミング言語の実行環境. PythonやRなどのインタラクティブ実行環境Jupyter Notebookをインストールする
アメリカ、カナダ、等で、 IT 企業との付き合いがあります。[skill transfer] は日常的によく使います。 たとえば、ある人が経験やトレーニングで技術的に何かの技術を身に着けている場合に、他の同僚や新人にそれを伝える場合に使います。必ずしも伝える側が、先輩とか上司とかに限らず、対等の立場で行うことが多いです。 企業内で [skills inventory] などとして、技術能力を明確にして管理している企業が日本より多いです。 [taking over] というのもありますが、部署を変わったり、担当を変わる場合の引継ぎの際に使いますが、技術的なノウハウの伝達も含みます。つまり、交代のための作業ですが、[skill transfer] の方は、交代するしないに係わらず、能力の追加です。 他の仕事に応用するというような意味では使いません。 ただし、日本の企業でどういう意味で使っている
ギリシャ文字のアルファベットを電気/電子回路における主な用途とあわせて表1に示す. ギリシャ文字の大文字は,英文字の大文字と区別の付けにくいものが多いので注意が必要である. 表1 ギリシャ文字の表と電気/電子回路における主な用途 小文字大文字読み読み小文字の主な用途大文字の主な用途
R言語(アールげんご)はオープンソース・フリーソフトウェアの統計解析向けのプログラミング言語及びその開発実行環境である。ファイル名拡張子は.r, .R, .RData, .rds, .rda。 R言語はニュージーランドのオークランド大学のRoss IhakaとRobert Clifford Gentlemanにより作られた。現在ではR Development Core Team[注 1] によりメンテナンスと拡張がなされている。 R言語のソースコードは主にC言語、FORTRAN、そしてRによって開発された。 なお、R言語の仕様を実装した処理系の呼称名はプロジェクトを支援するフリーソフトウェア財団によれば『GNU R』であるが[3] 、他の実装形態が存在しないために日本語での慣用的呼称に倣って、当記事では、仕様・実装を纏めて適宜にR言語や単にR等と呼ぶ。 R言語は、「ベクトル処理」と呼ばれる
グラフィカルモデル(英語: Graphical model)は、グラフが、確率変数間の条件付き依存構造を示しているような確率モデルである。これらは一般に確率論や統計、特にベイズ統計や機械学習で使用される。 グラフィカルモデルの例。各矢印は依存関係を示している。この例では、DがAに依存し、DがBに依存し、DがCに依存し、CがBに依存し、そしてCがDに依存している。 一般的には、多次元空間上の完全な分布と、ある特定の分布が保持する独立性の集合のコンパクトかつ分解された(factorized)表現であるグラフを表現するための基盤として、確率的グラフィカルモデルはグラフベースの表現を使用している。グラフィカルな分布の表現でよく使われるものにベイジアンネットワークとマルコフ確率場がある。両者は分解と独立性の性質を包含するが、表現することができる独立性の集合と、導く分布の分解が異なる[1]。 もし、モ
Graphical Models ML 701 Anna Goldenberg Outline ! Dynamic Models ! Gaussian Linear Models ! Kalman Filter ! DBN ! Undirected Models ! Unification ! Summary HMMs qt hidden states Ot observations q0 Oo q1 O1 qT OT . . . P(Q, O) = p(q0) T −1 ! t=1 p(qt+1|qt) T ! t=1 p(Ot|qt) ! is a Bayes Net ! satisfies Markov property (independence of states given present) ! with discrete states (time steps are disc
人間の知の創造・伝達の多くは、音声によるコミュニケーションによって行われています。 本分野では、人間どうしがやりとりを行う音声メディアを分析し、自動認識・理解した上で、インタラクションを行えるシステムの実現をめざします。 具体的には、会議や講演のような自然な話し言葉音声をテキスト化するシステム、複数の話者や音源などからなる音環境(や音楽)を解析するシステム、非言語情報も統合しながら自然な対話が行える人間型ロボットなどの研究に取り組みます。 研究室紹介 (PDF カラー1ページ) 研究室紹介 (PDF モノクロ1ページ) 話し言葉の音声認識・理解 深層学習によるEnd-to-Endモデル...日本音響学会誌2018年7月号 (PDFファイル) 大規模事前学習モデルに基づく音声認識...日本音響学会誌2023年9月号 (PDFファイル) 少数言語の音声言語処理...日本音響学会誌2025年1月
2017.09.21 総合教育・生涯学習機関の株式会社ECC(本社:大阪市北区、代表取締役社長:山口勝美)は、外国人観光客への[おもてなし]をテーマにした外国語対話無料アプリ【おもてなCityへようこそ!】を2017年9月28日(木)にリリースします。これはアプリ内に人工知能(AI)音声対話技術を組み込んだもので、キャラクターやストーリー性を盛り込み、ソーシャルゲーム感覚で学習ができるアプリです。英語学習初心者の発音でも対話でき、発音のレベルも判定することができます。また対話内容によってストーリーの進行具合が変わり、気づかないうちに繰り返し学習ができるという部分も本アプリの特長です。 昨今、人工知能や音声認識といった最先端技術が急成長していますが、それらは語学学習を前提として作られた技術ではないため、母語以外の発声では音声が認識されないなど、学習用としては成果が現れにくいものでした。今回リ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く