タグ

2016年2月23日のブックマーク (16件)

  • RNA-Seqの数理―生成モデルによる発現量推定(3)ペアエンドリードとフラグメント長の分布関数 - Wolfeyes Bioinformatics beta

    まとめ:RNA-Seqの数理―生成モデルによる発現量推定:アーカイブ - Wolfeyes Bioinformatics beta 前回はCount Based Modelの基礎やRPKMとの関連を解説したが,これらはすべてシングルエンドを前提とした発現量推定の方法だった.そこで今回は,現在主流となっているペアエンドに対応できるようモデルの一部を拡張し,その際に必要になるフラグメント長の分布を考慮した有効配列長の考え方について紹介する. ペアエンドによるシーケンスは,illuminaなどで現在もっとも広く使われているNGSの手法だ.ペアエンドのショートリードは,ゲノムやmRNAを特定の長さのフラグメントに細かく分割したあと,その両端にアダプターを付けて左右同時にシーケンスすることによって得られる.この方法によって,単純にシーケンスのデータ量が2倍になるだけでなく,ある程度離れた距離の2つの

    tk60qt
    tk60qt 2016/02/23
  • RNA-Seqの数理―生成モデルによる発現量推定:アーカイブ - Wolfeyes Bioinformatics beta

    この「RNA-Seqの数理」シリーズでは,次世代シーケンサを用いたRNA-Seqにおける発現量推定の数理モデルを理解することを目的とする. 副題にある「生成モデル」とは,観測データの生成過程を確率的にモデル化し,データが与えられたときの事後確率を用いて分類したいクラスや予測したい値を推定する方法のことを指す.今回のRNA-Seqにおける生成モデルでは,次世代シーケンサで読み取られた配列が,どのようにして細胞内のトランスクリプトームから実験によって読み取られて観測されたかという一連の流れを,生成モデルとして表現する.そして確率的なもっともらしさやパラメータの推定をおこない,トランスクリプトームの発現量を求める. このシリーズについて 次世代シーケンサによるRNA-Seqの発現量推定といっても,実験対象は大腸菌レベルから人に至るまでゲノムサイズや遺伝子数は多種多様であり,実験機器も各メーカーご

    tk60qt
    tk60qt 2016/02/23
  • Tophat/Cufflinksなどの開発者であるCole TrapnellによるRNA-Seqの遺伝子発現解析に関する講義動画 - Wolfeyes Bioinformatics beta

    非常に良い講義資料およびその講義ビデオを見つけたので紹介する.これはハーバードの大学院およびハーバード公衆衛生大学院のComputational Biologyの講義で,マイクロアレイ/次世代シーケンサの発現解析に始まり,ChIP-Seqやモチーフ検索,GWAやSNP解析に至るまで,Computational Biologyにおける様々な研究対象に関する講義が行われている. STAT115 Introduction to Computational Biology This course is an introduction to state-of-the-arts concepts, methodologies and practices in computational biology. After taking this course, you should be able to:

    tk60qt
    tk60qt 2016/02/23
  • RNA-Seqの数理―生成モデルによる発現量推定(2)Count Based ModelとRPKM - Wolfeyes Bioinformatics beta

    今回はCount Based Modelと呼ばれる最も基的な生成モデルを作って発現量推定を定式化し,それがRPKMの計算式と同じ意味を持つことを示してみよう.なお,以降の内容はPachter 2011をベースにしている. Models for transcript quantification from RNA-Seq. q-bio.GN, (2011). http://arxiv.org/abs/1104.3889v2 Count Based Modelにおける仮定 Count based Modelは非常にシンプルな生成モデルだ.単純化のために3つの前提条件を置いて,RNA-Seqをモデル化している. NGSのシーケンスはシングルエンド ショートリードはただ1箇所だけにマッピングされる すべての転写物はただ1つのアイソフォームを持つ NGSのシーケンスに関しても,トランスクリプトーム

    tk60qt
    tk60qt 2016/02/23
  • RNA-Seqの数理―生成モデルによる発現量推定(1)RNA-Seqの発現量推定とRPKM - Wolfeyes Bioinformatics beta

    まとめ:RNA-Seqの数理―生成モデルによる発現量推定:アーカイブ - Wolfeyes Bioinformatics beta 生成モデルの話を始める前に,まずはRNA-Seqの発現量としてよく知られているRPKMという指標からスタートし,生成モデルの話へと繋げていこう. RNA-Seqの発現量推定の基 RNA-Seqで得られるデータは,ある長さの配列(ショートリード)とクオリティスコアのセットして表現される.それをリファレンスとなるゲノム配列の中から探しだして,読まれた配列が何の転写物由来かを見つける作業をマッピングという.このマッピングをNGSから出力された数千万/数億のショートリードに対して行い,ある遺伝子の部位にどのくらい貼り付いたかをカウントすることで特定の転写物がどれくらい発現していたかを推定するという方法が,RNA-Seqの発現量推定では基となる. この図はRNA

    tk60qt
    tk60qt 2016/02/23
  • 次期「iPad Air」のうわさを検証--機能、デザイン、発売日はどうなる

    2015年10月、Appleのポートフォリオで最高のタブレット、すなわち「iPad Air 2」が発売1周年を迎えた。そろそろ、「iPad Air」シリーズに関して、同社が次に何を発表するのかを考え始めてもいい頃だろう。 2015年の「iPad Pro」は、グラフィックス分野やメディア分野の一部のプロフェッショナルからは高い評価を受けたが、過去の「iPad」ほど幅広くは(大衆からにせよ、批評家からにせよ)受け入れられていない。同じく2015年に発売された「iPad mini 4」は高性能の小型タブレットで、基的にiPad Air 2の小型版である。しかし、大半の消費者はその半値で購入できる「iPad mini 2」を今も選択している。iPad ProとiPad mini 4に対する反応は、賞賛を浴びたiPad Air 2に対するそれに比べると特に乏しい。iPad Air 2は米CNET

    次期「iPad Air」のうわさを検証--機能、デザイン、発売日はどうなる
    tk60qt
    tk60qt 2016/02/23
  • シンギュラリティサロン#12 高橋 恒一「人類を再発明するのに必要なこと」 | シンギュラリティサロン

    さる2016年1月31日(日)、グランフロント大阪・ナレッジサロンにてシンギュラリティ・サロン「第12回公開講演会」を開催しました。 今回は、理化学研究所 生命システム研究センターチームリーダーで全脳アーキティクチャ・イニシアティブの理事・副代表を務める、高橋 恒一氏が、「人類を再発明するのに必要なこと」と題してお話されました。 以下、講演要旨です。 —————– シンギュラリティー=人類の再発明 自己改良するAIによる爆発的な科学技術の発展、つまりシンギュラリティーが2045年ごろに起こると言われている。そうなれば人類の歴史上最も大きな出来事になるであろう。そのようなことは当に起きるのだろうか、そしてそれは当に2045年頃に起きるだろうか?今日はこのことについて真剣に考えてみたい。 シンギュラリティーに向けて、ロードマップを幾つかの段階に分けて考える必要がある。非常に大雑把に言えば、

    tk60qt
    tk60qt 2016/02/23
  • [Bioclusters] SGE jobs staying in dr state

    tk60qt
    tk60qt 2016/02/23
  • 情報系研究者のための研究ノート - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? Abstract 計算機科学研究での記録のとり方 を書いてから半年ほど過ぎて、さらに知見がたまったので書き直します。情報系研究者が、紙ベース以外で研究ノートを取る場合に何をすれば良いか とにかく効率よく研究するにはどうするか をいくつかまとめました。改善案があればコメント希望、自分も研究効率をあげたいので教えてほしいですね。半年ぐらい経ったらたぶんまた書き直すと思います。 Introduction 記事は、締め切りの明確に定まっている文章(上位国際学会論文、国際学会論文のrebuttal(反論)データ、学位論文)のための実験を円滑柔軟

    情報系研究者のための研究ノート - Qiita
    tk60qt
    tk60qt 2016/02/23
    様々な知恵がこめられている
  • Makefileの書き方 - Y's note

    GNU Make 第3版 作者:Robert MecklenburgオライリージャパンAmazon 利用するケース @yutakikuchi_です。 C/C++を書いた時に複数ファイルから実行ファイルを生成するときやライブラリをIncludeする場合コンパイルのオプションが複雑になります。複雑なオプションを毎回コマンドラインで入力するのではなく、Makefileというコンパイルのオプションルールを記載してmake/gmakeコマンドにて実行ファイルを生成すると便利です。今回はMakefileの簡単なルールについて紹介します。 Makefileの基ルール C++ソースのコンパイルにはg++を利用します。例えばhello.cppというファイルをコンパイルする場合は$ g++ hello.cpp -o helloと実行するとhelloという実行ファイルが生成されます。これをMakefil

    Makefileの書き方 - Y's note
    tk60qt
    tk60qt 2016/02/23
  • - 自動化のためのGNU Make入門講座 - Makefileの基本:ルール

    ここでは,メイクファイルの基的な書き方としてルールの説明をしましょう.ここからは,Makefileといえばmakeが参照するメイクファイルのことを指すものとします. コメントと改行 その前に少しコメントの書き方について解説しておきます.Makefileでは,#から行末までがコメントです.例えば, # # Hello Worldを出力する # all: @echo Hello World! のように使います. また,makeは基的に行指向です.見やすくするために改行したい場合はバックスラッシュ\を使って改行を無視させることができます.例えば,マクロの定義(後述)で object_files = \ foo.o \ bar.o \ baz.o と書けば,makeは改行を無視して次のように解釈します. object_files = foo.o bar.o baz.o ここで注意することは,f

    tk60qt
    tk60qt 2016/02/23
  • トリビアなmakefile入門

    make/makefileは,大きいプログラムのどの断片が再コンパイルされる必要があるかという事と,それらを再コンパイルする発行コマンドを自動的に決定するユーティリティ/設定ファイルです. コンピュータサイエンスの基的な考え方のひとつに冗長性をなくして効率化する構成を追及するというのがあります. 情報理論(bitの理論),HTMLとブラウザ,高級言語と機械語など,ひとつの仕様(表現)から環境や状況にあわせて実装(記述)をつくりだす構成が好まれます. ひとつのファイルでさまざまなコマンドを制御するmake/makefileを制することはコンピュータサイエンスを制することになります. makeのあれこれ もっとも単純な例 Makefile は以下のようなルールからなる.

    tk60qt
    tk60qt 2016/02/23
  • 米ヤフーが買い手を募集中 -「嫁・婿入り前の最後のお色直し」か|決算が読めるようになるノート

    7目です。遂にこの日が来てしまいました。「One of the most powerful Internet companies is officially for sale」という記事で出ているように、米ヤフーが、業のネット事業の売却先を探している、とのことです。 ノートでは、あまりネガティブなことは書かないようにしているつもりですが、この一件だけはインパクトがある上に、学べることも多いので、書いておこうと思います。 ちなみに、参考までに、米ヤフーは、特にここ10年間くらい非常に苦難続きの会社でした(未だに成長を続ける日のヤフーとは正反対です)。 米ヤフーの売上・利益 はじめに2015年10−12月期の決算で発表された、売上推移ですが、四半期あたり$1B強くらいの売上がありますが、ほとんど成長していません。 次に、EBITDA(償却前の営業利益)ですが、こちらも四半期あたり$20

    米ヤフーが買い手を募集中 -「嫁・婿入り前の最後のお色直し」か|決算が読めるようになるノート
    tk60qt
    tk60qt 2016/02/23
  • Stern–Brocot tree - Wikipedia

    The Stern–Brocot tree, and the Stern–Brocot sequences of order i for i = 1, 2, 3, 4 In number theory, the Stern–Brocot tree is an infinite complete binary tree in which the vertices correspond one-for-one to the positive rational numbers, whose values are ordered from the left to the right as in a search tree. The Stern–Brocot tree was introduced independently by Moritz Stern (1858) and Achille Br

    Stern–Brocot tree - Wikipedia
    tk60qt
    tk60qt 2016/02/23
  • Steven Altschuler | UCSF Profiles

    tk60qt
    tk60qt 2016/02/23
  • 分散システムについて語るときに我々の語ること ― 分散システムにまつわる重要な概念について | POSTD

    分散システムについては、もう随分と前から学びたいと思っていました。ただ、それは一度首を突っ込んだら最後、ゴールのない迷路に迷い込むようなものなのです。どこまでも続いているウサギの穴のようなものです。分散システムに関する文献は星の数ほど存在します。様々な大学からたくさんの論文が発表されているばかりでなく、膨大な数の書籍もあるのです。私のような全くの初心者には、どの論文を読んだらいいのか、どの書籍を買ったらいいのか、見当もつきません。 そんなとき、一部のブロガーが、 分散システムエンジニア (それがどういう意味であれ)になるなら知っておくべき論文というものを推奨しているのを見つけました。その一部を紹介しましょう。 FLP , Zab , Time, Clocks and the Ordering of Events in a Distributed Systems , Viewstamped

    分散システムについて語るときに我々の語ること ― 分散システムにまつわる重要な概念について | POSTD
    tk60qt
    tk60qt 2016/02/23