まとめ:RNA-Seqの数理―生成モデルによる発現量推定:アーカイブ - Wolfeyes Bioinformatics beta 前回はCount Based Modelの基礎やRPKMとの関連を解説したが,これらはすべてシングルエンドを前提とした発現量推定の方法だった.そこで今回は,現在主流となっているペアエンドに対応できるようモデルの一部を拡張し,その際に必要になるフラグメント長の分布を考慮した有効配列長の考え方について紹介する. ペアエンドによるシーケンスは,illuminaなどで現在もっとも広く使われているNGSの手法だ.ペアエンドのショートリードは,ゲノムやmRNAを特定の長さのフラグメントに細かく分割したあと,その両端にアダプターを付けて左右同時にシーケンスすることによって得られる.この方法によって,単純にシーケンスのデータ量が2倍になるだけでなく,ある程度離れた距離の2つの