ENCODE からの 2 つの異なる細胞株 (どの細胞株にもコントロール データなし) に DNase-seq データ (2 つの SAM ファイルまたは 2 つの BED ファイル) があります。クロマチン位置を濃縮/大幅に差別化して開きたいと考えています。セル A/セル B 間のアクセス可能な領域を簡単に比較します。
私のためにそれを行うツールはありますか?そのツールの推奨/推奨コマンドライン オプション設定も役立ちます。
ありがとう
ENCODE からの 2 つの異なる細胞株 (どの細胞株にもコントロール データなし) に DNase-seq データ (2 つの SAM ファイルまたは 2 つの BED ファイル) があります。クロマチン位置を濃縮/大幅に差別化して開きたいと考えています。セル A/セル B 間のアクセス可能な領域を簡単に比較します。
私のためにそれを行うツールはありますか?そのツールの推奨/推奨コマンドライン オプション設定も役立ちます。
ありがとう
BEDToolsの「intersectbed」プログラムを試して、「-wao」フラグを使用して、BEDファイル全体の各要素間にどの程度のオーバーラップが存在するかを報告できます。「-f」フラグと「-r」フラグを「-wao」フラグと組み合わせて使用すると、報告されるオーバーラップを「相互オーバーラップ」に制限できます。「-f」フラグと「-r」フラグを設定して、各要素のファイルAからファイルB、およびファイルBからファイルAにオーバーラップする塩基のパーセンテージとして相互オーバーラップしきい値を指定します。このようにして、2つのファイルでほぼ同じ塩基のセットをカバーしているBED要素を検索し、高レベルの相互重複を示さないBED要素を特定して、有意差のある領域を定義できます。
Bedtools:http ://code.google.com/p/bedtools/
上記のサイトには、ダウンロード可能な優れたPDFマニュアルなど、優れたドキュメントと例が含まれています。お役に立てば幸いです。