コピペ用コマンド 0. 作業スペースを作って、必要なファイルを移動する #Desktopにいる前提で (pwdで確認) mkdir Kawaoka mv [ファイル] /Desktop/Kawaoka 1. fastqc (uni.fastqに対して) fastqc uni.fastq 2. マッピング (uni.fastqに対して) #nohup…&によってjobをバックグラウンドで実行できます。計算時間の長いことをするときにおすすめ。ログが出るのも良いです。スライドにも書きましたが、一回の計算しかできないマシンを使っている場合、前の計算が終わる前に次の計算を実行すると、前の計算がkillされてしまいます。topコマンドを使って計算が終わったかどうかをチェックするなどして、前の計算が終わる前に次の計算をスタートしないようにしてください。 nohup bowtie2 -x chr17_base -q uni.fastq -N 0 -S chr17_uni.sam& 3. ユニークリードの取り出し (chr17_uni.sam→実際のサンプルに対して) grep -v "XS" uni.sam > chr17_uni_uniq.sam grep -v "XS" chr17_Input.sam > chr17_Input_uniq.sam grep -v "XS" chr17_Oct4.sam > chr17_Oct4_uniq.sam grep -v "XS" chr17_cMyc.sam > chr17_cMyc_uniq.sam (chr17_Oct4.sam、chr17_cMyc.samに関しては自分でやってみる) 4. samtoolsを用いたファイル変換 (chr17_Input_uniq.sam→あとは自分で) samtools view -S -b chr17_Input_uniq.sam > chr17_Input_uniq.bam samtools sort chr17_Input_uniq.bam chr17_Input_uniq_sorted samtools index chr17_Input_uniq_sorted.bam samtools view -S -b chr17_Oct4_uniq.sam > chr17_Oct4_uniq.bam samtools sort chr17_Oct4_uniq.bam chr17_Oct4_uniq_sorted samtools index chr17_Oct4_uniq_sorted.bam samtools view -S -b chr17_cMyc_uniq.sam > chr17_cMyc_uniq.bam samtools sort chr17_cMyc_uniq.bam chr17_cMyc_uniq_sorted samtools index chr17_cMyc_uniq_sorted.bam 5. ngs.plot #chr17_Oct4_uniq_sorted.bamが転写開始点(tss)のまわりにどう分布しているか #まず、NGSPLOT変数をエクスポートする必要があるので、ターミナルを起動して、毎回下記のコマンドを実行してください export NGSPLOT=/usr/local/src/ngsplot #NGSPLOTが依存するRパッケージをインストールする必要があります。Rを起動して、以下をコピペ > source("http://bioconductor.org/biocLite.R") > biocLite("ShortRead") > biocLite("BSgenome") > biocLite("doMC") ngs.plot.r -G hg19 -R tss -C chr17_Oct4_uniq_sorted.bam -O chr17_Oct4_uniq.tss -T chr17_Oct4_uniq -L 3000 -FL 300 #chr17_Oct4_uniq_sorted.bamが遺伝子本体(genebody)のまわりにどう分布しているか ngs.plot.r -G hg19 -R genebody -C chr17_Oct4_uniq_sorted.bam -O chr17_Oct4_uniq.genebody -T chr17_Oct4_uniq -L 3000 -FL 300 #上記と同様の作業をInputに対して ngs.plot.r -G hg19 -R tss -C chr17_Input_uniq_sorted.bam -O chr17_Input_uniq.tss -T chr17_Input_uniq -L 3000 -FL 300 ngs.plot.r -G hg19 -R genebody -C chr17_Input_uniq_sorted.bam -O chr17_Input_uniq.genebody -T chr17_Input_uniq -L 3000 -FL 300 #上記と同様の作業をcMycに対して ngs.plot.r -G hg19 -R tss -C chr17_cMyc_uniq_sorted.bam -O chr17_cMyc_uniq.tss -T chr17_cMyc_uniq -L 3000 -FL 300 ngs.plot.r -G hg19 -R genebody -C chr17_cMyc_uniq_sorted.bam -O chr17_cMyc_uniq.genebody -T chr17_cMyc_uniq -L 3000 -FL 300 6. ピークコーリング (chr17_Input_uniq.bam→あとは自分で) nohup macs14 -t chr17_Oct4_uniq.bam --name=chr17_Oct4 -c chr17_Input_uniq.bam -f BAM -g hs --wig& →以下の出力ファイルが出てきたことを確認 chr17_Oct4_MACS_wiggle (wigファイルを含む新しいディレクトリ) chr17_Oct4_model.r chr17_Oct4_negative_peaks.xls chr17_Oct4_peaks.bed(後で使う) chr17_Oct4_peaks.xls (後で使う) chr17_Oct4_summits.bed (後で使う) nohup macs14 -t chr17_cMyc_uniq.bam --name=chr17_cMyc -c chr17_Input_uniq.bam -f BAM -g hs --wig& →以下の出力ファイルが出てきたことを確認 chr17_cMyc_MACS_wiggle (wigファイルを含む新しいディレクトリ) chr17_cMyc_model.r chr17_cMyc_negative_peaks.xls chr17_cMyc_peaks.bed(後で使う) chr17_cMyc_peaks.xls (後で使う) chr17_cMyc_summits.bed (後で使う) (注) *_wiggleフォルダには、controlとtreatというふたつのフォルダが生成されます。controlに入っているのがいわゆるInputのマップ、treatが免疫沈降したものです。ブラウザにアップロードする解析を行う際は、両方をアップロードしてください。 7. ngs.plot応用編 #cMycの中心付近にOct4がどのように分布しているか ngs.plot.r -G hg19 -R bed -C chr17_Oct4_uniq_sorted.bam -E chr17_cMyc_summits.bed -O Oct4_cMyc_centered -T Oct4 -L 1000 -FL 150 #cMycの中心付近にInputがどのように分布しているか ngs.plot.r -G hg19 -R bed -C chr17_Input_uniq_sorted.bam -E chr17_cMyc_summits.bed -O Input_cMyc_centered -T Input -L 1000 -FL 150 #Oct4の中心付近にcMycがどのように分布しているか ngs.plot.r -G hg19 -R bed -C chr17_cMyc_uniq_sorted.bam -E chr17_Oct4_summits.bed -O cMyc_Oct4_centered -T cMyc -L 1000 -FL 150 #Oct4の中心付近にInputがどのように分布しているか ngs.plot.r -G hg19 -R bed -C chr17_Input_uniq_sorted.bam -E chr17_Oct4_summits.bed -O Input_Oct4_centered -T Input -L 1000 -FL 150 8. 配列の抽出 makeblastdb -in chr17.fa -dbtype nucl -hash_index #フォーマット(注: #をコマンドにいれないでください) blastdbcmd -db chr17.fa -entry all -range 5000000-5000100