param_base <- c("A", "C", "G", "T", "N")#出力させたい塩基を指定 library(Biostrings) #パッケージの読み込み ################ ### Step 1 ################ in_f <- "out_contig.fa" #入力ファイル名を指定してin_fに格納 out_f <- "result_step1.txt" #出力ファイル名を指定してout_fに格納 fasta <- readDNAStringSet(in_f, format="fasta")#in_fで指定したファイルの読み込み hoge <- alphabetFrequency(fasta) #A,C,G,T,..の数を各配列ごとにカウントした結果をhogeに格納 obj <- is.element(colnames(hoge), param_base)#条件を満たすかどうかを判定した結果をobjに格納 out <- apply(as.matrix(hoge[, obj]), 2, sum)#列ごとの総和をoutに格納 write.table(out, out_f, sep="\t", append=F, quote=F, row.names=T, col.names=F)#outの中身を指定したファイル名で保存 ################ ### Step 2 ################ in_f <- "out_scaffold.fa" #入力ファイル名を指定してin_fに格納 out_f <- "result_step2.txt" #出力ファイル名を指定してout_fに格納 fasta <- readDNAStringSet(in_f, format="fasta")#in_fで指定したファイルの読み込み hoge <- alphabetFrequency(fasta) #A,C,G,T,..の数を各配列ごとにカウントした結果をhogeに格納 obj <- is.element(colnames(hoge), param_base)#条件を満たすかどうかを判定した結果をobjに格納 out <- apply(as.matrix(hoge[, obj]), 2, sum)#列ごとの総和をoutに格納 write.table(out, out_f, sep="\t", append=F, quote=F, row.names=T, col.names=F)#outの中身を指定したファイル名で保存 ################ ### Step 3 ################ in_f <- "out_gapClosed.fa" #入力ファイル名を指定してin_fに格納 out_f <- "result_step3.txt" #出力ファイル名を指定してout_fに格納 fasta <- readDNAStringSet(in_f, format="fasta")#in_fで指定したファイルの読み込み hoge <- alphabetFrequency(fasta) #A,C,G,T,..の数を各配列ごとにカウントした結果をhogeに格納 obj <- is.element(colnames(hoge), param_base)#条件を満たすかどうかを判定した結果をobjに格納 out <- apply(as.matrix(hoge[, obj]), 2, sum)#列ごとの総和をoutに格納 write.table(out, out_f, sep="\t", append=F, quote=F, row.names=T, col.names=F)#outの中身を指定したファイル名で保存