######################### ### Tips (作業ディレクトリの変更) ### Windows PCでユーザがkadotaかiuの場合 ########################## getwd() # R起動直後の作業ディレクトリを表示 setwd("C:/Users/kadota/Desktop/hoge") # デスクトップ上のhogeフォルダにしたい場合 getwd() # 作業ディレクトリが変更できているか確認 getwd() # R起動直後の作業ディレクトリを表示 setwd("C:/Users/iu/Desktop/hoge") # デスクトップ上のhogeフォルダにしたい場合 getwd() # 作業ディレクトリが変更できているか確認 setwd("C:/Users/kadota/Desktop") # 「デスクトップ」にしたい場合 setwd("C:/Users/kadota/Documents") # 「マイ ドキュメント」にしたい場合 ########################## ### Tips (TCCパッケージ) ########################## sessionInfo() # 自分のR環境を確認 library(TCC) # TCCパッケージをロード ?NBsample # NBsample関数のマニュアルを表示 ########################## ### Tips (Biostringsパッケージ) ########################## source("http://bioconductor.org/biocLite.R")# Biostringsパッケージのインストール biocLite("Biostrings") # Biostringsパッケージのインストール library(Biostrings) # Biostringsパッケージをロード ?readDNAStringSet # マニュアルを表示 ?read.DNAStringSet # マニュアルを表示 sessionInfo() # 自分のR環境を確認 ########################## ### R ver. 3.1.0の推奨手順で上流配列取得 ########################## library(TxDb.Hsapiens.UCSC.hg19.knownGene) txdb <- TxDb.Hsapiens.UCSC.hg19.knownGene gn <- sort(genes(txdb)) up1000 <- flank(gn, width=1000) library(BSgenome.Hsapiens.UCSC.hg19) genome <- BSgenome.Hsapiens.UCSC.hg19 up1000seqs <- getSeq(genome, up1000) ########################## ### イントロ | NGS | 読み込み | FASTA形式 | 基本情報を取得 ########################## fasta alphabetFrequency(fasta) hoge <- alphabetFrequency(fasta) hoge dim(hoge) hoge[3,] hoge hoge[,1:3] hoge[2, 1:3] hoge hoge[, c(2, 4)] c(2, 4) hoge apply(hoge, 1, sum) rowSums(hoge) apply(hoge, 2, sum) colSums(hoge) hoge apply(hoge[,1:4], 1, sum) rowSums(hoge[,1:4]) apply(hoge[,1:4], 2, sum) colSums(hoge[,1:4]) hoge apply(hoge[,1:4], MARGIN=1, sum) apply(hoge[,1:4], MARGIN=1, FUN=sum) apply(hoge[,1:4], MARGIN=2, sum) apply(hoge[,1:4], MARGIN=2, FUN=sum) hoge rowSums(hoge[,2:3]) sum(CG)/sum(ACGT) CG/ACGT ########################## ### イントロ | ファイル形式の変換 | FASTQ --> FASTA ########################## in_f <- "SRR037439.fastq" #入力ファイル名を指定してin_fに格納 out_f <- "hoge4.fasta" #出力ファイル名を指定してout_fに格納 library(ShortRead) #パッケージの読み込み fastq <- readFastq(in_f) #in_fで指定したファイルの読み込み sread(fastq) #配列情報を表示 fasta <- sread(fastq) fasta fastq showClass("ShortReadQ") id(fastq) names(fasta) <- id(fastq) #description情報部分をfastaに追加 fasta #確認してるだけです ########################## ### 前処理 | フィルタリング | 任意のリード(サブセット)を抽出 ########################## ... obj #スライド58 sort(obj) #スライド58 sort(obj, decreasing=T) #スライド58 fastq #スライド60 length(fastq) #スライド60 sample(1:500, 30, replace=F)#スライド60 sample(1:500, 30, replace=F)#スライド60 set.seed(9) #スライド62 sample(1:500, 30, replace=F)#スライド62 sample(1:500, 30, replace=F)#スライド62 sample(1:500, 30, replace=F)#スライド62 set.seed(1010) sample(1:500, 30, replace=F) sample(1:500, 30, replace=F) sample(1:500, 30, replace=F) set.seed(1010) #スライド64 sample(1:500, 501, replace=F)#スライド64 sample(1:10, 5, replace=F) #スライド64 sample(1:10, 10, replace=F)#スライド64 sample(1:10, 11, replace=F)#スライド64 sample(1:10, 11, replace=T)#スライド64