#########################
###  Tips (作業ディレクトリの変更)
###  Windows PCでユーザがkadotaかiuの場合
##########################
getwd()                                # R起動直後の作業ディレクトリを表示
setwd("C:/Users/kadota/Desktop/hoge")  # デスクトップ上のhogeフォルダにしたい場合
getwd()                                # 作業ディレクトリが変更できているか確認

getwd()                                # R起動直後の作業ディレクトリを表示
setwd("C:/Users/iu/Desktop/hoge")      # デスクトップ上のhogeフォルダにしたい場合
getwd()                                # 作業ディレクトリが変更できているか確認

setwd("C:/Users/kadota/Desktop")       # 「デスクトップ」にしたい場合
setwd("C:/Users/kadota/Documents")     # 「マイ ドキュメント」にしたい場合

##########################
###  Tips (TCCパッケージ)
##########################
sessionInfo()                          # 自分のR環境を確認

library(TCC)                           # TCCパッケージをロード
?NBsample                              # NBsample関数のマニュアルを表示

##########################
###  Tips (Biostringsパッケージ)
##########################
source("http://bioconductor.org/biocLite.R")# Biostringsパッケージのインストール
biocLite("Biostrings")                 # Biostringsパッケージのインストール

library(Biostrings)                    # Biostringsパッケージをロード

?readDNAStringSet                      # マニュアルを表示
?read.DNAStringSet                     # マニュアルを表示
sessionInfo()                          # 自分のR環境を確認

##########################
###  R ver. 3.1.0の推奨手順で上流配列取得
##########################
library(TxDb.Hsapiens.UCSC.hg19.knownGene)
txdb <- TxDb.Hsapiens.UCSC.hg19.knownGene
gn <- sort(genes(txdb))
up1000 <- flank(gn, width=1000)
library(BSgenome.Hsapiens.UCSC.hg19)
genome <- BSgenome.Hsapiens.UCSC.hg19
up1000seqs <- getSeq(genome, up1000)

##########################
###  イントロ | NGS | 読み込み | FASTA形式 | 基本情報を取得
##########################
fasta
alphabetFrequency(fasta)

hoge <- alphabetFrequency(fasta)
hoge
dim(hoge)
hoge[3,]

hoge
hoge[,1:3]
hoge[2, 1:3]

hoge
hoge[, c(2, 4)]
c(2, 4)

hoge
apply(hoge, 1, sum)
rowSums(hoge)
apply(hoge, 2, sum)
colSums(hoge)

hoge
apply(hoge[,1:4], 1, sum)
rowSums(hoge[,1:4])
apply(hoge[,1:4], 2, sum)
colSums(hoge[,1:4])

hoge
apply(hoge[,1:4], MARGIN=1, sum)
apply(hoge[,1:4], MARGIN=1, FUN=sum)
apply(hoge[,1:4], MARGIN=2, sum)
apply(hoge[,1:4], MARGIN=2, FUN=sum)

hoge
rowSums(hoge[,2:3])
sum(CG)/sum(ACGT)
CG/ACGT

##########################
###  イントロ | ファイル形式の変換 | FASTQ --> FASTA
##########################
in_f <- "SRR037439.fastq"  #入力ファイル名を指定してin_fに格納
out_f <- "hoge4.fasta"     #出力ファイル名を指定してout_fに格納
library(ShortRead)         #パッケージの読み込み
fastq <- readFastq(in_f)   #in_fで指定したファイルの読み込み
sread(fastq)               #配列情報を表示

fasta <- sread(fastq)
fasta

fastq
showClass("ShortReadQ")
id(fastq)

names(fasta) <- id(fastq)  #description情報部分をfastaに追加
fasta                      #確認してるだけです

##########################
###  前処理 | フィルタリング | 任意のリード(サブセット)を抽出
##########################
...
obj                        #スライド58
sort(obj)                  #スライド58
sort(obj, decreasing=T)    #スライド58

fastq                      #スライド60
length(fastq)              #スライド60
sample(1:500, 30, replace=F)#スライド60
sample(1:500, 30, replace=F)#スライド60

set.seed(9)                #スライド62
sample(1:500, 30, replace=F)#スライド62
sample(1:500, 30, replace=F)#スライド62
sample(1:500, 30, replace=F)#スライド62

set.seed(1010)
sample(1:500, 30, replace=F)
sample(1:500, 30, replace=F)
sample(1:500, 30, replace=F)

set.seed(1010)             #スライド64
sample(1:500, 501, replace=F)#スライド64
sample(1:10, 5, replace=F) #スライド64
sample(1:10, 10, replace=F)#スライド64
sample(1:10, 11, replace=F)#スライド64
sample(1:10, 11, replace=T)#スライド64