# If necessary, please list the packages you need here

データをロードする。

# this data set was analyzed in Zhao 2011 (Nature Communications 2:467)
pheno <- read.csv("RiceDiversityPheno.csv", stringsAsFactors = T)
line <- read.csv("RiceDiversityLine.csv", stringsAsFactors = T)
line.pheno <- merge(line, pheno, by.x = "NSFTV.ID", by.y = "NSFTVID")

解析対象の変数を準備する。

mydata <- data.frame(
    Panicle.number.per.plant = line.pheno$Panicle.number.per.plant,
    Panicle.length = line.pheno$Panicle.length,
    Primary.panicle.branch.number = line.pheno$Primary.panicle.branch.number,
    Seed.number.per.panicle = line.pheno$Seed.number.per.panicle,
    Florets.per.panicle = line.pheno$Florets.per.panicle)
missing <- apply(is.na(mydata), 1, sum) > 0
mydata <- mydata[!missing, ]
subpop <- line.pheno$Sub.population[!missing]

以下の問いに答えなさい。

  1. 個体あたりの穂数(Panicle.number.per.plant)、穂長(Panicle.length)、一次枝梗数(Primary.panicle.branch.number)、穂あたりの種子数(Seed.number.per.panicle)、穂あたりの小花数(Florets.per.panicle)をもとに主成分分析を行う。このとき、同主成分分析は、分散共分散行列をもとに行うべきか、相関行列をもとに行うべきかを答えよ。

Write your answaer and comment here

  1. 1の主成分分析を行い、各主成分の分散の大きさを示す図を描け。
# write R code required for the answer
  1. 寄与率が、元の変数1つあたりの平均説明力を超える主成分(変数の数がqの場合、寄与率が1/qを超える主成分)を採用すると、いくつの主成分が選ばれるか。
# write R code required for the answer

Write your answaer and comment here

  1. 1の主成分分析について、主成分得点の散布図を第1、第2主成分間で描け。その際、分集団Sub.populationごとに色づけをせよ。
# write R code required for the answer
  1. 4の図をもとに、TEJについて、第1、第2主成分得点がどのような値をとるか(大小、正負など)を答えよ。

Write your answaer and comment here

  1. 第1、第2主成分についてバイプロットを描け。
# write R code required for the answer
  1. 第1、第2主成分の因子負荷量を計算して、図を描け。
# write R code required for the answer
  1. 6, 7の図をもとに、第1主成分が大きな値をとるときに、各形質が大きな値をとるか、小さな値をとるか、形質ごとに答えよ。また、第2主成分が大きな値をとるときに、どのような値をとるかについても答えよ。各形質が、それぞれの主成分と関連が小さい(無い)ということもあることに注意せよ。

Write your answaer and comment here