W2 解析データ
W2.1 シミュレーションデータの作成
nA <- 3 # A群の反復数(サンプル数)
nB <- 3 # B群の反復数(サンプル数)
G <- 10000 # 遺伝子数
PDEG <- 0.5 # DEGの割合
PA <- 0.5 # A群で高発現DEGの割合
FC <- 4 # 発現変動の度合い(倍率変化)
# 必要なパッケージのロードや前処理
library(TCC) # パッケージのロード
PB <- (1 - PA) # B群で高発現DEGの割合はPAが決まれば自動的に定まる
set.seed(1050) # 乱数種の指定
# シミュレーションデータ生成本番
tcc <- simulateReadCounts(Ngene = G, # 遺伝子数指定部分
PDEG = PDEG, # DEGの割合指定部分
DEG.assign = c(PA, PB), # 群ごとの高発現DEGの割合
replicates = c(nA, nB), # 群ごとの反復数
DEG.foldchange = c(FC, FC)) # 群ごとのDEGの倍率変化
truth <- as.numeric(tcc$simulation$trueDEG != 0) # 真のDEGの位置を1、non-DEGの位置を0としたベクトルを作成
Truth <- truth # コピー
Truth[1:(G*PDEG*PA)] <- "DEG_A" # DEG_Aパターンの位置
Truth[(G*PDEG*PA+1):(G*PDEG)] <- "DEG_B" # DEG_Bパターンの位置
Truth[Truth == 0] <- "non-DEG" # non-DEGパターンの位置
data <- tcc$count # カウント情報
data.cl <- tcc$group$group # 群ラベル情報
plotFCPseudocolor(tcc) # シミュレーション条件のpseudo-colorイメージを描画

# 出力
colnames(data) <- c(paste("A", 1:nA, sep=""), paste("B", 1:nB, sep=""))
tmp <- cbind(rownames(data), data)
out_f <- paste("JSLAB28_data.csv", sep="")
write.csv(tmp, out_f, row.names=F)
W2.2 log比の計算
以下のdataオブジェクトに対応する元データファイルは、JSLAB28_data.csvです。出力ファイルは、JSLAB28_truth.csvです。
x <- data # コピー
cl <- data.cl # コピー
meanA <- apply(x[, cl == 1], 1, FUN = mean) # A群の平均の計算
meanB <- apply(x[, cl == 2], 1, FUN = mean) # B群の平均の計算
logratio <- log2(meanB/meanA) # log比の計算
# パターンごとのlog比の要約統計量
summary(logratio[Truth == "DEG_A"]) # DEG_Aのlog比の要約統計量
Min. 1st Qu. Median Mean 3rd Qu. Max.
-Inf -2.474 -2.015 -1.629 Inf
summary(logratio[Truth == "DEG_B"]) # DEG_Bのlog比の要約統計量
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
-Inf 1.602 2.009 NaN 2.444 Inf 3
summary(logratio[Truth == "non-DEG"]) # non-DEGのlog比の要約統計量
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
-Inf -0.415 0.000 NaN 0.466 Inf 43
# 出力
med_DEG_A <- median(logratio[Truth == "DEG_A"], na.rm = TRUE) # DEG_Aのlog比の中央値
med_DEG_B <- median(logratio[Truth == "DEG_B"], na.rm = TRUE) # DEG_Bのlog比の中央値
med_nonDEG <- median(logratio[Truth == "non-DEG"], na.rm = TRUE)# non-DEGのlog比の中央値
tmp <- NULL
tmp <- rbind(tmp, c("DEG_A", med_DEG_A))
tmp <- rbind(tmp, c("DEG_B", med_DEG_B))
tmp <- rbind(tmp, c("non-DEG", med_nonDEG))
colnames(tmp) <- c("cluster_name", "logratio")
write.csv(tmp, "JSLAB28_truth.csv", row.names=F)
W2.3 MBCluster.Seqの実行
出力ファイルは、図1の右上部分に相当するJSLAB28_res.csv、K =
3~5のクラスタ中心のlog比情報を格納したJSLAB28_K3centers.csv、JSLAB28_K4centers.csv、JSLAB28_K5centers.csvです。
library(MBCluster.Seq) # パッケージのロード
set.seed(1000)
# MBCluster.Seqの実行(K = 3)
K <- 3 # クラスタ数
mbc <- RNASeq.Data(data, Normalizer = NULL,
Treatment = data.cl, GeneID = rownames(data))
c0 <- KmeansPlus.RNASeq(data = mbc, nK = K,
model = "nbinom", print.steps = F)
cls <- Cluster.RNASeq(data = mbc, model = "nbinom",
centers = c0$centers, method = "EM")
cluster <- cls$cluster # オブジェクト名の変更(クラスタ番号情報)
centers <- cls$centers # オブジェクト名の変更(クラスタ中心情報)
# 後処理と結果の大まかな確認
centers # クラスタ中心の発現パターン(log(B群/A群))
table(cluster) # クラスタごとに含まれる遺伝子数
K3 <- str_c("cluster", cluster) # クラスタ番号の左側に文字列"cluster"を連結
K3_centers <- log2(exp(2 * centers[,2])) # クラスタ中心のlog2(B/A)情報
# MBCluster.Seqの実行(K = 4)
K <- 4 # クラスタ数
mbc <- RNASeq.Data(data, Normalizer = NULL,
Treatment = data.cl, GeneID = rownames(data))
c0 <- KmeansPlus.RNASeq(data = mbc, nK = K,
model = "nbinom", print.steps = F)
cls <- Cluster.RNASeq(data = mbc, model = "nbinom",
centers = c0$centers, method = "EM")
cluster <- cls$cluster # オブジェクト名の変更(クラスタ番号情報)
centers <- cls$centers # オブジェクト名の変更(クラスタ中心情報)
# 後処理と結果の大まかな確認
centers # クラスタ中心の発現パターン(log(B群/A群))
table(cluster) # クラスタごとに含まれる遺伝子数
K4 <- str_c("cluster", cluster) # クラスタ番号の左側に文字列"cluster"を連結
K4_centers <- log2(exp(2 * centers[,2])) # クラスタ中心のlog2(B/A)情報
# MBCluster.Seqの実行(K = 5)
K <- 5 # クラスタ数
mbc <- RNASeq.Data(data, Normalizer = NULL,
Treatment = data.cl, GeneID = rownames(data))
c0 <- KmeansPlus.RNASeq(data = mbc, nK = K,
model = "nbinom", print.steps = F)
cls <- Cluster.RNASeq(data = mbc, model = "nbinom",
centers = c0$centers, method = "EM")
cluster <- cls$cluster # オブジェクト名の変更(クラスタ番号情報)
centers <- cls$centers # オブジェクト名の変更(クラスタ中心情報)
# 後処理と結果の大まかな確認
centers # クラスタ中心の発現パターン(log(B群/A群))
table(cluster) # クラスタごとに含まれる遺伝子数
K5 <- str_c("cluster", cluster) # クラスタ番号の左側に文字列"cluster"を連結
K5_centers <- log2(exp(2 * centers[,2])) # クラスタ中心のlog2(B/A)情報
# 出力
Frequency <- rep(1, length(Truth))
tmp <- cbind(rownames(data), Truth, logratio, K3, K4, K5, Frequency)
out_f <- paste("JSLAB28_res.csv", sep="")
write.csv(tmp, out_f, row.names=F)
tmp <- cbind(str_c("cluster", 1:3), K3_centers)
colnames(tmp) <- c("cluster_name", "logratio")
write.csv(tmp, "JSLAB28_K3centers.csv", row.names=F)
tmp <- cbind(str_c("cluster", 1:4), K4_centers)
colnames(tmp) <- c("cluster_name", "logratio")
write.csv(tmp, "JSLAB28_K4centers.csv", row.names=F)
tmp <- cbind(str_c("cluster", 1:5), K5_centers)
colnames(tmp) <- c("cluster_name", "logratio")
write.csv(tmp, "JSLAB28_K5centers.csv", row.names=F)
W2.4 ヒストグラム(図1下部)
入力ファイルは、JSLAB28_res.csvとJSLAB28_truth.csvです。以下のスクリプトは、生成AIの1つであるGeminiに入力ファイルを与えたのち、「JSLAB28_res.csvのTruth列とlogratio列を読み込んで、logratio列のヒストグラムをTruth列のカテゴリごとに色分けしてggplot2で描画するRのスクリプトを教えて。また、JSLAB28_truth.csvを読み込んでヒストグラムの上部に、横軸上がlogratio列の数値の位置に下向き矢印を追加し、さらにそのすぐ上にcluster_name列の文字列とlogratio列の数値情報も小数点以下3桁で示して。」
のような指令(プロンプト)を出して得た結果を簡潔にしたものです。
# データの読み込み
df <- read.csv("JSLAB28_res.csv")
tmp <- read.csv("JSLAB28_truth.csv")
clust_name <- tmp$cluster_name
clust_lr <- tmp$logratio
max_y <- 700
# --- 色の設定 ---
# ヒストグラムで使う "Set1" パレットから、クラスター数(4つ)分の色を抽出
# Set1の順番は、通常 ggplot の fill と一致します
my_pal <- brewer.pal(nrow(tmp), "Set1")
# ヒストグラムの作成
ggplot(df, aes(x = logratio, fill = Truth)) +
geom_histogram(binwidth = 0.1, alpha = 0.6, position = "identity") +
# x軸の範囲を -4 から 4 に指定
coord_cartesian(xlim = c(-4, 4), ylim = c(0, max_y)) +
# クラスタ中心情報の追加
annotate("segment", x = clust_lr, xend = clust_lr, y = max_y * 0.78, yend = max_y * 0.72,
arrow = arrow(length = unit(0.3, "cm")), size = 1, color = my_pal) +
annotate("text", x = clust_lr - 0.10, y = max_y * 0.9, label = clust_name, fontface = "plain", angle = 90, color = my_pal) +
annotate("text", x = clust_lr + 0.12, y = max_y * 0.9, label = sprintf("%.3f", clust_lr), fontface = "plain", angle = 90, color = my_pal) +
theme_minimal() +
scale_fill_brewer(palette = "Set1") +
labs(title = NULL,
x = "log2(B/A)",
y = "頻度",
fill = "パターン") +
# 凡例の位置調整
theme(
legend.position = c(0.99, 0.99), # 右上(x=0.95, y=0.95)に配置
legend.justification = c("right", "top"), # 凡例の右上角を基準点にする
legend.background = element_rect(fill = "white", color = "black", linewidth = 0.3) # 凡例に枠線を付与
)

W4 クラスタごとのヒストグラム
W4.1 K = 3
W2.4のスクリプトをベースとして入力ファイルを変更しただけです。入力ファイルは、W2.3実行結果として得たJSLAB28_res.csvとJSLAB28_K3centers.csvです。
# データの読み込み
df <- read.csv("JSLAB28_res.csv")
tmp <- read.csv("JSLAB28_K3centers.csv")
clust_name <- tmp$cluster_name
clust_lr <- tmp$logratio
max_y <- 700
# --- 色の設定 ---
# ヒストグラムで使う "Set1" パレットから、クラスター数(4つ)分の色を抽出
# Set1の順番は、通常 ggplot の fill と一致します
my_pal <- brewer.pal(nrow(tmp), "Set1")
# ヒストグラムの作成
ggplot(df, aes(x = logratio, fill = K3)) +
geom_histogram(binwidth = 0.1, alpha = 0.6, position = "identity") +
# x軸の範囲を -4 から 4 に指定
coord_cartesian(xlim = c(-4, 4), ylim = c(0, max_y)) +
# クラスタ中心情報の追加
annotate("segment", x = clust_lr, xend = clust_lr, y = max_y * 0.82, yend = max_y * 0.77,
arrow = arrow(length = unit(0.3, "cm")), size = 1, color = my_pal) +
annotate("text", x = clust_lr - 0.10, y = max_y * 0.93, label = clust_name, fontface = "plain", angle = 90, color = my_pal) +
annotate("text", x = clust_lr + 0.10, y = max_y * 0.93, label = sprintf("%.3f", clust_lr), fontface = "plain", angle = 90, color = my_pal) +
theme_minimal() +
scale_fill_brewer(palette = "Set1") +
labs(title = NULL,
x = "log2(B/A)",
y = "頻度",
fill = "クラスタ") +
# 凡例の位置調整
theme(
legend.position = c(0.99, 0.99), # 右上(x=0.95, y=0.95)に配置
legend.justification = c("right", "top"), # 凡例の右上角を基準点にする
legend.background = element_rect(fill = "white", color = "black", linewidth = 0.3) # 凡例に枠線を付与
)

W4.2 K = 4
入力ファイルは、W2.3実行結果として得たJSLAB28_res.csvとJSLAB28_K4centers.csvです。
# データの読み込み
df <- read.csv("JSLAB28_res.csv")
tmp <- read.csv("JSLAB28_K4centers.csv")
clust_name <- tmp$cluster_name
clust_lr <- tmp$logratio
max_y <- 700
# --- 色の設定 ---
# ヒストグラムで使う "Set1" パレットから、クラスター数(4つ)分の色を抽出
# Set1の順番は、通常 ggplot の fill と一致します
my_pal <- brewer.pal(nrow(tmp), "Set1")
# ヒストグラムの作成
ggplot(df, aes(x = logratio, fill = K4)) +
geom_histogram(binwidth = 0.1, alpha = 0.6, position = "identity") +
# x軸の範囲を -4 から 4 に指定
coord_cartesian(xlim = c(-4, 4), ylim = c(0, max_y)) +
# クラスタ中心情報の追加
annotate("segment", x = clust_lr, xend = clust_lr, y = max_y * 0.82, yend = max_y * 0.77,
arrow = arrow(length = unit(0.3, "cm")), size = 1, color = my_pal) +
annotate("text", x = clust_lr - 0.10, y = max_y * 0.93, label = clust_name, fontface = "plain", angle = 90, color = my_pal) +
annotate("text", x = clust_lr + 0.10, y = max_y * 0.93, label = sprintf("%.3f", clust_lr), fontface = "plain", angle = 90, color = my_pal) +
theme_minimal() +
scale_fill_brewer(palette = "Set1") +
labs(title = NULL,
x = "log2(B/A)",
y = "頻度",
fill = "クラスタ") +
# 凡例の位置調整
theme(
legend.position = c(0.99, 0.99), # 右上(x=0.95, y=0.95)に配置
legend.justification = c("right", "top"), # 凡例の右上角を基準点にする
legend.background = element_rect(fill = "white", color = "black", linewidth = 0.3) # 凡例に枠線を付与
)

W4.3 K = 5
入力ファイルは、W2.3実行結果として得たJSLAB28_res.csvとJSLAB28_K5centers.csvです。
# データの読み込み
df <- read.csv("JSLAB28_res.csv")
tmp <- read.csv("JSLAB28_K5centers.csv")
clust_name <- tmp$cluster_name
clust_lr <- tmp$logratio
max_y <- 700
# --- 色の設定 ---
# ヒストグラムで使う "Set1" パレットから、クラスター数(4つ)分の色を抽出
# Set1の順番は、通常 ggplot の fill と一致します
my_pal <- brewer.pal(nrow(tmp), "Set1")
# ヒストグラムの作成
ggplot(df, aes(x = logratio, fill = K5)) +
geom_histogram(binwidth = 0.1, alpha = 0.6, position = "identity") +
# x軸の範囲を -4 から 4 に指定
coord_cartesian(xlim = c(-4, 4), ylim = c(0, max_y)) +
# クラスタ中心情報の追加
annotate("segment", x = clust_lr, xend = clust_lr, y = max_y * 0.82, yend = max_y * 0.77,
arrow = arrow(length = unit(0.3, "cm")), size = 1, color = my_pal) +
annotate("text", x = clust_lr - 0.10, y = max_y * 0.93, label = clust_name, fontface = "plain", angle = 90, color = my_pal) +
annotate("text", x = clust_lr + 0.10, y = max_y * 0.93, label = sprintf("%.3f", clust_lr), fontface = "plain", angle = 90, color = my_pal) +
theme_minimal() +
scale_fill_brewer(palette = "Set1") +
labs(title = NULL,
x = "log2(B/A)",
y = "頻度",
fill = "クラスタ") +
# 凡例の位置調整
theme(
legend.position = c(0.99, 0.99), # 右上(x=0.95, y=0.95)に配置
legend.justification = c("right", "top"), # 凡例の右上角を基準点にする
legend.background = element_rect(fill = "white", color = "black", linewidth = 0.3) # 凡例に枠線を付与
)

W4.4 log比が-1から1の範囲の状況
以下で定義する関数は、生成AIの1つであるGeminiにJSLAB28_res.csvを与えたのち、「このファイルを読み込んで、logratio列が-1から1の範囲にある行を抜き出し、K3,
K4,
K5列に対してRのtable関数を実行するスクリプトを教えて。」という指令(プロンプト)を出して得た結果を簡潔にしたものです。いずれの列においても、条件を満たす計4273遺伝子中4271個がcluster3に割り当てられていることが分かります。
# 1. ファイルの読み込み
# CSVの1列目が遺伝子名(行名)のようなので row.names = 1 を指定しています
data <- read.csv("JSLAB28_res.csv", row.names = 1)
# 2. logratioが -1 から 1 の範囲にある行を抽出
# ※ Inf や -Inf を除外するために有限値判定を入れるのが一般的です
filtered_data <- subset(data, logratio >= -1 & logratio <= 1)
# 3. K3, K4, K5列に対して table 関数を実行
lapply(filtered_data[, c("K3", "K4", "K5")], table)
$K3
cluster1 cluster2 cluster3
1 1 4271
$K4
cluster1 cluster2 cluster3
1 1 4271
$K5
cluster2 cluster3 cluster5
1 4271 1
W5 サンキー図
W5.1 昇順(図4a)
入力ファイルはJSLAB28_res.csvです。
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "ascending" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupはnode列、fillはstage列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W5.2 降順(図4b)
入力ファイルはJSLAB28_res.csvです。
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "descending" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W5.3 クロス集計表
サンキー図中のK3とK4、およびK4とK5間のクロス集計表を得るためのスクリプトです。
入力ファイルはJSLAB28_res.csv、出力ファイルはJSLAB28_K3_K4.csvとJSLAB28_K4_K5.csvです。
in_f <- "JSLAB28_res.csv" # 入力ファイル名
# K3とK4間のクロス集計表
hoge <- table(df$K3, df$K4) # K3列とK4列のクロス集計表
Total <- colSums(hoge) # 列ごとのトータル情報の取得
hoge <- rbind(hoge, Total) # トータル情報を最下行で連結
Total <- rowSums(hoge) # 行ごとのトータル情報の取得
hoge <- cbind(hoge, Total) # トータル情報を最右列で連結
tmp <- cbind(rownames(hoge), hoge) # 行名情報を追加
write.csv(tmp, "JSLAB28_K3_K4.csv", row.names=F) # ファイル出力
# K4とK5間のクロス集計表
hoge <- table(df$K4, df$K5) # K4列とK5列のクロス集計表
Total <- colSums(hoge) # 列ごとのトータル情報の取得
hoge <- rbind(hoge, Total) # トータル情報を最下行で連結
Total <- rowSums(hoge) # 行ごとのトータル情報の取得
hoge <- cbind(hoge, Total) # トータル情報を最右列で連結
tmp <- cbind(rownames(hoge), hoge) # 行名情報を追加
write.csv(tmp, "JSLAB28_K4_K5.csv", row.names=F) # ファイル出力
W5.4 出現順(図5a)
入力ファイルはJSLAB28_res.csvです。
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "as_is" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W5.5 ファイルの冒頭部分を表示
入力ファイル(JSLAB28_res.csv)を読み込んで、最初の15行分を表示させているだけです。
in_f <- "JSLAB28_res.csv" # 入力ファイル名
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 最初の15行分を表示
head(data, n = 15) # head関数の実行
# A tibble: 15 × 7
...1 Truth logratio K3 K4 K5 Frequency
<chr> <chr> <dbl> <chr> <chr> <chr> <dbl>
1 gene_1 DEG_A -2.03 cluster1 cluster2 cluster5 1
2 gene_2 DEG_A -2.27 cluster1 cluster4 cluster1 1
3 gene_3 DEG_A -1.68 cluster1 cluster2 cluster5 1
4 gene_4 DEG_A -3 cluster1 cluster3 cluster3 1
5 gene_5 DEG_A -2.89 cluster1 cluster4 cluster1 1
6 gene_6 DEG_A -2.50 cluster1 cluster2 cluster5 1
7 gene_7 DEG_A -2.18 cluster1 cluster2 cluster5 1
8 gene_8 DEG_A -4.94 cluster1 cluster4 cluster1 1
9 gene_9 DEG_A -2.58 cluster1 cluster4 cluster1 1
10 gene_10 DEG_A -1.90 cluster1 cluster2 cluster5 1
11 gene_11 DEG_A -0.499 cluster3 cluster3 cluster3 1
12 gene_12 DEG_A -2.37 cluster1 cluster2 cluster5 1
13 gene_13 DEG_A -0.542 cluster3 cluster3 cluster3 1
14 gene_14 DEG_A -3.21 cluster1 cluster4 cluster1 1
15 gene_15 DEG_A -3.17 cluster1 cluster2 cluster5 1
W5.6 出現順(図5b)
入力ファイルをはJSLAB28_res.csvから、JSLAB28_res2.csvに変えただけです。これは、Truth列が最初にDEG_Bとなるgene_2501の行をヘッダー行とgene_1の間に移動させただけです。
in_f <- "JSLAB28_res2.csv" # 入力ファイル名
param_order <- "as_is" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6 サンキー図の不具合例
W6.1 出現順(縦5×横5インチ;図6a)
入力ファイルはJSLAB28_res.csvです。基本的にW5.4と同じですが、最終の作図段階において、横幅と縦幅をともに5インチしています。htmlを見る限りでは、W5.4(図5a)のスクリプトと同一ですが、このhtml作成時に利用しているRmdファイルの中にRチャンクオプションとして「fig.width=5,
fig.height=5」が追加されています。
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "as_is" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.2 出現順(縦5×横5インチ;図6b)
入力ファイルは、JSLAB28_res2.csvです。基本的にW5.6と同じですが、最終の作図段階において、横幅と縦幅をともに5インチしています。htmlを見る限りでは、W5.6(図5b)のスクリプトと同一ですが、このhtml作成時に利用しているRmdファイルの中にRチャンクオプションとして「fig.width=5,
fig.height=5」が追加されています。
in_f <- "JSLAB28_res2.csv" # 入力ファイル名
param_order <- "as_is" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.3 出現順(縦8×横8インチ)
入力ファイルはJSLAB28_res.csvです。基本的にW6.1と同じですが、最終の作図段階において、横幅と縦幅をともに8インチしています。htmlを見る限りでは、W6.1(図6a)のスクリプトと同一ですが、このhtml作成時に利用しているRmdファイルの中にRチャンクオプションとして「fig.width=8,
fig.height=8」が追加されています。
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "as_is" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.4 出現順(縦8×横8インチ)
入力ファイルは、JSLAB28_res2.csvです。基本的にW6.2と同じですが、最終の作図段階において、横幅と縦幅をともに8インチしています。htmlを見る限りでは、W6.2(図6b)のスクリプトと同一ですが、このhtml作成時に利用しているRmdファイルの中にRチャンクオプションとして「fig.width=8,
fig.height=8」が追加されています。
in_f <- "JSLAB28_res2.csv" # 入力ファイル名
param_order <- "as_is" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.5 昇順(縦5×横5インチ)
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "ascending" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.6 昇順(縦8×横8インチ)
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "ascending" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.7 降順(縦5×横5インチ)
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "descending" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.8 降順(縦8×横8インチ)
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "descending" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.9 出現順(縦5×横7インチ)
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "as_is" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.10 昇順(縦7×横5インチ)
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "ascending" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.11 昇順(縦9×横5インチ)
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "ascending" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

---
title: "[第28回](https://www.iu.a.u-tokyo.ac.jp/kadota/r_seq2.html#book_JSLAB_28)のウェブ資料"
date: '最終更新: `r format(Sys.Date(), "%Y/%m/%d")`'
output: 
  html_document:
    toc: TRUE
    toc_float: TRUE
    code_download: TRUE
---
```{r klippy, echo=FALSE, include=TRUE}
klippy::klippy()
```

# W1 はじめに
## W1.1 パッケージのインストール
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=FALSE, comment=""}
if (!require("BiocManager", quietly = TRUE))     # BiocManagerパッケージがインストールされてなければ...
    install.packages("BiocManager")              # BiocManagerをインストールせよ
BiocManager::install("TCC", update=F)            # パッケージのインストール
BiocManager::install("tidyverse", update=F)      # パッケージのインストール
BiocManager::install("ggsankeyfier", update=F)   # パッケージのインストール
install.packages("https://cran.r-project.org/src/contrib/Archive/MBCluster.Seq/MBCluster.Seq_1.0.tar.gz", repos=NULL, type="source")  # パッケージのインストール
```

## W1.2 パッケージのロード
```{r, message=FALSE, error=TRUE, warning=FALSE, comment=""}

library(TCC)                                     # パッケージのロード
library(MBCluster.Seq)                           # パッケージのロード
library(tidyverse)                               # パッケージのロード
library(ggsankeyfier)                            # パッケージのロード
library(stringr)                                 # パッケージのロード
library(dplyr)                                   # パッケージのロード
library(ggplot2)                                 # パッケージのロード
library(reshape2)                                # パッケージのロード
library(RColorBrewer)                            # パッケージのロード
```

# W2 解析データ

## W2.1  シミュレーションデータの作成
```{r, message=FALSE, error=TRUE, warning=FALSE, comment="", fig.width=5}
nA <- 3                                          # A群の反復数（サンプル数）
nB <- 3                                          # B群の反復数（サンプル数）
G <- 10000                                       # 遺伝子数
PDEG <- 0.5                                      # DEGの割合
PA <- 0.5                                        # A群で高発現DEGの割合
FC <- 4                                          # 発現変動の度合い（倍率変化）

# 必要なパッケージのロードや前処理
library(TCC)                                     # パッケージのロード
PB <- (1 - PA)                                   # B群で高発現DEGの割合はPAが決まれば自動的に定まる
set.seed(1050)                                   # 乱数種の指定

# シミュレーションデータ生成本番
tcc <- simulateReadCounts(Ngene = G,             # 遺伝子数指定部分
             PDEG = PDEG,                        # DEGの割合指定部分
             DEG.assign = c(PA, PB),             # 群ごとの高発現DEGの割合
             replicates = c(nA, nB),             # 群ごとの反復数
             DEG.foldchange = c(FC, FC))         # 群ごとのDEGの倍率変化

truth <- as.numeric(tcc$simulation$trueDEG != 0) # 真のDEGの位置を1、non-DEGの位置を0としたベクトルを作成
Truth <- truth                                   # コピー
Truth[1:(G*PDEG*PA)] <- "DEG_A"                  # DEG_Aパターンの位置
Truth[(G*PDEG*PA+1):(G*PDEG)] <- "DEG_B"         # DEG_Bパターンの位置
Truth[Truth == 0] <- "non-DEG"                   # non-DEGパターンの位置
data <- tcc$count                                # カウント情報
data.cl <- tcc$group$group                       # 群ラベル情報
plotFCPseudocolor(tcc)                           # シミュレーション条件のpseudo-colorイメージを描画

# 出力
colnames(data) <- c(paste("A", 1:nA, sep=""), paste("B", 1:nB, sep=""))
tmp <- cbind(rownames(data), data)
out_f <- paste("JSLAB28_data.csv", sep="")
write.csv(tmp, out_f, row.names=F)
```

## W2.2 log比の計算
以下の`data`オブジェクトに対応する元データファイルは、[JSLAB28_data.csv](JSLAB28_data.csv)です。出力ファイルは、[JSLAB28_truth.csv](JSLAB28_truth.csv)です。
```{r, message=FALSE, error=TRUE, warning=FALSE, comment="", fig.width=5}
x <- data                                        # コピー
cl <- data.cl                                    # コピー
meanA <- apply(x[, cl == 1], 1, FUN = mean)      # A群の平均の計算
meanB <- apply(x[, cl == 2], 1, FUN = mean)      # B群の平均の計算
logratio <- log2(meanB/meanA)                    # log比の計算

# パターンごとのlog比の要約統計量
summary(logratio[Truth == "DEG_A"])              # DEG_Aのlog比の要約統計量
summary(logratio[Truth == "DEG_B"])              # DEG_Bのlog比の要約統計量
summary(logratio[Truth == "non-DEG"])            # non-DEGのlog比の要約統計量

# 出力
med_DEG_A <- median(logratio[Truth == "DEG_A"], na.rm = TRUE) # DEG_Aのlog比の中央値
med_DEG_B <- median(logratio[Truth == "DEG_B"], na.rm = TRUE) # DEG_Bのlog比の中央値
med_nonDEG <- median(logratio[Truth == "non-DEG"], na.rm = TRUE)# non-DEGのlog比の中央値

tmp <- NULL
tmp <- rbind(tmp, c("DEG_A", med_DEG_A))
tmp <- rbind(tmp, c("DEG_B", med_DEG_B))
tmp <- rbind(tmp, c("non-DEG", med_nonDEG))

colnames(tmp) <- c("cluster_name", "logratio")
write.csv(tmp, "JSLAB28_truth.csv", row.names=F)
```

## W2.3 MBCluster.Seqの実行
出力ファイルは、図1の右上部分に相当する[JSLAB28_res.csv](JSLAB28_res.csv)、K = 3～5のクラスタ中心のlog比情報を格納した[JSLAB28_K3centers.csv](JSLAB28_K3centers.csv)、[JSLAB28_K4centers.csv](JSLAB28_K4centers.csv)、[JSLAB28_K5centers.csv](JSLAB28_K5centers.csv)です。
```{r, message=FALSE, error=TRUE, warning=FALSE, comment="", eval=FALSE}
library(MBCluster.Seq)                           # パッケージのロード
set.seed(1000)

# MBCluster.Seqの実行（K = 3）
K <- 3                                           # クラスタ数
mbc <- RNASeq.Data(data, Normalizer = NULL,
                   Treatment = data.cl, GeneID = rownames(data))
c0 <- KmeansPlus.RNASeq(data = mbc, nK = K,
                        model = "nbinom", print.steps = F)
cls <- Cluster.RNASeq(data = mbc, model = "nbinom",
                      centers = c0$centers, method = "EM")
cluster <- cls$cluster                           # オブジェクト名の変更（クラスタ番号情報）
centers <- cls$centers                           # オブジェクト名の変更（クラスタ中心情報）

# 後処理と結果の大まかな確認
centers                                          # クラスタ中心の発現パターン（log(B群/A群)）
table(cluster)                                   # クラスタごとに含まれる遺伝子数
K3 <- str_c("cluster", cluster)                  # クラスタ番号の左側に文字列"cluster"を連結
K3_centers <- log2(exp(2 * centers[,2]))         # クラスタ中心のlog2(B/A)情報

# MBCluster.Seqの実行（K = 4）
K <- 4                                           # クラスタ数
mbc <- RNASeq.Data(data, Normalizer = NULL,
                   Treatment = data.cl, GeneID = rownames(data))
c0 <- KmeansPlus.RNASeq(data = mbc, nK = K,
                        model = "nbinom", print.steps = F)
cls <- Cluster.RNASeq(data = mbc, model = "nbinom",
                      centers = c0$centers, method = "EM")
cluster <- cls$cluster                           # オブジェクト名の変更（クラスタ番号情報）
centers <- cls$centers                           # オブジェクト名の変更（クラスタ中心情報）

# 後処理と結果の大まかな確認
centers                                          # クラスタ中心の発現パターン（log(B群/A群)）
table(cluster)                                   # クラスタごとに含まれる遺伝子数
K4 <- str_c("cluster", cluster)                  # クラスタ番号の左側に文字列"cluster"を連結
K4_centers <- log2(exp(2 * centers[,2]))         # クラスタ中心のlog2(B/A)情報

# MBCluster.Seqの実行（K = 5）
K <- 5                                           # クラスタ数
mbc <- RNASeq.Data(data, Normalizer = NULL,
                   Treatment = data.cl, GeneID = rownames(data))
c0 <- KmeansPlus.RNASeq(data = mbc, nK = K,
                        model = "nbinom", print.steps = F)
cls <- Cluster.RNASeq(data = mbc, model = "nbinom",
                      centers = c0$centers, method = "EM")
cluster <- cls$cluster                           # オブジェクト名の変更（クラスタ番号情報）
centers <- cls$centers                           # オブジェクト名の変更（クラスタ中心情報）

# 後処理と結果の大まかな確認
centers                                          # クラスタ中心の発現パターン（log(B群/A群)）
table(cluster)                                   # クラスタごとに含まれる遺伝子数
K5 <- str_c("cluster", cluster)                  # クラスタ番号の左側に文字列"cluster"を連結
K5_centers <- log2(exp(2 * centers[,2]))         # クラスタ中心のlog2(B/A)情報

# 出力
Frequency <- rep(1, length(Truth))
tmp <- cbind(rownames(data), Truth, logratio, K3, K4, K5, Frequency)
out_f <- paste("JSLAB28_res.csv", sep="")
write.csv(tmp, out_f, row.names=F)

tmp <- cbind(str_c("cluster", 1:3), K3_centers)
colnames(tmp) <- c("cluster_name", "logratio")
write.csv(tmp, "JSLAB28_K3centers.csv", row.names=F)

tmp <- cbind(str_c("cluster", 1:4), K4_centers)
colnames(tmp) <- c("cluster_name", "logratio")
write.csv(tmp, "JSLAB28_K4centers.csv", row.names=F)

tmp <- cbind(str_c("cluster", 1:5), K5_centers)
colnames(tmp) <- c("cluster_name", "logratio")
write.csv(tmp, "JSLAB28_K5centers.csv", row.names=F)
```

## W2.4 ヒストグラム（図1下部）
入力ファイルは、[JSLAB28_res.csv](JSLAB28_res.csv)と[JSLAB28_truth.csv](JSLAB28_truth.csv)です。以下のスクリプトは、生成AIの1つである[Gemini](https://gemini.google.com/app)に入力ファイルを与えたのち、「<font color="magenta">[JSLAB28_res.csv](JSLAB28_res.csv)のTruth列とlogratio列を読み込んで、logratio列のヒストグラムをTruth列のカテゴリごとに色分けしてggplot2で描画するRのスクリプトを教えて。また、[JSLAB28_truth.csv](JSLAB28_truth.csv)を読み込んでヒストグラムの上部に、横軸上がlogratio列の数値の位置に下向き矢印を追加し、さらにそのすぐ上にcluster_name列の文字列とlogratio列の数値情報も小数点以下3桁で示して。</font>」
のような指令（プロンプト）を出して得た結果を簡潔にしたものです。
```{r, message=FALSE, error=TRUE, warning=FALSE, comment="", fig.width=7, fig.height=4}
# データの読み込み
df <- read.csv("JSLAB28_res.csv")
tmp <- read.csv("JSLAB28_truth.csv")
clust_name <- tmp$cluster_name
clust_lr <- tmp$logratio
max_y <- 700

# --- 色の設定 ---
# ヒストグラムで使う "Set1" パレットから、クラスター数（4つ）分の色を抽出
# Set1の順番は、通常 ggplot の fill と一致します
my_pal <- brewer.pal(nrow(tmp), "Set1")

# ヒストグラムの作成
ggplot(df, aes(x = logratio, fill = Truth)) +
  geom_histogram(binwidth = 0.1, alpha = 0.6, position = "identity") +
  # x軸の範囲を -4 から 4 に指定
  coord_cartesian(xlim = c(-4, 4), ylim = c(0, max_y)) +
  
  # クラスタ中心情報の追加
  annotate("segment", x = clust_lr, xend = clust_lr, y = max_y * 0.78, yend = max_y * 0.72,
           arrow = arrow(length = unit(0.3, "cm")), size = 1, color = my_pal) +
  annotate("text", x = clust_lr - 0.10, y = max_y * 0.9, label = clust_name, fontface = "plain", angle = 90, color = my_pal) +
  annotate("text", x = clust_lr + 0.12, y = max_y * 0.9, label = sprintf("%.3f", clust_lr), fontface = "plain", angle = 90, color = my_pal) +
  
  theme_minimal() +
  scale_fill_brewer(palette = "Set1") +
  labs(title = NULL,
       x = "log2(B/A)",
       y = "頻度",
       fill = "パターン") +
  # 凡例の位置調整
  theme(
    legend.position = c(0.99, 0.99),      # 右上(x=0.95, y=0.95)に配置
    legend.justification = c("right", "top"), # 凡例の右上角を基準点にする
    legend.background = element_rect(fill = "white", color = "black", linewidth = 0.3) # 凡例に枠線を付与
  )
```

# W3 クロス集計表
入力ファイルは[JSLAB28_res.csv](JSLAB28_res.csv)、出力ファイルは[JSLAB28_Fig2a.csv](JSLAB28_Fig2a.csv)と[JSLAB28_Fig2b.csv](JSLAB28_Fig2b.csv)と[JSLAB28_Fig2c.csv](JSLAB28_Fig2c.csv)です。
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=TRUE, comment="", results=TRUE}
in_f <- "JSLAB28_res.csv"                        # 入力ファイル名

# 図2aの作成（K = 3でのクラスタリング結果のクロス集計表）
hoge <- table(df$Truth, df$K3)                   # Truth列とK3列のクロス集計表
Total <- colSums(hoge)                           # 列ごとのトータル情報の取得
hoge <- rbind(hoge, Total)                       # トータル情報を最下行で連結
Total <- rowSums(hoge)                           # 行ごとのトータル情報の取得
hoge <- cbind(hoge, Total)                       # トータル情報を最右列で連結
tmp <- cbind(rownames(hoge), hoge)               # 行名情報を追加
write.csv(tmp, "JSLAB28_Fig2a.csv", row.names=F) # ファイル出力

# 図2bの作成（K = 4でのクラスタリング結果のクロス集計表）
hoge <- table(df$Truth, df$K4)                   # Truth列とK4列のクロス集計表
Total <- colSums(hoge)                           # 列ごとのトータル情報の取得
hoge <- rbind(hoge, Total)                       # トータル情報を最下行で連結
Total <- rowSums(hoge)                           # 行ごとのトータル情報の取得
hoge <- cbind(hoge, Total)                       # トータル情報を最右列で連結
tmp <- cbind(rownames(hoge), hoge)               # 行名情報を追加
write.csv(tmp, "JSLAB28_Fig2b.csv", row.names=F) # ファイル出力

# 図2cの作成（K = 5でのクラスタリング結果のクロス集計表）
hoge <- table(df$Truth, df$K5)                   # Truth列とK5列のクロス集計表
Total <- colSums(hoge)                           # 列ごとのトータル情報の取得
hoge <- rbind(hoge, Total)                       # トータル情報を最下行で連結
Total <- rowSums(hoge)                           # 行ごとのトータル情報の取得
hoge <- cbind(hoge, Total)                       # トータル情報を最右列で連結
tmp <- cbind(rownames(hoge), hoge)               # 行名情報を追加
write.csv(tmp, "JSLAB28_Fig2c.csv", row.names=F) # ファイル出力
```

# W4 クラスタごとのヒストグラム

## W4.1 K = 3
W2.4のスクリプトをベースとして入力ファイルを変更しただけです。入力ファイルは、W2.3実行結果として得た[JSLAB28_res.csv](JSLAB28_res.csv)と[JSLAB28_K3centers.csv](JSLAB28_K3centers.csv)です。
```{r, message=FALSE, error=TRUE, warning=FALSE, comment="", fig.width=7, fig.height=3.5}
# データの読み込み
df <- read.csv("JSLAB28_res.csv")
tmp <- read.csv("JSLAB28_K3centers.csv")
clust_name <- tmp$cluster_name
clust_lr <- tmp$logratio
max_y <- 700

# --- 色の設定 ---
# ヒストグラムで使う "Set1" パレットから、クラスター数（4つ）分の色を抽出
# Set1の順番は、通常 ggplot の fill と一致します
my_pal <- brewer.pal(nrow(tmp), "Set1")

# ヒストグラムの作成
ggplot(df, aes(x = logratio, fill = K3)) +
  geom_histogram(binwidth = 0.1, alpha = 0.6, position = "identity") +
  # x軸の範囲を -4 から 4 に指定
  coord_cartesian(xlim = c(-4, 4), ylim = c(0, max_y)) +
  
  # クラスタ中心情報の追加
  annotate("segment", x = clust_lr, xend = clust_lr, y = max_y * 0.82, yend = max_y * 0.77,
           arrow = arrow(length = unit(0.3, "cm")), size = 1, color = my_pal) +
  annotate("text", x = clust_lr - 0.10, y = max_y * 0.93, label = clust_name, fontface = "plain", angle = 90, color = my_pal) +
  annotate("text", x = clust_lr + 0.10, y = max_y * 0.93, label = sprintf("%.3f", clust_lr), fontface = "plain", angle = 90, color = my_pal) +
  
  theme_minimal() +
  scale_fill_brewer(palette = "Set1") +
  labs(title = NULL,
       x = "log2(B/A)",
       y = "頻度",
       fill = "クラスタ") +
  # 凡例の位置調整
  theme(
    legend.position = c(0.99, 0.99),      # 右上(x=0.95, y=0.95)に配置
    legend.justification = c("right", "top"), # 凡例の右上角を基準点にする
    legend.background = element_rect(fill = "white", color = "black", linewidth = 0.3) # 凡例に枠線を付与
  )
```

## W4.2 K = 4
入力ファイルは、W2.3実行結果として得た[JSLAB28_res.csv](JSLAB28_res.csv)と[JSLAB28_K4centers.csv](JSLAB28_K4centers.csv)です。
```{r, message=FALSE, error=TRUE, warning=FALSE, comment="", fig.width=7, fig.height=3.5}
# データの読み込み
df <- read.csv("JSLAB28_res.csv")
tmp <- read.csv("JSLAB28_K4centers.csv")
clust_name <- tmp$cluster_name
clust_lr <- tmp$logratio
max_y <- 700

# --- 色の設定 ---
# ヒストグラムで使う "Set1" パレットから、クラスター数（4つ）分の色を抽出
# Set1の順番は、通常 ggplot の fill と一致します
my_pal <- brewer.pal(nrow(tmp), "Set1")

# ヒストグラムの作成
ggplot(df, aes(x = logratio, fill = K4)) +
  geom_histogram(binwidth = 0.1, alpha = 0.6, position = "identity") +
  # x軸の範囲を -4 から 4 に指定
  coord_cartesian(xlim = c(-4, 4), ylim = c(0, max_y)) +
  
  # クラスタ中心情報の追加
  annotate("segment", x = clust_lr, xend = clust_lr, y = max_y * 0.82, yend = max_y * 0.77,
           arrow = arrow(length = unit(0.3, "cm")), size = 1, color = my_pal) +
  annotate("text", x = clust_lr - 0.10, y = max_y * 0.93, label = clust_name, fontface = "plain", angle = 90, color = my_pal) +
  annotate("text", x = clust_lr + 0.10, y = max_y * 0.93, label = sprintf("%.3f", clust_lr), fontface = "plain", angle = 90, color = my_pal) +
  
  theme_minimal() +
  scale_fill_brewer(palette = "Set1") +
  labs(title = NULL,
       x = "log2(B/A)",
       y = "頻度",
       fill = "クラスタ") +
  # 凡例の位置調整
  theme(
    legend.position = c(0.99, 0.99),      # 右上(x=0.95, y=0.95)に配置
    legend.justification = c("right", "top"), # 凡例の右上角を基準点にする
    legend.background = element_rect(fill = "white", color = "black", linewidth = 0.3) # 凡例に枠線を付与
  )
```

## W4.3 K = 5
入力ファイルは、W2.3実行結果として得た[JSLAB28_res.csv](JSLAB28_res.csv)と[JSLAB28_K5centers.csv](JSLAB28_K5centers.csv)です。
```{r, message=FALSE, error=TRUE, warning=FALSE, comment="", fig.width=7, fig.height=3.5}
# データの読み込み
df <- read.csv("JSLAB28_res.csv")
tmp <- read.csv("JSLAB28_K5centers.csv")
clust_name <- tmp$cluster_name
clust_lr <- tmp$logratio
max_y <- 700

# --- 色の設定 ---
# ヒストグラムで使う "Set1" パレットから、クラスター数（4つ）分の色を抽出
# Set1の順番は、通常 ggplot の fill と一致します
my_pal <- brewer.pal(nrow(tmp), "Set1")

# ヒストグラムの作成
ggplot(df, aes(x = logratio, fill = K5)) +
  geom_histogram(binwidth = 0.1, alpha = 0.6, position = "identity") +
  # x軸の範囲を -4 から 4 に指定
  coord_cartesian(xlim = c(-4, 4), ylim = c(0, max_y)) +
  
  # クラスタ中心情報の追加
  annotate("segment", x = clust_lr, xend = clust_lr, y = max_y * 0.82, yend = max_y * 0.77,
           arrow = arrow(length = unit(0.3, "cm")), size = 1, color = my_pal) +
  annotate("text", x = clust_lr - 0.10, y = max_y * 0.93, label = clust_name, fontface = "plain", angle = 90, color = my_pal) +
  annotate("text", x = clust_lr + 0.10, y = max_y * 0.93, label = sprintf("%.3f", clust_lr), fontface = "plain", angle = 90, color = my_pal) +
  
  theme_minimal() +
  scale_fill_brewer(palette = "Set1") +
  labs(title = NULL,
       x = "log2(B/A)",
       y = "頻度",
       fill = "クラスタ") +
  # 凡例の位置調整
  theme(
    legend.position = c(0.99, 0.99),      # 右上(x=0.95, y=0.95)に配置
    legend.justification = c("right", "top"), # 凡例の右上角を基準点にする
    legend.background = element_rect(fill = "white", color = "black", linewidth = 0.3) # 凡例に枠線を付与
  )
```

## W4.4 log比が-1から1の範囲の状況
以下で定義する関数は、生成AIの1つである[Gemini](https://gemini.google.com/app)に[JSLAB28_res.csv](JSLAB28_res.csv)を与えたのち、「<font color="magenta">このファイルを読み込んで、logratio列が-1から1の範囲にある行を抜き出し、K3, K4, K5列に対してRのtable関数を実行するスクリプトを教えて。</font>」という指令（プロンプト）を出して得た結果を簡潔にしたものです。いずれの列においても、条件を満たす計4273遺伝子中4271個がcluster3に割り当てられていることが分かります。
```{r, message=FALSE, error=TRUE, warning=FALSE, comment=""}
# 1. ファイルの読み込み
# CSVの1列目が遺伝子名（行名）のようなので row.names = 1 を指定しています
data <- read.csv("JSLAB28_res.csv", row.names = 1)

# 2. logratioが -1 から 1 の範囲にある行を抽出
# ※ Inf や -Inf を除外するために有限値判定を入れるのが一般的です
filtered_data <- subset(data, logratio >= -1 & logratio <= 1)

# 3. K3, K4, K5列に対して table 関数を実行
lapply(filtered_data[, c("K3", "K4", "K5")], table)
```

# W5 サンキー図

## W5.1 昇順（図4a）
入力ファイルは[JSLAB28_res.csv](JSLAB28_res.csv)です。
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=TRUE, comment="", results=TRUE}
in_f <- "JSLAB28_res.csv"                        # 入力ファイル名
param_order <- "ascending"                       # ノードの並び（デフォルトは"ascending"）

# 必要なパッケージをロード
library(tidyverse)                               # パッケージの読込
library(ggsankeyfier)                            # パッケージの読込

# 入力ファイルの読み込み
data <- read_csv(in_f)                           # in_fで指定したファイルの読込

# 前処理（描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer(                   # long型データへの変換
              data = data,                       # 入力はdataオブジェクト   
              stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
              values_from = "Frequency")         # 頻度をカウントしたい列名情報

# 作図1（サンキー図の基本形まで作成した結果をgに格納）
pos <- position_sankey(v_space = "auto",         # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                       order = param_order)      # ノード名情報描画時の位置情報（ノードの並び）
g <- ggplot(data = matome,                       # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
  mapping = aes(x = stage, y = Frequency,        # matomeのstage列とFreqency列をx軸とy軸として利用
                group = node, fill = node,       # groupはnode列、fillはstage列で行う（変更不要）
                edge_id = edge_id,               # edge_idはmatome内のedge_id列（変更不要）
                connector = connector)) +        # connectorはmatome内のconnector列（変更不要）
  geom_sankeynode(position = pos) +              # ノード情報を追加
  geom_sankeyedge(position = pos)                # エッジ情報を追加

# 作図2-1（ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成）
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です（nudgeは小突くという意味）
nudge_val_y <- sum(data$Frequency)*0.020         # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto",        # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # ノード名情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = nudge_val_y)   # ノード名情報描画時の位置情報（y軸情報の位置をnudge_val_y上にずらす）
pos2 <- position_sankey(v_space = "auto",        # 頻度情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # 頻度情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = -nudge_val_y)  # 頻度情報描画時の位置情報（y軸情報の位置をnudge_val_y下にずらす）

# 作図2-2（基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納）
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令（デフォルトは中央揃え）
# size = 4は、サイズ4にせよという指令（この値に応じてnudge_yも適宜調整する）
g2 <- g + 
      geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) + 
      geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)

# 作図3（g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納）
g3 <- g2 + theme_minimal() +                     # 背景を白に変更
      theme(panel.grid = element_blank(),        # グリッド線を消す
            legend.position = 'none',            # 凡例を消す
            axis.title = element_blank(),        # 軸のタイトルを消す
            axis.text.y = element_blank(),       # y軸のメモリ表示を消す
            axis.text.x = element_text(size = 15)) # x軸（カテゴリ名）はサイズ15にせよ
g3
```

## W5.2 降順（図4b）
入力ファイルは[JSLAB28_res.csv](JSLAB28_res.csv)です。
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=TRUE, comment="", results=TRUE}
in_f <- "JSLAB28_res.csv"                        # 入力ファイル名
param_order <- "descending"                      # ノードの並び（デフォルトは"ascending"）

# 必要なパッケージをロード
library(tidyverse)                               # パッケージの読込
library(ggsankeyfier)                            # パッケージの読込

# 入力ファイルの読み込み
data <- read_csv(in_f)                           # in_fで指定したファイルの読込

# 前処理（描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer(                   # long型データへの変換
              data = data,                       # 入力はdataオブジェクト   
              stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
              values_from = "Frequency")         # 頻度をカウントしたい列名情報

# 作図1（サンキー図の基本形まで作成した結果をgに格納）
pos <- position_sankey(v_space = "auto",         # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                       order = param_order)      # ノード名情報描画時の位置情報（ノードの並び）
g <- ggplot(data = matome,                       # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
  mapping = aes(x = stage, y = Frequency,        # matomeのstage列とFreqency列をx軸とy軸として利用
                group = node, fill = node,       # groupとfillは、matome内のnode列で行う（変更不要）
                edge_id = edge_id,               # edge_idはmatome内のedge_id列（変更不要）
                connector = connector)) +        # connectorはmatome内のconnector列（変更不要）
  geom_sankeynode(position = pos) +              # ノード情報を追加
  geom_sankeyedge(position = pos)                # エッジ情報を追加

# 作図2-1（ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成）
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です（nudgeは小突くという意味）
nudge_val_y <- sum(data$Frequency)*0.020         # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto",        # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # ノード名情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = nudge_val_y)   # ノード名情報描画時の位置情報（y軸情報の位置をnudge_val_y上にずらす）
pos2 <- position_sankey(v_space = "auto",        # 頻度情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # 頻度情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = -nudge_val_y)  # 頻度情報描画時の位置情報（y軸情報の位置をnudge_val_y下にずらす）

# 作図2-2（基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納）
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令（デフォルトは中央揃え）
# size = 4は、サイズ4にせよという指令（この値に応じてnudge_yも適宜調整する）
g2 <- g + 
      geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) + 
      geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)

# 作図3（g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納）
g3 <- g2 + theme_minimal() +                     # 背景を白に変更
      theme(panel.grid = element_blank(),        # グリッド線を消す
            legend.position = 'none',            # 凡例を消す
            axis.title = element_blank(),        # 軸のタイトルを消す
            axis.text.y = element_blank(),       # y軸のメモリ表示を消す
            axis.text.x = element_text(size = 15)) # x軸（カテゴリ名）はサイズ15にせよ
g3
```

## W5.3 クロス集計表
サンキー図中のK3とK4、およびK4とK5間のクロス集計表を得るためのスクリプトです。
入力ファイルは[JSLAB28_res.csv](JSLAB28_res.csv)、出力ファイルは[JSLAB28_K3_K4.csv](JSLAB28_K3_K4.csv)と[JSLAB28_K4_K5.csv](JSLAB28_K4_K5.csv)です。
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=TRUE, comment="", results=TRUE}
in_f <- "JSLAB28_res.csv"                        # 入力ファイル名

# K3とK4間のクロス集計表
hoge <- table(df$K3, df$K4)                      # K3列とK4列のクロス集計表
Total <- colSums(hoge)                           # 列ごとのトータル情報の取得
hoge <- rbind(hoge, Total)                       # トータル情報を最下行で連結
Total <- rowSums(hoge)                           # 行ごとのトータル情報の取得
hoge <- cbind(hoge, Total)                       # トータル情報を最右列で連結
tmp <- cbind(rownames(hoge), hoge)               # 行名情報を追加
write.csv(tmp, "JSLAB28_K3_K4.csv", row.names=F) # ファイル出力

# K4とK5間のクロス集計表
hoge <- table(df$K4, df$K5)                      # K4列とK5列のクロス集計表
Total <- colSums(hoge)                           # 列ごとのトータル情報の取得
hoge <- rbind(hoge, Total)                       # トータル情報を最下行で連結
Total <- rowSums(hoge)                           # 行ごとのトータル情報の取得
hoge <- cbind(hoge, Total)                       # トータル情報を最右列で連結
tmp <- cbind(rownames(hoge), hoge)               # 行名情報を追加
write.csv(tmp, "JSLAB28_K4_K5.csv", row.names=F) # ファイル出力
```

## W5.4 出現順（図5a）
入力ファイルは[JSLAB28_res.csv](JSLAB28_res.csv)です。
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=TRUE, comment="", results=TRUE}
in_f <- "JSLAB28_res.csv"                        # 入力ファイル名
param_order <- "as_is"                           # ノードの並び（デフォルトは"ascending"）

# 必要なパッケージをロード
library(tidyverse)                               # パッケージの読込
library(ggsankeyfier)                            # パッケージの読込

# 入力ファイルの読み込み
data <- read_csv(in_f)                           # in_fで指定したファイルの読込

# 前処理（描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer(                   # long型データへの変換
              data = data,                       # 入力はdataオブジェクト   
              stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
              values_from = "Frequency")         # 頻度をカウントしたい列名情報

# 作図1（サンキー図の基本形まで作成した結果をgに格納）
pos <- position_sankey(v_space = "auto",         # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                       order = param_order)      # ノード名情報描画時の位置情報（ノードの並び）
g <- ggplot(data = matome,                       # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
  mapping = aes(x = stage, y = Frequency,        # matomeのstage列とFreqency列をx軸とy軸として利用
                group = node, fill = node,       # groupとfillは、matome内のnode列で行う（変更不要）
                edge_id = edge_id,               # edge_idはmatome内のedge_id列（変更不要）
                connector = connector)) +        # connectorはmatome内のconnector列（変更不要）
  geom_sankeynode(position = pos) +              # ノード情報を追加
  geom_sankeyedge(position = pos)                # エッジ情報を追加

# 作図2-1（ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成）
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です（nudgeは小突くという意味）
nudge_val_y <- sum(data$Frequency)*0.020         # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto",        # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # ノード名情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = nudge_val_y)   # ノード名情報描画時の位置情報（y軸情報の位置をnudge_val_y上にずらす）
pos2 <- position_sankey(v_space = "auto",        # 頻度情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # 頻度情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = -nudge_val_y)  # 頻度情報描画時の位置情報（y軸情報の位置をnudge_val_y下にずらす）

# 作図2-2（基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納）
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令（デフォルトは中央揃え）
# size = 4は、サイズ4にせよという指令（この値に応じてnudge_yも適宜調整する）
g2 <- g + 
      geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) + 
      geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)

# 作図3（g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納）
g3 <- g2 + theme_minimal() +                     # 背景を白に変更
      theme(panel.grid = element_blank(),        # グリッド線を消す
            legend.position = 'none',            # 凡例を消す
            axis.title = element_blank(),        # 軸のタイトルを消す
            axis.text.y = element_blank(),       # y軸のメモリ表示を消す
            axis.text.x = element_text(size = 15)) # x軸（カテゴリ名）はサイズ15にせよ
g3
```

## W5.5 ファイルの冒頭部分を表示
入力ファイル（[JSLAB28_res.csv](JSLAB28_res.csv)）を読み込んで、最初の15行分を表示させているだけです。
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=TRUE, comment="", results=TRUE}
in_f <- "JSLAB28_res.csv"                        # 入力ファイル名

# 必要なパッケージをロード
library(tidyverse)                               # パッケージの読込

# 入力ファイルの読み込み
data <- read_csv(in_f)                           # in_fで指定したファイルの読込

# 最初の15行分を表示
head(data, n = 15)                               # head関数の実行
```

## W5.6 出現順（図5b）
入力ファイルをは[JSLAB28_res.csv](JSLAB28_res.csv)から、[JSLAB28_res2.csv](JSLAB28_res2.csv)に変えただけです。これは、Truth列が最初にDEG_Bとなるgene_2501の行をヘッダー行とgene_1の間に移動させただけです。
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=TRUE, comment="", results=TRUE}
in_f <- "JSLAB28_res2.csv"                       # 入力ファイル名
param_order <- "as_is"                           # ノードの並び（デフォルトは"ascending"）

# 必要なパッケージをロード
library(tidyverse)                               # パッケージの読込
library(ggsankeyfier)                            # パッケージの読込

# 入力ファイルの読み込み
data <- read_csv(in_f)                           # in_fで指定したファイルの読込

# 前処理（描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer(                   # long型データへの変換
              data = data,                       # 入力はdataオブジェクト   
              stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
              values_from = "Frequency")         # 頻度をカウントしたい列名情報

# 作図1（サンキー図の基本形まで作成した結果をgに格納）
pos <- position_sankey(v_space = "auto",         # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                       order = param_order)      # ノード名情報描画時の位置情報（ノードの並び）
g <- ggplot(data = matome,                       # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
  mapping = aes(x = stage, y = Frequency,        # matomeのstage列とFreqency列をx軸とy軸として利用
                group = node, fill = node,       # groupとfillは、matome内のnode列で行う（変更不要）
                edge_id = edge_id,               # edge_idはmatome内のedge_id列（変更不要）
                connector = connector)) +        # connectorはmatome内のconnector列（変更不要）
  geom_sankeynode(position = pos) +              # ノード情報を追加
  geom_sankeyedge(position = pos)                # エッジ情報を追加

# 作図2-1（ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成）
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です（nudgeは小突くという意味）
nudge_val_y <- sum(data$Frequency)*0.020         # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto",        # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # ノード名情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = nudge_val_y)   # ノード名情報描画時の位置情報（y軸情報の位置をnudge_val_y上にずらす）
pos2 <- position_sankey(v_space = "auto",        # 頻度情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # 頻度情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = -nudge_val_y)  # 頻度情報描画時の位置情報（y軸情報の位置をnudge_val_y下にずらす）

# 作図2-2（基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納）
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令（デフォルトは中央揃え）
# size = 4は、サイズ4にせよという指令（この値に応じてnudge_yも適宜調整する）
g2 <- g + 
      geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) + 
      geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)

# 作図3（g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納）
g3 <- g2 + theme_minimal() +                     # 背景を白に変更
      theme(panel.grid = element_blank(),        # グリッド線を消す
            legend.position = 'none',            # 凡例を消す
            axis.title = element_blank(),        # 軸のタイトルを消す
            axis.text.y = element_blank(),       # y軸のメモリ表示を消す
            axis.text.x = element_text(size = 15)) # x軸（カテゴリ名）はサイズ15にせよ
g3
```

# W6 サンキー図の不具合例

## W6.1 出現順（縦5×横5インチ；図6a）
入力ファイルは[JSLAB28_res.csv](JSLAB28_res.csv)です。基本的にW5.4と同じですが、最終の作図段階において、横幅と縦幅をともに5インチしています。htmlを見る限りでは、W5.4（図5a）のスクリプトと同一ですが、このhtml作成時に利用しているRmdファイルの中にRチャンクオプションとして「fig.width=5, fig.height=5」が追加されています。
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=TRUE, comment="", results=TRUE, fig.width=5, fig.height=5}
in_f <- "JSLAB28_res.csv"                        # 入力ファイル名
param_order <- "as_is"                           # ノードの並び（デフォルトは"ascending"）

# 必要なパッケージをロード
library(tidyverse)                               # パッケージの読込
library(ggsankeyfier)                            # パッケージの読込

# 入力ファイルの読み込み
data <- read_csv(in_f)                           # in_fで指定したファイルの読込

# 前処理（描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer(                   # long型データへの変換
              data = data,                       # 入力はdataオブジェクト   
              stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
              values_from = "Frequency")         # 頻度をカウントしたい列名情報

# 作図1（サンキー図の基本形まで作成した結果をgに格納）
pos <- position_sankey(v_space = "auto",         # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                       order = param_order)      # ノード名情報描画時の位置情報（ノードの並び）
g <- ggplot(data = matome,                       # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
  mapping = aes(x = stage, y = Frequency,        # matomeのstage列とFreqency列をx軸とy軸として利用
                group = node, fill = node,       # groupとfillは、matome内のnode列で行う（変更不要）
                edge_id = edge_id,               # edge_idはmatome内のedge_id列（変更不要）
                connector = connector)) +        # connectorはmatome内のconnector列（変更不要）
  geom_sankeynode(position = pos) +              # ノード情報を追加
  geom_sankeyedge(position = pos)                # エッジ情報を追加

# 作図2-1（ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成）
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です（nudgeは小突くという意味）
nudge_val_y <- sum(data$Frequency)*0.020         # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto",        # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # ノード名情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = nudge_val_y)   # ノード名情報描画時の位置情報（y軸情報の位置をnudge_val_y上にずらす）
pos2 <- position_sankey(v_space = "auto",        # 頻度情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # 頻度情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = -nudge_val_y)  # 頻度情報描画時の位置情報（y軸情報の位置をnudge_val_y下にずらす）

# 作図2-2（基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納）
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令（デフォルトは中央揃え）
# size = 4は、サイズ4にせよという指令（この値に応じてnudge_yも適宜調整する）
g2 <- g + 
      geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) + 
      geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)

# 作図3（g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納）
g3 <- g2 + theme_minimal() +                     # 背景を白に変更
      theme(panel.grid = element_blank(),        # グリッド線を消す
            legend.position = 'none',            # 凡例を消す
            axis.title = element_blank(),        # 軸のタイトルを消す
            axis.text.y = element_blank(),       # y軸のメモリ表示を消す
            axis.text.x = element_text(size = 15)) # x軸（カテゴリ名）はサイズ15にせよ
g3
```

## W6.2 出現順（縦5×横5インチ；図6b）
入力ファイルは、[JSLAB28_res2.csv](JSLAB28_res2.csv)です。基本的にW5.6と同じですが、最終の作図段階において、横幅と縦幅をともに5インチしています。htmlを見る限りでは、W5.6（図5b）のスクリプトと同一ですが、このhtml作成時に利用しているRmdファイルの中にRチャンクオプションとして「fig.width=5, fig.height=5」が追加されています。
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=TRUE, comment="", results=TRUE, fig.width=5, fig.height=5}
in_f <- "JSLAB28_res2.csv"                       # 入力ファイル名
param_order <- "as_is"                           # ノードの並び（デフォルトは"ascending"）

# 必要なパッケージをロード
library(tidyverse)                               # パッケージの読込
library(ggsankeyfier)                            # パッケージの読込

# 入力ファイルの読み込み
data <- read_csv(in_f)                           # in_fで指定したファイルの読込

# 前処理（描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer(                   # long型データへの変換
              data = data,                       # 入力はdataオブジェクト   
              stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
              values_from = "Frequency")         # 頻度をカウントしたい列名情報

# 作図1（サンキー図の基本形まで作成した結果をgに格納）
pos <- position_sankey(v_space = "auto",         # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                       order = param_order)      # ノード名情報描画時の位置情報（ノードの並び）
g <- ggplot(data = matome,                       # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
  mapping = aes(x = stage, y = Frequency,        # matomeのstage列とFreqency列をx軸とy軸として利用
                group = node, fill = node,       # groupとfillは、matome内のnode列で行う（変更不要）
                edge_id = edge_id,               # edge_idはmatome内のedge_id列（変更不要）
                connector = connector)) +        # connectorはmatome内のconnector列（変更不要）
  geom_sankeynode(position = pos) +              # ノード情報を追加
  geom_sankeyedge(position = pos)                # エッジ情報を追加

# 作図2-1（ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成）
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です（nudgeは小突くという意味）
nudge_val_y <- sum(data$Frequency)*0.020         # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto",        # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # ノード名情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = nudge_val_y)   # ノード名情報描画時の位置情報（y軸情報の位置をnudge_val_y上にずらす）
pos2 <- position_sankey(v_space = "auto",        # 頻度情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # 頻度情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = -nudge_val_y)  # 頻度情報描画時の位置情報（y軸情報の位置をnudge_val_y下にずらす）

# 作図2-2（基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納）
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令（デフォルトは中央揃え）
# size = 4は、サイズ4にせよという指令（この値に応じてnudge_yも適宜調整する）
g2 <- g + 
      geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) + 
      geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)

# 作図3（g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納）
g3 <- g2 + theme_minimal() +                     # 背景を白に変更
      theme(panel.grid = element_blank(),        # グリッド線を消す
            legend.position = 'none',            # 凡例を消す
            axis.title = element_blank(),        # 軸のタイトルを消す
            axis.text.y = element_blank(),       # y軸のメモリ表示を消す
            axis.text.x = element_text(size = 15)) # x軸（カテゴリ名）はサイズ15にせよ
g3
```

## W6.3 出現順（縦8×横8インチ）
入力ファイルは[JSLAB28_res.csv](JSLAB28_res.csv)です。基本的にW6.1と同じですが、最終の作図段階において、横幅と縦幅をともに8インチしています。htmlを見る限りでは、W6.1（図6a）のスクリプトと同一ですが、このhtml作成時に利用しているRmdファイルの中にRチャンクオプションとして「fig.width=8, fig.height=8」が追加されています。
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=TRUE, comment="", results=TRUE, fig.width=8, fig.height=8}
in_f <- "JSLAB28_res.csv"                        # 入力ファイル名
param_order <- "as_is"                           # ノードの並び（デフォルトは"ascending"）

# 必要なパッケージをロード
library(tidyverse)                               # パッケージの読込
library(ggsankeyfier)                            # パッケージの読込

# 入力ファイルの読み込み
data <- read_csv(in_f)                           # in_fで指定したファイルの読込

# 前処理（描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer(                   # long型データへの変換
              data = data,                       # 入力はdataオブジェクト   
              stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
              values_from = "Frequency")         # 頻度をカウントしたい列名情報

# 作図1（サンキー図の基本形まで作成した結果をgに格納）
pos <- position_sankey(v_space = "auto",         # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                       order = param_order)      # ノード名情報描画時の位置情報（ノードの並び）
g <- ggplot(data = matome,                       # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
  mapping = aes(x = stage, y = Frequency,        # matomeのstage列とFreqency列をx軸とy軸として利用
                group = node, fill = node,       # groupとfillは、matome内のnode列で行う（変更不要）
                edge_id = edge_id,               # edge_idはmatome内のedge_id列（変更不要）
                connector = connector)) +        # connectorはmatome内のconnector列（変更不要）
  geom_sankeynode(position = pos) +              # ノード情報を追加
  geom_sankeyedge(position = pos)                # エッジ情報を追加

# 作図2-1（ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成）
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です（nudgeは小突くという意味）
nudge_val_y <- sum(data$Frequency)*0.020         # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto",        # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # ノード名情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = nudge_val_y)   # ノード名情報描画時の位置情報（y軸情報の位置をnudge_val_y上にずらす）
pos2 <- position_sankey(v_space = "auto",        # 頻度情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # 頻度情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = -nudge_val_y)  # 頻度情報描画時の位置情報（y軸情報の位置をnudge_val_y下にずらす）

# 作図2-2（基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納）
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令（デフォルトは中央揃え）
# size = 4は、サイズ4にせよという指令（この値に応じてnudge_yも適宜調整する）
g2 <- g + 
      geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) + 
      geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)

# 作図3（g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納）
g3 <- g2 + theme_minimal() +                     # 背景を白に変更
      theme(panel.grid = element_blank(),        # グリッド線を消す
            legend.position = 'none',            # 凡例を消す
            axis.title = element_blank(),        # 軸のタイトルを消す
            axis.text.y = element_blank(),       # y軸のメモリ表示を消す
            axis.text.x = element_text(size = 15)) # x軸（カテゴリ名）はサイズ15にせよ
g3
```

## W6.4 出現順（縦8×横8インチ）
入力ファイルは、[JSLAB28_res2.csv](JSLAB28_res2.csv)です。基本的にW6.2と同じですが、最終の作図段階において、横幅と縦幅をともに8インチしています。htmlを見る限りでは、W6.2（図6b）のスクリプトと同一ですが、このhtml作成時に利用しているRmdファイルの中にRチャンクオプションとして「fig.width=8, fig.height=8」が追加されています。
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=TRUE, comment="", results=TRUE, fig.width=8, fig.height=8}
in_f <- "JSLAB28_res2.csv"                       # 入力ファイル名
param_order <- "as_is"                           # ノードの並び（デフォルトは"ascending"）

# 必要なパッケージをロード
library(tidyverse)                               # パッケージの読込
library(ggsankeyfier)                            # パッケージの読込

# 入力ファイルの読み込み
data <- read_csv(in_f)                           # in_fで指定したファイルの読込

# 前処理（描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer(                   # long型データへの変換
              data = data,                       # 入力はdataオブジェクト   
              stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
              values_from = "Frequency")         # 頻度をカウントしたい列名情報

# 作図1（サンキー図の基本形まで作成した結果をgに格納）
pos <- position_sankey(v_space = "auto",         # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                       order = param_order)      # ノード名情報描画時の位置情報（ノードの並び）
g <- ggplot(data = matome,                       # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
  mapping = aes(x = stage, y = Frequency,        # matomeのstage列とFreqency列をx軸とy軸として利用
                group = node, fill = node,       # groupとfillは、matome内のnode列で行う（変更不要）
                edge_id = edge_id,               # edge_idはmatome内のedge_id列（変更不要）
                connector = connector)) +        # connectorはmatome内のconnector列（変更不要）
  geom_sankeynode(position = pos) +              # ノード情報を追加
  geom_sankeyedge(position = pos)                # エッジ情報を追加

# 作図2-1（ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成）
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です（nudgeは小突くという意味）
nudge_val_y <- sum(data$Frequency)*0.020         # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto",        # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # ノード名情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = nudge_val_y)   # ノード名情報描画時の位置情報（y軸情報の位置をnudge_val_y上にずらす）
pos2 <- position_sankey(v_space = "auto",        # 頻度情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # 頻度情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = -nudge_val_y)  # 頻度情報描画時の位置情報（y軸情報の位置をnudge_val_y下にずらす）

# 作図2-2（基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納）
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令（デフォルトは中央揃え）
# size = 4は、サイズ4にせよという指令（この値に応じてnudge_yも適宜調整する）
g2 <- g + 
      geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) + 
      geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)

# 作図3（g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納）
g3 <- g2 + theme_minimal() +                     # 背景を白に変更
      theme(panel.grid = element_blank(),        # グリッド線を消す
            legend.position = 'none',            # 凡例を消す
            axis.title = element_blank(),        # 軸のタイトルを消す
            axis.text.y = element_blank(),       # y軸のメモリ表示を消す
            axis.text.x = element_text(size = 15)) # x軸（カテゴリ名）はサイズ15にせよ
g3
```

## W6.5 昇順（縦5×横5インチ）
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=TRUE, comment="", results=TRUE, fig.width=5, fig.height=5}
in_f <- "JSLAB28_res.csv"                        # 入力ファイル名
param_order <- "ascending"                       # ノードの並び（デフォルトは"ascending"）

# 必要なパッケージをロード
library(tidyverse)                               # パッケージの読込
library(ggsankeyfier)                            # パッケージの読込

# 入力ファイルの読み込み
data <- read_csv(in_f)                           # in_fで指定したファイルの読込

# 前処理（描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer(                   # long型データへの変換
              data = data,                       # 入力はdataオブジェクト   
              stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
              values_from = "Frequency")         # 頻度をカウントしたい列名情報

# 作図1（サンキー図の基本形まで作成した結果をgに格納）
pos <- position_sankey(v_space = "auto",         # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                       order = param_order)      # ノード名情報描画時の位置情報（ノードの並び）
g <- ggplot(data = matome,                       # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
  mapping = aes(x = stage, y = Frequency,        # matomeのstage列とFreqency列をx軸とy軸として利用
                group = node, fill = node,       # groupとfillは、matome内のnode列で行う（変更不要）
                edge_id = edge_id,               # edge_idはmatome内のedge_id列（変更不要）
                connector = connector)) +        # connectorはmatome内のconnector列（変更不要）
  geom_sankeynode(position = pos) +              # ノード情報を追加
  geom_sankeyedge(position = pos)                # エッジ情報を追加

# 作図2-1（ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成）
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です（nudgeは小突くという意味）
nudge_val_y <- sum(data$Frequency)*0.020         # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto",        # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # ノード名情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = nudge_val_y)   # ノード名情報描画時の位置情報（y軸情報の位置をnudge_val_y上にずらす）
pos2 <- position_sankey(v_space = "auto",        # 頻度情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # 頻度情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = -nudge_val_y)  # 頻度情報描画時の位置情報（y軸情報の位置をnudge_val_y下にずらす）

# 作図2-2（基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納）
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令（デフォルトは中央揃え）
# size = 4は、サイズ4にせよという指令（この値に応じてnudge_yも適宜調整する）
g2 <- g + 
      geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) + 
      geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)

# 作図3（g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納）
g3 <- g2 + theme_minimal() +                     # 背景を白に変更
      theme(panel.grid = element_blank(),        # グリッド線を消す
            legend.position = 'none',            # 凡例を消す
            axis.title = element_blank(),        # 軸のタイトルを消す
            axis.text.y = element_blank(),       # y軸のメモリ表示を消す
            axis.text.x = element_text(size = 15)) # x軸（カテゴリ名）はサイズ15にせよ
g3
```

## W6.6 昇順（縦8×横8インチ）
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=TRUE, comment="", results=TRUE, fig.width=8, fig.height=8}
in_f <- "JSLAB28_res.csv"                        # 入力ファイル名
param_order <- "ascending"                       # ノードの並び（デフォルトは"ascending"）

# 必要なパッケージをロード
library(tidyverse)                               # パッケージの読込
library(ggsankeyfier)                            # パッケージの読込

# 入力ファイルの読み込み
data <- read_csv(in_f)                           # in_fで指定したファイルの読込

# 前処理（描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer(                   # long型データへの変換
              data = data,                       # 入力はdataオブジェクト   
              stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
              values_from = "Frequency")         # 頻度をカウントしたい列名情報

# 作図1（サンキー図の基本形まで作成した結果をgに格納）
pos <- position_sankey(v_space = "auto",         # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                       order = param_order)      # ノード名情報描画時の位置情報（ノードの並び）
g <- ggplot(data = matome,                       # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
  mapping = aes(x = stage, y = Frequency,        # matomeのstage列とFreqency列をx軸とy軸として利用
                group = node, fill = node,       # groupとfillは、matome内のnode列で行う（変更不要）
                edge_id = edge_id,               # edge_idはmatome内のedge_id列（変更不要）
                connector = connector)) +        # connectorはmatome内のconnector列（変更不要）
  geom_sankeynode(position = pos) +              # ノード情報を追加
  geom_sankeyedge(position = pos)                # エッジ情報を追加

# 作図2-1（ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成）
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です（nudgeは小突くという意味）
nudge_val_y <- sum(data$Frequency)*0.020         # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto",        # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # ノード名情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = nudge_val_y)   # ノード名情報描画時の位置情報（y軸情報の位置をnudge_val_y上にずらす）
pos2 <- position_sankey(v_space = "auto",        # 頻度情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # 頻度情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = -nudge_val_y)  # 頻度情報描画時の位置情報（y軸情報の位置をnudge_val_y下にずらす）

# 作図2-2（基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納）
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令（デフォルトは中央揃え）
# size = 4は、サイズ4にせよという指令（この値に応じてnudge_yも適宜調整する）
g2 <- g + 
      geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) + 
      geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)

# 作図3（g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納）
g3 <- g2 + theme_minimal() +                     # 背景を白に変更
      theme(panel.grid = element_blank(),        # グリッド線を消す
            legend.position = 'none',            # 凡例を消す
            axis.title = element_blank(),        # 軸のタイトルを消す
            axis.text.y = element_blank(),       # y軸のメモリ表示を消す
            axis.text.x = element_text(size = 15)) # x軸（カテゴリ名）はサイズ15にせよ
g3
```

## W6.7 降順（縦5×横5インチ）
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=TRUE, comment="", results=TRUE, fig.width=5, fig.height=5}
in_f <- "JSLAB28_res.csv"                        # 入力ファイル名
param_order <- "descending"                      # ノードの並び（デフォルトは"ascending"）

# 必要なパッケージをロード
library(tidyverse)                               # パッケージの読込
library(ggsankeyfier)                            # パッケージの読込

# 入力ファイルの読み込み
data <- read_csv(in_f)                           # in_fで指定したファイルの読込

# 前処理（描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer(                   # long型データへの変換
              data = data,                       # 入力はdataオブジェクト   
              stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
              values_from = "Frequency")         # 頻度をカウントしたい列名情報

# 作図1（サンキー図の基本形まで作成した結果をgに格納）
pos <- position_sankey(v_space = "auto",         # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                       order = param_order)      # ノード名情報描画時の位置情報（ノードの並び）
g <- ggplot(data = matome,                       # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
  mapping = aes(x = stage, y = Frequency,        # matomeのstage列とFreqency列をx軸とy軸として利用
                group = node, fill = node,       # groupとfillは、matome内のnode列で行う（変更不要）
                edge_id = edge_id,               # edge_idはmatome内のedge_id列（変更不要）
                connector = connector)) +        # connectorはmatome内のconnector列（変更不要）
  geom_sankeynode(position = pos) +              # ノード情報を追加
  geom_sankeyedge(position = pos)                # エッジ情報を追加

# 作図2-1（ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成）
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です（nudgeは小突くという意味）
nudge_val_y <- sum(data$Frequency)*0.020         # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto",        # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # ノード名情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = nudge_val_y)   # ノード名情報描画時の位置情報（y軸情報の位置をnudge_val_y上にずらす）
pos2 <- position_sankey(v_space = "auto",        # 頻度情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # 頻度情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = -nudge_val_y)  # 頻度情報描画時の位置情報（y軸情報の位置をnudge_val_y下にずらす）

# 作図2-2（基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納）
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令（デフォルトは中央揃え）
# size = 4は、サイズ4にせよという指令（この値に応じてnudge_yも適宜調整する）
g2 <- g + 
      geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) + 
      geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)

# 作図3（g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納）
g3 <- g2 + theme_minimal() +                     # 背景を白に変更
      theme(panel.grid = element_blank(),        # グリッド線を消す
            legend.position = 'none',            # 凡例を消す
            axis.title = element_blank(),        # 軸のタイトルを消す
            axis.text.y = element_blank(),       # y軸のメモリ表示を消す
            axis.text.x = element_text(size = 15)) # x軸（カテゴリ名）はサイズ15にせよ
g3
```

## W6.8 降順（縦8×横8インチ）
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=TRUE, comment="", results=TRUE, fig.width=8, fig.height=8}
in_f <- "JSLAB28_res.csv"                        # 入力ファイル名
param_order <- "descending"                      # ノードの並び（デフォルトは"ascending"）

# 必要なパッケージをロード
library(tidyverse)                               # パッケージの読込
library(ggsankeyfier)                            # パッケージの読込

# 入力ファイルの読み込み
data <- read_csv(in_f)                           # in_fで指定したファイルの読込

# 前処理（描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer(                   # long型データへの変換
              data = data,                       # 入力はdataオブジェクト   
              stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
              values_from = "Frequency")         # 頻度をカウントしたい列名情報

# 作図1（サンキー図の基本形まで作成した結果をgに格納）
pos <- position_sankey(v_space = "auto",         # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                       order = param_order)      # ノード名情報描画時の位置情報（ノードの並び）
g <- ggplot(data = matome,                       # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
  mapping = aes(x = stage, y = Frequency,        # matomeのstage列とFreqency列をx軸とy軸として利用
                group = node, fill = node,       # groupとfillは、matome内のnode列で行う（変更不要）
                edge_id = edge_id,               # edge_idはmatome内のedge_id列（変更不要）
                connector = connector)) +        # connectorはmatome内のconnector列（変更不要）
  geom_sankeynode(position = pos) +              # ノード情報を追加
  geom_sankeyedge(position = pos)                # エッジ情報を追加

# 作図2-1（ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成）
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です（nudgeは小突くという意味）
nudge_val_y <- sum(data$Frequency)*0.020         # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto",        # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # ノード名情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = nudge_val_y)   # ノード名情報描画時の位置情報（y軸情報の位置をnudge_val_y上にずらす）
pos2 <- position_sankey(v_space = "auto",        # 頻度情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # 頻度情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = -nudge_val_y)  # 頻度情報描画時の位置情報（y軸情報の位置をnudge_val_y下にずらす）

# 作図2-2（基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納）
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令（デフォルトは中央揃え）
# size = 4は、サイズ4にせよという指令（この値に応じてnudge_yも適宜調整する）
g2 <- g + 
      geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) + 
      geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)

# 作図3（g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納）
g3 <- g2 + theme_minimal() +                     # 背景を白に変更
      theme(panel.grid = element_blank(),        # グリッド線を消す
            legend.position = 'none',            # 凡例を消す
            axis.title = element_blank(),        # 軸のタイトルを消す
            axis.text.y = element_blank(),       # y軸のメモリ表示を消す
            axis.text.x = element_text(size = 15)) # x軸（カテゴリ名）はサイズ15にせよ
g3
```

## W6.9 出現順（縦5×横7インチ）
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=TRUE, comment="", results=TRUE, fig.width=7, fig.height=5}
in_f <- "JSLAB28_res.csv"                        # 入力ファイル名
param_order <- "as_is"                           # ノードの並び（デフォルトは"ascending"）

# 必要なパッケージをロード
library(tidyverse)                               # パッケージの読込
library(ggsankeyfier)                            # パッケージの読込

# 入力ファイルの読み込み
data <- read_csv(in_f)                           # in_fで指定したファイルの読込

# 前処理（描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer(                   # long型データへの変換
              data = data,                       # 入力はdataオブジェクト   
              stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
              values_from = "Frequency")         # 頻度をカウントしたい列名情報

# 作図1（サンキー図の基本形まで作成した結果をgに格納）
pos <- position_sankey(v_space = "auto",         # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                       order = param_order)      # ノード名情報描画時の位置情報（ノードの並び）
g <- ggplot(data = matome,                       # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
  mapping = aes(x = stage, y = Frequency,        # matomeのstage列とFreqency列をx軸とy軸として利用
                group = node, fill = node,       # groupとfillは、matome内のnode列で行う（変更不要）
                edge_id = edge_id,               # edge_idはmatome内のedge_id列（変更不要）
                connector = connector)) +        # connectorはmatome内のconnector列（変更不要）
  geom_sankeynode(position = pos) +              # ノード情報を追加
  geom_sankeyedge(position = pos)                # エッジ情報を追加

# 作図2-1（ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成）
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です（nudgeは小突くという意味）
nudge_val_y <- sum(data$Frequency)*0.020         # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto",        # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # ノード名情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = nudge_val_y)   # ノード名情報描画時の位置情報（y軸情報の位置をnudge_val_y上にずらす）
pos2 <- position_sankey(v_space = "auto",        # 頻度情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # 頻度情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = -nudge_val_y)  # 頻度情報描画時の位置情報（y軸情報の位置をnudge_val_y下にずらす）

# 作図2-2（基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納）
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令（デフォルトは中央揃え）
# size = 4は、サイズ4にせよという指令（この値に応じてnudge_yも適宜調整する）
g2 <- g + 
      geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) + 
      geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)

# 作図3（g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納）
g3 <- g2 + theme_minimal() +                     # 背景を白に変更
      theme(panel.grid = element_blank(),        # グリッド線を消す
            legend.position = 'none',            # 凡例を消す
            axis.title = element_blank(),        # 軸のタイトルを消す
            axis.text.y = element_blank(),       # y軸のメモリ表示を消す
            axis.text.x = element_text(size = 15)) # x軸（カテゴリ名）はサイズ15にせよ
g3
```

## W6.10 昇順（縦7×横5インチ）
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=TRUE, comment="", results=TRUE, fig.width=5, fig.height=7}
in_f <- "JSLAB28_res.csv"                        # 入力ファイル名
param_order <- "ascending"                       # ノードの並び（デフォルトは"ascending"）

# 必要なパッケージをロード
library(tidyverse)                               # パッケージの読込
library(ggsankeyfier)                            # パッケージの読込

# 入力ファイルの読み込み
data <- read_csv(in_f)                           # in_fで指定したファイルの読込

# 前処理（描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer(                   # long型データへの変換
              data = data,                       # 入力はdataオブジェクト   
              stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
              values_from = "Frequency")         # 頻度をカウントしたい列名情報

# 作図1（サンキー図の基本形まで作成した結果をgに格納）
pos <- position_sankey(v_space = "auto",         # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                       order = param_order)      # ノード名情報描画時の位置情報（ノードの並び）
g <- ggplot(data = matome,                       # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
  mapping = aes(x = stage, y = Frequency,        # matomeのstage列とFreqency列をx軸とy軸として利用
                group = node, fill = node,       # groupとfillは、matome内のnode列で行う（変更不要）
                edge_id = edge_id,               # edge_idはmatome内のedge_id列（変更不要）
                connector = connector)) +        # connectorはmatome内のconnector列（変更不要）
  geom_sankeynode(position = pos) +              # ノード情報を追加
  geom_sankeyedge(position = pos)                # エッジ情報を追加

# 作図2-1（ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成）
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です（nudgeは小突くという意味）
nudge_val_y <- sum(data$Frequency)*0.020         # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto",        # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # ノード名情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = nudge_val_y)   # ノード名情報描画時の位置情報（y軸情報の位置をnudge_val_y上にずらす）
pos2 <- position_sankey(v_space = "auto",        # 頻度情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # 頻度情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = -nudge_val_y)  # 頻度情報描画時の位置情報（y軸情報の位置をnudge_val_y下にずらす）

# 作図2-2（基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納）
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令（デフォルトは中央揃え）
# size = 4は、サイズ4にせよという指令（この値に応じてnudge_yも適宜調整する）
g2 <- g + 
      geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) + 
      geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)

# 作図3（g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納）
g3 <- g2 + theme_minimal() +                     # 背景を白に変更
      theme(panel.grid = element_blank(),        # グリッド線を消す
            legend.position = 'none',            # 凡例を消す
            axis.title = element_blank(),        # 軸のタイトルを消す
            axis.text.y = element_blank(),       # y軸のメモリ表示を消す
            axis.text.x = element_text(size = 15)) # x軸（カテゴリ名）はサイズ15にせよ
g3
```

## W6.11 昇順（縦9×横5インチ）
```{r, message=FALSE, error=TRUE, warning=FALSE, eval=TRUE, comment="", results=TRUE, fig.width=5, fig.height=9}
in_f <- "JSLAB28_res.csv"                        # 入力ファイル名
param_order <- "ascending"                       # ノードの並び（デフォルトは"ascending"）

# 必要なパッケージをロード
library(tidyverse)                               # パッケージの読込
library(ggsankeyfier)                            # パッケージの読込

# 入力ファイルの読み込み
data <- read_csv(in_f)                           # in_fで指定したファイルの読込

# 前処理（描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer(                   # long型データへの変換
              data = data,                       # 入力はdataオブジェクト   
              stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
              values_from = "Frequency")         # 頻度をカウントしたい列名情報

# 作図1（サンキー図の基本形まで作成した結果をgに格納）
pos <- position_sankey(v_space = "auto",         # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                       order = param_order)      # ノード名情報描画時の位置情報（ノードの並び）
g <- ggplot(data = matome,                       # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
  mapping = aes(x = stage, y = Frequency,        # matomeのstage列とFreqency列をx軸とy軸として利用
                group = node, fill = node,       # groupとfillは、matome内のnode列で行う（変更不要）
                edge_id = edge_id,               # edge_idはmatome内のedge_id列（変更不要）
                connector = connector)) +        # connectorはmatome内のconnector列（変更不要）
  geom_sankeynode(position = pos) +              # ノード情報を追加
  geom_sankeyedge(position = pos)                # エッジ情報を追加

# 作図2-1（ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成）
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です（nudgeは小突くという意味）
nudge_val_y <- sum(data$Frequency)*0.020         # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto",        # ノード名情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # ノード名情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = nudge_val_y)   # ノード名情報描画時の位置情報（y軸情報の位置をnudge_val_y上にずらす）
pos2 <- position_sankey(v_space = "auto",        # 頻度情報描画時の位置情報（ノード間の縦幅間隔は自動）
                        order = param_order,     # ノード名情報描画時の位置情報（ノードの並び）
                        nudge_x = 0.06,          # 頻度情報描画時の位置情報（x軸情報の位置を0.06右にずらす）
                        nudge_y = -nudge_val_y)  # 頻度情報描画時の位置情報（y軸情報の位置をnudge_val_y下にずらす）

# 作図2-2（基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納）
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令（デフォルトは中央揃え）
# size = 4は、サイズ4にせよという指令（この値に応じてnudge_yも適宜調整する）
g2 <- g + 
      geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) + 
      geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)

# 作図3（g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納）
g3 <- g2 + theme_minimal() +                     # 背景を白に変更
      theme(panel.grid = element_blank(),        # グリッド線を消す
            legend.position = 'none',            # 凡例を消す
            axis.title = element_blank(),        # 軸のタイトルを消す
            axis.text.y = element_blank(),       # y軸のメモリ表示を消す
            axis.text.x = element_text(size = 15)) # x軸（カテゴリ名）はサイズ15にせよ
g3
```
