W2 解析データ
W2.1 シミュレーションデータの作成
nA <- 3 # A群の反復数(サンプル数)
nB <- 3 # B群の反復数(サンプル数)
G <- 10000 # 遺伝子数
PDEG <- 0.5 # DEGの割合
PA <- 0.5 # A群で高発現DEGの割合
FC <- 4 # 発現変動の度合い(倍率変化)
# 必要なパッケージのロードや前処理
library(TCC) # パッケージのロード
PB <- (1 - PA) # B群で高発現DEGの割合はPAが決まれば自動的に定まる
set.seed(1050) # 乱数種の指定
# シミュレーションデータ生成本番
tcc <- simulateReadCounts(Ngene = G, # 遺伝子数指定部分
PDEG = PDEG, # DEGの割合指定部分
DEG.assign = c(PA, PB), # 群ごとの高発現DEGの割合
replicates = c(nA, nB), # 群ごとの反復数
DEG.foldchange = c(FC, FC)) # 群ごとのDEGの倍率変化
truth <- as.numeric(tcc$simulation$trueDEG != 0) # 真のDEGの位置を1、non-DEGの位置を0としたベクトルを作成
Truth <- truth # コピー
Truth[1:(G*PDEG*PA)] <- "DEG_A" # DEG_Aパターンの位置
Truth[(G*PDEG*PA+1):(G*PDEG)] <- "DEG_B" # DEG_Bパターンの位置
Truth[Truth == 0] <- "non-DEG" # non-DEGパターンの位置
data <- tcc$count # カウント情報
data.cl <- tcc$group$group # 群ラベル情報
plotFCPseudocolor(tcc) # シミュレーション条件のpseudo-colorイメージを描画

# 出力
colnames(data) <- c(paste("A", 1:nA, sep=""), paste("B", 1:nB, sep=""))
tmp <- cbind(rownames(data), data)
out_f <- paste("JSLAB28_data.csv", sep="")
write.csv(tmp, out_f, row.names=F)
W2.2 log比の計算
以下のdataオブジェクトに対応する元データファイルは、JSLAB28_data.csvです。出力ファイルは、JSLAB28_truth.csvです。
x <- data # コピー
cl <- data.cl # コピー
meanA <- apply(x[, cl == 1], 1, FUN = mean) # A群の平均の計算
meanB <- apply(x[, cl == 2], 1, FUN = mean) # B群の平均の計算
logratio <- log2(meanB/meanA) # log比の計算
# パターンごとのlog比の要約統計量
summary(logratio[Truth == "DEG_A"]) # DEG_Aのlog比の要約統計量
Min. 1st Qu. Median Mean 3rd Qu. Max.
-Inf -2.474 -2.015 -1.629 Inf
summary(logratio[Truth == "DEG_B"]) # DEG_Bのlog比の要約統計量
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
-Inf 1.602 2.009 NaN 2.444 Inf 3
summary(logratio[Truth == "non-DEG"]) # non-DEGのlog比の要約統計量
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
-Inf -0.415 0.000 NaN 0.466 Inf 43
# 出力
med_DEG_A <- median(logratio[Truth == "DEG_A"], na.rm = TRUE) # DEG_Aのlog比の中央値
med_DEG_B <- median(logratio[Truth == "DEG_B"], na.rm = TRUE) # DEG_Bのlog比の中央値
med_nonDEG <- median(logratio[Truth == "non-DEG"], na.rm = TRUE)# non-DEGのlog比の中央値
tmp <- NULL
tmp <- rbind(tmp, c("DEG_A", med_DEG_A))
tmp <- rbind(tmp, c("DEG_B", med_DEG_B))
tmp <- rbind(tmp, c("non-DEG", med_nonDEG))
colnames(tmp) <- c("cluster_name", "logratio")
write.csv(tmp, "JSLAB28_truth.csv", row.names=F)
W2.3 MBCluster.Seqの実行
出力ファイルは、図1の右上部分に相当するJSLAB28_res.csv、K =
3~5のクラスタ中心のlog比情報を格納したJSLAB28_K3centers.csv、JSLAB28_K4centers.csv、JSLAB28_K5centers.csvです。
library(MBCluster.Seq) # パッケージのロード
set.seed(1000)
# MBCluster.Seqの実行(K = 3)
K <- 3 # クラスタ数
mbc <- RNASeq.Data(data, Normalizer = NULL,
Treatment = data.cl, GeneID = rownames(data))
c0 <- KmeansPlus.RNASeq(data = mbc, nK = K,
model = "nbinom", print.steps = F)
cls <- Cluster.RNASeq(data = mbc, model = "nbinom",
centers = c0$centers, method = "EM")
cluster <- cls$cluster # オブジェクト名の変更(クラスタ番号情報)
centers <- cls$centers # オブジェクト名の変更(クラスタ中心情報)
# 後処理と結果の大まかな確認
centers # クラスタ中心の発現パターン(log(B群/A群))
table(cluster) # クラスタごとに含まれる遺伝子数
K3 <- str_c("cluster", cluster) # クラスタ番号の左側に文字列"cluster"を連結
K3_centers <- log2(exp(2 * centers[,2])) # クラスタ中心のlog2(B/A)情報
# MBCluster.Seqの実行(K = 4)
K <- 4 # クラスタ数
mbc <- RNASeq.Data(data, Normalizer = NULL,
Treatment = data.cl, GeneID = rownames(data))
c0 <- KmeansPlus.RNASeq(data = mbc, nK = K,
model = "nbinom", print.steps = F)
cls <- Cluster.RNASeq(data = mbc, model = "nbinom",
centers = c0$centers, method = "EM")
cluster <- cls$cluster # オブジェクト名の変更(クラスタ番号情報)
centers <- cls$centers # オブジェクト名の変更(クラスタ中心情報)
# 後処理と結果の大まかな確認
centers # クラスタ中心の発現パターン(log(B群/A群))
table(cluster) # クラスタごとに含まれる遺伝子数
K4 <- str_c("cluster", cluster) # クラスタ番号の左側に文字列"cluster"を連結
K4_centers <- log2(exp(2 * centers[,2])) # クラスタ中心のlog2(B/A)情報
# MBCluster.Seqの実行(K = 5)
K <- 5 # クラスタ数
mbc <- RNASeq.Data(data, Normalizer = NULL,
Treatment = data.cl, GeneID = rownames(data))
c0 <- KmeansPlus.RNASeq(data = mbc, nK = K,
model = "nbinom", print.steps = F)
cls <- Cluster.RNASeq(data = mbc, model = "nbinom",
centers = c0$centers, method = "EM")
cluster <- cls$cluster # オブジェクト名の変更(クラスタ番号情報)
centers <- cls$centers # オブジェクト名の変更(クラスタ中心情報)
# 後処理と結果の大まかな確認
centers # クラスタ中心の発現パターン(log(B群/A群))
table(cluster) # クラスタごとに含まれる遺伝子数
K5 <- str_c("cluster", cluster) # クラスタ番号の左側に文字列"cluster"を連結
K5_centers <- log2(exp(2 * centers[,2])) # クラスタ中心のlog2(B/A)情報
# 出力
Frequency <- rep(1, length(Truth))
tmp <- cbind(rownames(data), Truth, logratio, K3, K4, K5, Frequency)
out_f <- paste("JSLAB28_res.csv", sep="")
write.csv(tmp, out_f, row.names=F)
tmp <- cbind(str_c("cluster", 1:3), K3_centers)
colnames(tmp) <- c("cluster_name", "logratio")
write.csv(tmp, "JSLAB28_K3centers.csv", row.names=F)
tmp <- cbind(str_c("cluster", 1:4), K4_centers)
colnames(tmp) <- c("cluster_name", "logratio")
write.csv(tmp, "JSLAB28_K4centers.csv", row.names=F)
tmp <- cbind(str_c("cluster", 1:5), K5_centers)
colnames(tmp) <- c("cluster_name", "logratio")
write.csv(tmp, "JSLAB28_K5centers.csv", row.names=F)
W2.4 ヒストグラム(図1下部)
入力ファイルは、JSLAB28_res.csvとJSLAB28_truth.csvです。以下のスクリプトは、生成AIの1つであるGeminiに入力ファイルを与えたのち、「JSLAB28_res.csvのTruth列とlogratio列を読み込んで、logratio列のヒストグラムをTruth列のカテゴリごとに色分けしてggplot2で描画するRのスクリプトを教えて。また、JSLAB28_truth.csvを読み込んでヒストグラムの上部に、横軸上がlogratio列の数値の位置に下向き矢印を追加し、さらにそのすぐ上にcluster_name列の文字列とlogratio列の数値情報も小数点以下3桁で示して。」
のような指令(プロンプト)を出して得た結果を簡潔にしたものです。
# データの読み込み
df <- read.csv("JSLAB28_res.csv")
tmp <- read.csv("JSLAB28_truth.csv")
clust_name <- tmp$cluster_name
clust_lr <- tmp$logratio
max_y <- 700
# --- 色の設定 ---
# ヒストグラムで使う "Set1" パレットから、クラスター数(4つ)分の色を抽出
# Set1の順番は、通常 ggplot の fill と一致します
my_pal <- brewer.pal(nrow(tmp), "Set1")
# ヒストグラムの作成
ggplot(df, aes(x = logratio, fill = Truth)) +
geom_histogram(binwidth = 0.1, alpha = 0.6, position = "identity") +
# x軸の範囲を -4 から 4 に指定
coord_cartesian(xlim = c(-4, 4), ylim = c(0, max_y)) +
# クラスタ中心情報の追加
annotate("segment", x = clust_lr, xend = clust_lr, y = max_y * 0.78, yend = max_y * 0.72,
arrow = arrow(length = unit(0.3, "cm")), size = 1, color = my_pal) +
annotate("text", x = clust_lr - 0.10, y = max_y * 0.9, label = clust_name, fontface = "plain", angle = 90, color = my_pal) +
annotate("text", x = clust_lr + 0.12, y = max_y * 0.9, label = sprintf("%.3f", clust_lr), fontface = "plain", angle = 90, color = my_pal) +
theme_minimal() +
scale_fill_brewer(palette = "Set1") +
labs(title = NULL,
x = "log2(B/A)",
y = "頻度",
fill = "パターン") +
# 凡例の位置調整
theme(
legend.position = c(0.99, 0.99), # 右上(x=0.95, y=0.95)に配置
legend.justification = c("right", "top"), # 凡例の右上角を基準点にする
legend.background = element_rect(fill = "white", color = "black", linewidth = 0.3) # 凡例に枠線を付与
)

W4 クラスタごとのヒストグラム
W4.1 K = 3
W2.4のスクリプトをベースとして入力ファイルを変更しただけです。入力ファイルは、W2.3実行結果として得たJSLAB28_res.csvとJSLAB28_K3centers.csvです。
# データの読み込み
df <- read.csv("JSLAB28_res.csv")
tmp <- read.csv("JSLAB28_K3centers.csv")
clust_name <- tmp$cluster_name
clust_lr <- tmp$logratio
max_y <- 700
# --- 色の設定 ---
# ヒストグラムで使う "Set1" パレットから、クラスター数(4つ)分の色を抽出
# Set1の順番は、通常 ggplot の fill と一致します
my_pal <- brewer.pal(nrow(tmp), "Set1")
# ヒストグラムの作成
ggplot(df, aes(x = logratio, fill = K3)) +
geom_histogram(binwidth = 0.1, alpha = 0.6, position = "identity") +
# x軸の範囲を -4 から 4 に指定
coord_cartesian(xlim = c(-4, 4), ylim = c(0, max_y)) +
# クラスタ中心情報の追加
annotate("segment", x = clust_lr, xend = clust_lr, y = max_y * 0.82, yend = max_y * 0.77,
arrow = arrow(length = unit(0.3, "cm")), size = 1, color = my_pal) +
annotate("text", x = clust_lr - 0.10, y = max_y * 0.93, label = clust_name, fontface = "plain", angle = 90, color = my_pal) +
annotate("text", x = clust_lr + 0.10, y = max_y * 0.93, label = sprintf("%.3f", clust_lr), fontface = "plain", angle = 90, color = my_pal) +
theme_minimal() +
scale_fill_brewer(palette = "Set1") +
labs(title = NULL,
x = "log2(B/A)",
y = "頻度",
fill = "クラスタ") +
# 凡例の位置調整
theme(
legend.position = c(0.99, 0.99), # 右上(x=0.95, y=0.95)に配置
legend.justification = c("right", "top"), # 凡例の右上角を基準点にする
legend.background = element_rect(fill = "white", color = "black", linewidth = 0.3) # 凡例に枠線を付与
)

W4.2 K = 4
入力ファイルは、W2.3実行結果として得たJSLAB28_res.csvとJSLAB28_K4centers.csvです。
# データの読み込み
df <- read.csv("JSLAB28_res.csv")
tmp <- read.csv("JSLAB28_K4centers.csv")
clust_name <- tmp$cluster_name
clust_lr <- tmp$logratio
max_y <- 700
# --- 色の設定 ---
# ヒストグラムで使う "Set1" パレットから、クラスター数(4つ)分の色を抽出
# Set1の順番は、通常 ggplot の fill と一致します
my_pal <- brewer.pal(nrow(tmp), "Set1")
# ヒストグラムの作成
ggplot(df, aes(x = logratio, fill = K4)) +
geom_histogram(binwidth = 0.1, alpha = 0.6, position = "identity") +
# x軸の範囲を -4 から 4 に指定
coord_cartesian(xlim = c(-4, 4), ylim = c(0, max_y)) +
# クラスタ中心情報の追加
annotate("segment", x = clust_lr, xend = clust_lr, y = max_y * 0.82, yend = max_y * 0.77,
arrow = arrow(length = unit(0.3, "cm")), size = 1, color = my_pal) +
annotate("text", x = clust_lr - 0.10, y = max_y * 0.93, label = clust_name, fontface = "plain", angle = 90, color = my_pal) +
annotate("text", x = clust_lr + 0.10, y = max_y * 0.93, label = sprintf("%.3f", clust_lr), fontface = "plain", angle = 90, color = my_pal) +
theme_minimal() +
scale_fill_brewer(palette = "Set1") +
labs(title = NULL,
x = "log2(B/A)",
y = "頻度",
fill = "クラスタ") +
# 凡例の位置調整
theme(
legend.position = c(0.99, 0.99), # 右上(x=0.95, y=0.95)に配置
legend.justification = c("right", "top"), # 凡例の右上角を基準点にする
legend.background = element_rect(fill = "white", color = "black", linewidth = 0.3) # 凡例に枠線を付与
)

W4.3 K = 5
入力ファイルは、W2.3実行結果として得たJSLAB28_res.csvとJSLAB28_K5centers.csvです。
# データの読み込み
df <- read.csv("JSLAB28_res.csv")
tmp <- read.csv("JSLAB28_K5centers.csv")
clust_name <- tmp$cluster_name
clust_lr <- tmp$logratio
max_y <- 700
# --- 色の設定 ---
# ヒストグラムで使う "Set1" パレットから、クラスター数(4つ)分の色を抽出
# Set1の順番は、通常 ggplot の fill と一致します
my_pal <- brewer.pal(nrow(tmp), "Set1")
# ヒストグラムの作成
ggplot(df, aes(x = logratio, fill = K5)) +
geom_histogram(binwidth = 0.1, alpha = 0.6, position = "identity") +
# x軸の範囲を -4 から 4 に指定
coord_cartesian(xlim = c(-4, 4), ylim = c(0, max_y)) +
# クラスタ中心情報の追加
annotate("segment", x = clust_lr, xend = clust_lr, y = max_y * 0.82, yend = max_y * 0.77,
arrow = arrow(length = unit(0.3, "cm")), size = 1, color = my_pal) +
annotate("text", x = clust_lr - 0.10, y = max_y * 0.93, label = clust_name, fontface = "plain", angle = 90, color = my_pal) +
annotate("text", x = clust_lr + 0.10, y = max_y * 0.93, label = sprintf("%.3f", clust_lr), fontface = "plain", angle = 90, color = my_pal) +
theme_minimal() +
scale_fill_brewer(palette = "Set1") +
labs(title = NULL,
x = "log2(B/A)",
y = "頻度",
fill = "クラスタ") +
# 凡例の位置調整
theme(
legend.position = c(0.99, 0.99), # 右上(x=0.95, y=0.95)に配置
legend.justification = c("right", "top"), # 凡例の右上角を基準点にする
legend.background = element_rect(fill = "white", color = "black", linewidth = 0.3) # 凡例に枠線を付与
)

W4.4 log比が-1から1の範囲の状況
以下で定義する関数は、生成AIの1つであるGeminiにJSLAB28_res.csvを与えたのち、「このファイルを読み込んで、logratio列が-1から1の範囲にある行を抜き出し、K3,
K4,
K5列に対してRのtable関数を実行するスクリプトを教えて。」という指令(プロンプト)を出して得た結果を簡潔にしたものです。いずれの列においても、条件を満たす計4273遺伝子中4271個がcluster3に割り当てられていることが分かります。
# 1. ファイルの読み込み
# CSVの1列目が遺伝子名(行名)のようなので row.names = 1 を指定しています
data <- read.csv("JSLAB28_res.csv", row.names = 1)
# 2. logratioが -1 から 1 の範囲にある行を抽出
# ※ Inf や -Inf を除外するために有限値判定を入れるのが一般的です
filtered_data <- subset(data, logratio >= -1 & logratio <= 1)
# 3. K3, K4, K5列に対して table 関数を実行
lapply(filtered_data[, c("K3", "K4", "K5")], table)
$K3
cluster1 cluster2 cluster3
1 1 4271
$K4
cluster1 cluster2 cluster3
1 1 4271
$K5
cluster2 cluster3 cluster5
1 4271 1
W5 サンキー図
W5.1 昇順(図4a)
入力ファイルはJSLAB28_res.csvです。
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "ascending" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupはnode列、fillはstage列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W5.2 降順(図4b)
入力ファイルはJSLAB28_res.csvです。
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "descending" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W5.3 クロス集計表
サンキー図中のK3とK4、およびK4とK5間のクロス集計表を得るためのスクリプトです。
入力ファイルはJSLAB28_res.csv、出力ファイルはJSLAB28_K3_K4.csvとJSLAB28_K4_K5.csvです。
in_f <- "JSLAB28_res.csv" # 入力ファイル名
# K3とK4間のクロス集計表
hoge <- table(df$K3, df$K4) # K3列とK4列のクロス集計表
Total <- colSums(hoge) # 列ごとのトータル情報の取得
hoge <- rbind(hoge, Total) # トータル情報を最下行で連結
Total <- rowSums(hoge) # 行ごとのトータル情報の取得
hoge <- cbind(hoge, Total) # トータル情報を最右列で連結
tmp <- cbind(rownames(hoge), hoge) # 行名情報を追加
write.csv(tmp, "JSLAB28_K3_K4.csv", row.names=F) # ファイル出力
# K4とK5間のクロス集計表
hoge <- table(df$K4, df$K5) # K4列とK5列のクロス集計表
Total <- colSums(hoge) # 列ごとのトータル情報の取得
hoge <- rbind(hoge, Total) # トータル情報を最下行で連結
Total <- rowSums(hoge) # 行ごとのトータル情報の取得
hoge <- cbind(hoge, Total) # トータル情報を最右列で連結
tmp <- cbind(rownames(hoge), hoge) # 行名情報を追加
write.csv(tmp, "JSLAB28_K4_K5.csv", row.names=F) # ファイル出力
W5.4 出現順(図5a)
入力ファイルはJSLAB28_res.csvです。
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "as_is" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W5.5 ファイルの冒頭部分を表示
入力ファイル(JSLAB28_res.csv)を読み込んで、最初の15行分を表示させているだけです。
in_f <- "JSLAB28_res.csv" # 入力ファイル名
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 最初の15行分を表示
head(data, n = 15) # head関数の実行
# A tibble: 15 × 7
...1 Truth logratio K3 K4 K5 Frequency
<chr> <chr> <dbl> <chr> <chr> <chr> <dbl>
1 gene_1 DEG_A -2.03 cluster1 cluster2 cluster5 1
2 gene_2 DEG_A -2.27 cluster1 cluster4 cluster1 1
3 gene_3 DEG_A -1.68 cluster1 cluster2 cluster5 1
4 gene_4 DEG_A -3 cluster1 cluster3 cluster3 1
5 gene_5 DEG_A -2.89 cluster1 cluster4 cluster1 1
6 gene_6 DEG_A -2.50 cluster1 cluster2 cluster5 1
7 gene_7 DEG_A -2.18 cluster1 cluster2 cluster5 1
8 gene_8 DEG_A -4.94 cluster1 cluster4 cluster1 1
9 gene_9 DEG_A -2.58 cluster1 cluster4 cluster1 1
10 gene_10 DEG_A -1.90 cluster1 cluster2 cluster5 1
11 gene_11 DEG_A -0.499 cluster3 cluster3 cluster3 1
12 gene_12 DEG_A -2.37 cluster1 cluster2 cluster5 1
13 gene_13 DEG_A -0.542 cluster3 cluster3 cluster3 1
14 gene_14 DEG_A -3.21 cluster1 cluster4 cluster1 1
15 gene_15 DEG_A -3.17 cluster1 cluster2 cluster5 1
W5.6 出現順(図5b)
入力ファイルをはJSLAB28_res.csvから、JSLAB28_res2.csvに変えただけです。これは、Truth列が最初にDEG_Bとなるgene_2501の行をヘッダー行とgene_1の間に移動させただけです。
in_f <- "JSLAB28_res2.csv" # 入力ファイル名
param_order <- "as_is" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6 サンキー図の不具合例
W6.1 出現順(縦5×横5インチ;図6a)
入力ファイルはJSLAB28_res.csvです。基本的にW5.4と同じですが、最終の作図段階において、横幅と縦幅をともに5インチしています。htmlを見る限りでは、W5.4(図5a)のスクリプトと同一ですが、このhtml作成時に利用しているRmdファイルの中にRチャンクオプションとして「fig.width=5,
fig.height=5」が追加されています。
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "as_is" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.2 出現順(縦5×横5インチ;図6b)
入力ファイルは、JSLAB28_res2.csvです。基本的にW5.6と同じですが、最終の作図段階において、横幅と縦幅をともに5インチしています。htmlを見る限りでは、W5.6(図5b)のスクリプトと同一ですが、このhtml作成時に利用しているRmdファイルの中にRチャンクオプションとして「fig.width=5,
fig.height=5」が追加されています。
in_f <- "JSLAB28_res2.csv" # 入力ファイル名
param_order <- "as_is" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.3 出現順(縦8×横8インチ)
入力ファイルはJSLAB28_res.csvです。基本的にW6.1と同じですが、最終の作図段階において、横幅と縦幅をともに8インチしています。htmlを見る限りでは、W6.1(図6a)のスクリプトと同一ですが、このhtml作成時に利用しているRmdファイルの中にRチャンクオプションとして「fig.width=8,
fig.height=8」が追加されています。
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "as_is" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.4 出現順(縦8×横8インチ)
入力ファイルは、JSLAB28_res2.csvです。基本的にW6.2と同じですが、最終の作図段階において、横幅と縦幅をともに8インチしています。htmlを見る限りでは、W6.2(図6b)のスクリプトと同一ですが、このhtml作成時に利用しているRmdファイルの中にRチャンクオプションとして「fig.width=8,
fig.height=8」が追加されています。
in_f <- "JSLAB28_res2.csv" # 入力ファイル名
param_order <- "as_is" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.5 昇順(縦5×横5インチ)
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "ascending" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.6 昇順(縦8×横8インチ)
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "ascending" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.7 降順(縦5×横5インチ)
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "descending" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.8 降順(縦8×横8インチ)
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "descending" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.9 出現順(縦5×横7インチ)
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "as_is" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.10 昇順(縦7×横5インチ)
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "ascending" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

W6.11 昇順(縦9×横5インチ)
in_f <- "JSLAB28_res.csv" # 入力ファイル名
param_order <- "ascending" # ノードの並び(デフォルトは"ascending")
# 必要なパッケージをロード
library(tidyverse) # パッケージの読込
library(ggsankeyfier) # パッケージの読込
# 入力ファイルの読み込み
data <- read_csv(in_f) # in_fで指定したファイルの読込
# 前処理(描画させたい列情報の抽出とlong型への変換
matome <- pivot_stages_longer( # long型データへの変換
data = data, # 入力はdataオブジェクト
stages_from = c("Truth", "K3", "K4", "K5"), # 描画させたいカテゴリ名情報
values_from = "Frequency") # 頻度をカウントしたい列名情報
# 作図1(サンキー図の基本形まで作成した結果をgに格納)
pos <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order) # ノード名情報描画時の位置情報(ノードの並び)
g <- ggplot(data = matome, # ggplot関数実行結果をgに格納。入力はmatomeオブジェクト
mapping = aes(x = stage, y = Frequency, # matomeのstage列とFreqency列をx軸とy軸として利用
group = node, fill = node, # groupとfillは、matome内のnode列で行う(変更不要)
edge_id = edge_id, # edge_idはmatome内のedge_id列(変更不要)
connector = connector)) + # connectorはmatome内のconnector列(変更不要)
geom_sankeynode(position = pos) + # ノード情報を追加
geom_sankeyedge(position = pos) # エッジ情報を追加
# 作図2-1(ノードに付随する情報を描画する際に利用する微調整用のパラメータ作成)
# y軸の高さは入力ファイルの行数次第なので、nrow(data)の何%程度上下にずらすかという感じの計算をしている
# nudge_xとnudge_yは、x軸とy軸それぞれの方向に少しずらしたい値です(nudgeは小突くという意味)
nudge_val_y <- sum(data$Frequency)*0.020 # y軸上の描画位置をベースラインから上下にずらしたい高さの幅情報
pos1 <- position_sankey(v_space = "auto", # ノード名情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # ノード名情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = nudge_val_y) # ノード名情報描画時の位置情報(y軸情報の位置をnudge_val_y上にずらす)
pos2 <- position_sankey(v_space = "auto", # 頻度情報描画時の位置情報(ノード間の縦幅間隔は自動)
order = param_order, # ノード名情報描画時の位置情報(ノードの並び)
nudge_x = 0.06, # 頻度情報描画時の位置情報(x軸情報の位置を0.06右にずらす)
nudge_y = -nudge_val_y) # 頻度情報描画時の位置情報(y軸情報の位置をnudge_val_y下にずらす)
# 作図2-2(基本形gをベースとして、ノードに付随する情報を追加した結果をg2に格納)
# stat = "sankeynode"は、描画するのがノード情報だという指令
# label = nodeは、描画するのがノード名だという指令
# label = Freqは、描画するのがノードに付随する頻度値だという指令
# position = pos1は、微調整用情報としてpos1を利用せよという指令
# position = pos2は、微調整用情報としてpos2を利用せよという指令
# hjust = 0は、文字を左揃えで描画せよという指令(デフォルトは中央揃え)
# size = 4は、サイズ4にせよという指令(この値に応じてnudge_yも適宜調整する)
g2 <- g +
geom_text(aes(label = node), stat = "sankeynode", position = pos1, hjust = 0, size = 4) +
geom_text(aes(label = Frequency), stat = "sankeynode", position = pos2, hjust = 0, size = 4)
# 作図3(g2をベースとして、背景や凡例などを消すなどの調整を行った結果をg3に格納)
g3 <- g2 + theme_minimal() + # 背景を白に変更
theme(panel.grid = element_blank(), # グリッド線を消す
legend.position = 'none', # 凡例を消す
axis.title = element_blank(), # 軸のタイトルを消す
axis.text.y = element_blank(), # y軸のメモリ表示を消す
axis.text.x = element_text(size = 15)) # x軸(カテゴリ名)はサイズ15にせよ
g3

