講義の内容

 バイオスタティスティクス基礎論は、RとRStudioを用いて、実習形式で統計の初歩を学びます。Rは統計解析のためのコンピュータ言語で、RStudioはそれを利用するためのソフトウエアの一つです。Rをインストールするだけでも、R言語を使うことができますが、本講義ではRStudioを用いて授業を行います。

講義で扱う内容は、以下のとおりです。

  1. Rでデータを視覚化する(4月17日)
  2. 回帰分析、分散分析(4月24日)
  3. 主成分分析、多次元尺度構成法(5月1日)
  4. 階層的クラスタ解析、非階層的クラスタ解析(5月8日)

授業の進め方

ファイルは事前にダウンロードしてください

 各回の授業は、いずれも、テキスト(PDF、HTML、Google Docs)、Rコード(R)、データ(CSV)ファイルを用いて実習形式で進めていきます。全てのファイルについて、遅くとも講義の前日までには、アグリバイオのホームページおよびITC-LMSからダウンロードできるようにしておきます。講義の前に必ずダウンロードを行っておいて下さい。

授業は音声による説明を基本にして進めていきます

 本来であらば、映像も使いながら説明をすると分かりやすいかもしれませんが、本授業では、通信量を抑えるために、音声による説明をもとに進めていきます。zoomにはチャット機能もありますので、それで皆さんとのコミュニケーションをとりながら授業を進めていきたいと考えています。感じとしては、ラジオ番組のDJのような感じで授業ができれば理想的だと考えています。なお、顔の見えない受講生に向かって授業をするのは結構辛いところもあります。チャットでの質問、コメントよろしくお願いします。

 なお、テキストは、PDFも、HTMLも、Google Docsも全て同じ内容ですが、Google Docsの場合は、私がどこに焦点をあてて話を進めているかが分かるのが利点です。来週の授業のGoogle docs(準備中)は、次のリンクをクリックすると閲覧できます。 https://docs.google.com/document/d/1Ozj5aN-AyqXizBKHPSQlDM4--pX61jGemoQw2L6eK0M

Google Docsでは、下図のように、私がどの部分に焦点をあてているか(選択しているか)を見ることができます。

 授業では、私がテキストの特定の場所に焦点をあてながら進めていきます。皆さんは、テキストと同時に配布されるRコードを用いて、私の説明に従ってRコードを実行して下さい。なお、実行しているコードの説明、統計的な意味については、テキストにしたがって、私が音声で説明していきます。

授業の途中でクイズを行う予定です

 授業に、少しメリハリやゲーム性をつけるために、途中でクイズを実施します。ここでも、少し練習をしてみましょう。

  1. まず、 http://www.menti.com/ に行き、「66 49 24」というコードを入力して下さい。

  1. 次に、ニックネームを入れて、“Join quiz”をクリックして下さい。

  1. すると待機状態になります。しばらくするとクイズがはじまります。皆さんの健闘を祈ります。

なお、このクイズは一種のゲームで、成績評価には一切関係しません。楽しんで取り組んで下さい。

成績の評価

 成績の評価は、出席(ITC-LMSを用いて出席をとる予定です)と毎回出されるレポート(ITC-LMSを用いて提出してもらう予定です)をもとに評価します。

RとRStudioのインストール

Windowsの場合

Rのインストール

  1. まず、CRANのサイト https://cran.ism.ac.jp/ に移動します。
  2. “Download R for Windows”をクリックします。

  1. “base”を選択します。

  1. “Download R 3.6.3 for Windows”をクリックします。最新バージョンはそのときによって異なります。

  1. ダウンロードをするときは、「実行」ではなく、「保存」をして下さい。
  2. ダウンロードして保存されたファイルをクリックして、Rをインストールします。なお、必ず「管理者として実行」(管理者権限でインストール)してください。

  1. インストール時のオプションは、特に変更をする必要はありません。デフォルトの設定のままでインストールを進めていきます。

R Studioのインストール

  1. RStudioのダウンロードサイト https://rstudio.com/products/rstudio/ に移動します。
  2. 次に、“RStudio Desktop”をクリックします。

  1. “DOWNLOAD RSTUDIO DESKTOP”をクリックします。

  1. 一番左(フリー版のRStudio Desktop)の“DOWNLOAD”をクリックします。

  1. ダウンロードをするときは、「実行」ではなく、「保存」をして下さい。
  2. ダウンロードして保存されたファイルをクリックして、RStudioをインストールします。なお、必ず「管理者として実行」(管理者権限でインストール)してください。

  1. インストール時のオプションは、特に変更をする必要はありません。デフォルトの設定のままでインストールを進めていきます。

Mac OSの場合

Rのインストール

  1. まず、CRANのサイト https://cran.ism.ac.jp/ に移動します。
  2. “Download R for (MAC) OS X”をクリックします。

  1. 次の図の左下にある“R-3.6.3.pkg”をクリックします。最新バージョンはそのときによって、異なると思います。

  1. ダウンロードして保存されたファイルをクリックして、Rをインストールします。

  1. インストール時のオプションは、特に変更をする必要はありません。デフォルトの設定のままでインストールを進めていきます。

R Studioのインストール

  1. RStudioのダウンロードサイト https://rstudio.com/products/rstudio/ に移動します。
  2. 次に、“RStudio Desktop”をクリックします。

  1. “DOWNLOAD RSTUDIO DESKTOP”をクリックします。

  1. 一番左(フリー版のRStudio Desktop)の“DOWNLOAD”をクリックします。

  1. ダウンロードして保存されたファイルをクリックすると以下のように表示されます。あとは、RStudioをドラックして、Applicationsの上にドロップします。

RとRStudioを使ってみる

RとRStudioが動くことを確認する

ここからは、WindowsとMac OSを一緒にして説明していきます。それは、RStudioのインターフェースがWindowsとMac OSで一緒だからです。

まずは、左側のConsoleに、次のように打ち込んでみましょう。

3 + 4 * 2
## [1] 11

計算が実行され、結果が返ってきます。Rの使い方については、来週からの授業で詳しく説明するのでこのくらいにしておきましょう。

RとRStudioを講義で使うための準備をする

Rのパッケージをインストールする

Rは、そのままでもいろいろな統計解析を実施することができますが、パッケージとよばれる「拡張セット」のようなものをインストールすると、利用できる解析手法が大幅に広がります。ここでは、パッケージのインストールの仕方について説明します。なお、インストールを行うためには、パソコンがインターネットに接続されていなければなりません。

  1. RStudioのメニューのToolsから、“Install Packages”を選びます。

  1. そのあと示されるダイアログボックス(下図中央)のPackagesに、インストールしたいパッケージ名を入力します。ここでは、plotlyというパッケージをインストールしてみます。

  1. plotlyパッケージがダウロードされてインストールされます。

  1. 以下のコマンドをConsoleに打ち込んで、図を描いてみます。
library(plotly)
plot_ly(midwest, x = ~percollege, color = ~state, type = "box")

RStudioで実行すると、このように表示されます。

RのWorking Directoryを設定する

 Rでは、Rを実行する「作業場」“Working Directory”を指定しなければならない場合が少なくありません。これは、授業で使うRコードやデータをRが見つけられるようにするためです。ここでは、RStudioを使って、これを指定してみましょう。

まず最初に、以下のGoogle Driveから、使用するRコード(readData.R)とデータ(iris.csv)をダウンロードします。

https://drive.google.com/drive/u/2/folders/160TTfRf0Lz9qxm8vLdciiaYZmSOZr9BL

次に、これらのファイルをどこか自分の作業しやすいフォルダ(ディレクトリに移動してみましょう)。ここでは、デスクトップにRtempというフォルダを作って保存したとします。

RStudioで、このフォルダを“Working Directory”として指定するには、以下のようにします。

  1. RStudioの右側下にある「Files」というタブをクリックします。

  1. 「Home > Desktop」となっているところや、その下に示されているフォルダをクリックすることで、パソコン内にある様々なフォルダに移動できます。
  2. ここでは、「Rtemp」に移動したいので、Rtempをクリックします。保存しておいたRコードやデータのファイルがあることが分かります。
  3. Rコードやデータがある場所まで移動できたら、歯車型のアイコンの横に「More」と書いてあるところをクリックします。

  1. するとドロップダウンメニューが示されますので、「Set As Working Directory」を選びます。

  1. これで、“Working Directory”をデスクトップ上にあるRtempというフォルダにすることができました。

こうすることで、Rからデータファイルを簡単に読み込むことができるようになります。

まずは、Rコードを開いてみましょう。右下にある「readData.R」というファイルをクリックすると、左上に読み込んだコードが示されます。

このうち、最初の2行を選択して、実行してみましょう。実行は、Runというアイコンをクリックします。あるいは、Mac OSでは「command + return(enter)」、Windowsでは「cntl + enter(return)」でも実行できます。

うまく実行できると、以下のように表示されます。

ここまでできれば、来週の授業で躓くところは少ないでしょう。