バイオスタティスティクス基礎論は、RとRStudioを用いて、実習形式で統計の初歩を学びます。Rは統計解析のためのコンピュータ言語で、RStudioはそれを利用するためのソフトウエアの一つです。Rをインストールするだけでも、R言語を使うことができますが、本講義ではRStudioを用いて授業を行います。
講義で扱う内容は、以下のとおりです。
各回の授業は、いずれも、テキスト(PDF、HTML、Google Docs)、Rコード(R)、データ(CSV)ファイルを用いて実習形式で進めていきます。全てのファイルについて、遅くとも講義の前日までには、アグリバイオのホームページおよびITC-LMSからダウンロードできるようにしておきます。講義の前に必ずダウンロードを行っておいて下さい。
本来であらば、映像も使いながら説明をすると分かりやすいかもしれませんが、本授業では、通信量を抑えるために、音声による説明をもとに進めていきます。zoomにはチャット機能もありますので、それで皆さんとのコミュニケーションをとりながら授業を進めていきたいと考えています。感じとしては、ラジオ番組のDJのような感じで授業ができれば理想的だと考えています。なお、顔の見えない受講生に向かって授業をするのは結構辛いところもあります。チャットでの質問、コメントよろしくお願いします。
なお、テキストは、PDFも、HTMLも、Google Docsも全て同じ内容ですが、Google Docsの場合は、私がどこに焦点をあてて話を進めているかが分かるのが利点です。来週の授業のGoogle docs(準備中)は、次のリンクをクリックすると閲覧できます。 https://docs.google.com/document/d/1Ozj5aN-AyqXizBKHPSQlDM4--pX61jGemoQw2L6eK0M
Google Docsでは、下図のように、私がどの部分に焦点をあてているか(選択しているか)を見ることができます。
授業では、私がテキストの特定の場所に焦点をあてながら進めていきます。皆さんは、テキストと同時に配布されるRコードを用いて、私の説明に従ってRコードを実行して下さい。なお、実行しているコードの説明、統計的な意味については、テキストにしたがって、私が音声で説明していきます。
授業に、少しメリハリやゲーム性をつけるために、途中でクイズを実施します。ここでも、少し練習をしてみましょう。
なお、このクイズは一種のゲームで、成績評価には一切関係しません。楽しんで取り組んで下さい。
成績の評価は、出席(ITC-LMSを用いて出席をとる予定です)と毎回出されるレポート(ITC-LMSを用いて提出してもらう予定です)をもとに評価します。
ここからは、WindowsとMac OSを一緒にして説明していきます。それは、RStudioのインターフェースがWindowsとMac OSで一緒だからです。
まずは、左側のConsoleに、次のように打ち込んでみましょう。
3 + 4 * 2
## [1] 11
計算が実行され、結果が返ってきます。Rの使い方については、来週からの授業で詳しく説明するのでこのくらいにしておきましょう。
Rは、そのままでもいろいろな統計解析を実施することができますが、パッケージとよばれる「拡張セット」のようなものをインストールすると、利用できる解析手法が大幅に広がります。ここでは、パッケージのインストールの仕方について説明します。なお、インストールを行うためには、パソコンがインターネットに接続されていなければなりません。
library(plotly)
plot_ly(midwest, x = ~percollege, color = ~state, type = "box")
RStudioで実行すると、このように表示されます。
Rでは、Rを実行する「作業場」“Working Directory”を指定しなければならない場合が少なくありません。これは、授業で使うRコードやデータをRが見つけられるようにするためです。ここでは、RStudioを使って、これを指定してみましょう。
まず最初に、以下のGoogle Driveから、使用するRコード(readData.R)とデータ(iris.csv)をダウンロードします。
https://drive.google.com/drive/u/2/folders/160TTfRf0Lz9qxm8vLdciiaYZmSOZr9BL
次に、これらのファイルをどこか自分の作業しやすいフォルダ(ディレクトリに移動してみましょう)。ここでは、デスクトップにRtempというフォルダを作って保存したとします。
RStudioで、このフォルダを“Working Directory”として指定するには、以下のようにします。
こうすることで、Rからデータファイルを簡単に読み込むことができるようになります。
まずは、Rコードを開いてみましょう。右下にある「readData.R」というファイルをクリックすると、左上に読み込んだコードが示されます。
このうち、最初の2行を選択して、実行してみましょう。実行は、Runというアイコンをクリックします。あるいは、Mac OSでは「command + return(enter)」、Windowsでは「cntl + enter(return)」でも実行できます。
うまく実行できると、以下のように表示されます。
ここまでできれば、来週の授業で躓くところは少ないでしょう。