Rのによるデータの入出力
カテゴリ:確率・統計学
Rを使って簡単な統計量を計算する方法とデータの入出力を紹介します。
データの入力方法
手動で入力
まずはデータを手入力してみます。Rを起動して以下のように命令します。
>A<-c(1,2,3,4,5)
c関数によって、ベクトルA=(1,2,3,4,5)が作成されます。このベクトルから
- 平均:mean(A)
- 中央値:median(A)
- 最大値:max(A)
- 最小値:min(A)
- 不偏分散:var(A)
- 不偏標準偏差:sd(A)
と様々な値を計算できるのでやってみてください。
エクセルのような行列形式で入力したい場合は、
>A<-c(1,2,3,4,5)
>B<-c(6,7,8,9,10)
>C<-c(“A”,”B”,”C”,”D”,”E”)
とベクトルをつくり
>Result<-data.frame(Kazu1=A,Kazu2=B,Moji=C)
とdata.frame関数を使います。そして、Resultを表示させると
>Result
Kazu1 Kazu2 Moji
1 1 6 A
2 2 7 B
3 3 8 C
4 4 9 D
5 5 10 E
と表示されます。
DATファイルを読み込む
では、DATファイルというタブで区切ったファイルを読み込んでみましょう。ちなみにCSVファイルはコンマ区切りです。
そのために、まずディレクトリを確認します。
>getwd()
これで現在のディレクトリがわかるので、その場所にCSVファイルを保存します。ディレクトリを変更したい場合は
>setwd(“ディレクトリ”)
で指定します。そして、以下のデータをメモ帳などでタブ区切りにしてファイルtest.datを保存してください。
X Y
1 2
3 4
5 6
7 8
あとは、
>DATA<-read.table(“test.dat”,header=TRUE)
とすれば、DATAに読み込んだデータが保存されます。ここでいうheaderとはX Yのことです。
もし、いきなりデータからなら,「header=FALSE」とします。
ファイルとして書き出す
ファイルとして書き出す場合は
>write.table(DATA,file=”new.dat”)
とすればOKです。
著者:安井 真人(やすい まさと)
@yasui_masatoさんをフォロー