データサイエンスにおいてはデータそのものや結果の可視化が非常に重要です。この記事では、統計ソフトRを使ったグラフの書き方について紹介します。
Rについての専門的な技術がなくてもグラフを書くことができるツールも後半で紹介しています。
Rを使った作図の概略
Rはもともと統計学用の計算ツールとして公開されましたが、オープンソースで誰でも利用可能だったこともあり急速に普及し、今ではデータサイエンスを行う上で避けては通れないツールになりました。
継続的なアップデートや、有志が公開するパッケージの結果、統計以外にもさまざまなことができるようになっています。
グラフ関係でよく使われるRのパッケージとしてggplot2やplotlyなどがあります。
これはいずれも非常に多機能でさまざまなことができますが、どちらも専用のコマンドを使ってスクリプトを書かなければならず、慣れていない人にとっては少し敷居が高いとも言えます。
R Graphical Manualを使ってコピペで作図
そこでオススメしたいのがR Graphical Manualです。
サイトにアクセスするとこのようにたくさんのグラフが表示されます。
これは、G Graphical Manualに収録されているグラフの一部が表示されていて、全部で25000以上のグラフがあります。
この中から作りたいグラフに似たものを選んでクリックすると、そのグラフを書くためのコードが表示されるので、これをコピペして必要なところを書き換えれば目的のグラフを書くことができます。
R Graphical Manualの使い方を説明した動画もあるので合わせてご覧ください。
スクリプトを一切かからずにRで作図をする方法
さらに、スクリプトを一切書かないでも作図を直感的に行うことができるツールも登場しています。
その1つが、自治医科大学が公開しているEZR (Easy R)です。
EZRは、Rの文法を覚えなくてもある程度の統計解析を直感的にできるようにしたツールで、すでにいろいろなところで使われ始めており、解説動画もあります。
本の方がいいという方も、いくつかEZRの解説本も出ているので勉強することができます。
このEZRは統計解析だけでなく直感的にグラフを書くこともできるので、試してみるといいでしょう。
もう1つご紹介したいのがBoxPlotRです。これはwebベースのツールで、棒グラフや箱ひげ図など、いくつかの図を簡単に書くことができます。
論文発表もされており、学術的にも一定の評価は得ています (BoxPlotR: a web tool for generation of box plots. Nat. Methods 2014)
関連図書
この記事に関連した内容を紹介している本はこちらです。
まとめ
最後に今回の内容をまとめます。
- 統計ソフトRにはggplot2などグラフを書くためのパッケージがある
- R Graphical Manualを使えばコピペで作図ができる
- GUIベースでグラフがかけるEZRやBoxPlotRもある
今日も【生命医学をハックする】 (@biomedicalhacks) をお読みいただきありがとうございました。