Rで計量政治学入門
はじめに
想定する読者
Tidyverseについて
ウェブサイトの操作
I データの操作
1
データの読み込み
1.1
パッケージ付属のデータ
1.2
主なデータ形式*
1.2.1
テキストデータ
1.2.2
バイナリデータ
1.2.3
Good bye, Excel!
1.3
パスと作業ディレクトリ
1.3.1
パス
1.3.2
作業ディレクトリ
1.4
.csvファイルの読み込み
1.4.1
変数名の適切な読み込み
1.5
.xls[x]ファイルの読み込み
1.5.1
シートの選択
1.5.2
変数名の適切な読み込み (again)
1.5.3
欠損値の処理
1.6
.dtaファイルの読み込み
1.7
.rdsファイルの読み込み
1.8
パス入力の省略*
1.9
データの書き出し
1.10
データフレームの作成
2
変数の選択
2.1
変数名による選択
2.2
番号による選択
2.3
変数名の変更
2.4
高度な変数の選択方法*
3
変数の作成
3.1
四則演算
3.2
条件に基づく変数
3.3
ラグ変数*
3.4
日付変数*
4
観察の選択
4.1
数値の大小による選択
4.2
一致・不一致による選択
4.3
「または」
4.4
「かつ」
4.5
部分集合
4.6
番号による選択
4.7
観察の並び替え
4.8
ベクトルの選択*
5
データの結合
5.1
行方向の結合
5.2
列方向の結合
5.2.1
観察の選択**
5.2.2
データフレームの作成
6
欠損値の扱い
6.1
欠損値を読み込む
6.2
欠損値を含む観察を除外する
6.3
欠損値を置き換える
6.4
欠損値がある場合の分析*
6.4.1
一変数の記述統計
6.4.2
二変数の記述統計
6.4.3
回帰分析
6.5
欠損値のクラス*
7
ロング・ワイドの変換
7.1
パネルデータ
7.1.1
ワイド形式
7.1.2
ロング形式
7.1.3
前処理
7.2
ループによる方法
7.2.1
for文
7.2.2
時点の選択による方法
7.2.3
ユニットの選択による方法
7.3
tidyverseな方法
7.3.1
ワイドからロングへ
7.3.2
パイプ
7.3.3
tidyverseの利点
7.3.4
ロングからワイドへ
8
Qualtricsデータの処理
8.1
Qualtricsのデータ
8.2
気合による方法
8.3
ループによる方法
8.4
tidyverseな方法
8.5
おまけ
II データの可視化
9
データの要約
9.1
データを見る
9.2
記述統計
9.2.1
平均
9.2.2
分散と標準偏差
9.2.3
分位点
9.2.4
記述統計表
9.3
データのカウント
9.4
グループごとの要約
9.5
ユニークなデータ*
10
分布のグラフ
10.1
ヒストグラム
10.2
カーネル密度
10.3
棒グラフ
10.4
グループごとの分布
11
相関のグラフ
11.1
散布図
11.2
カーネル密度
11.3
ジッター
11.4
箱ひげ図
11.5
バイオリンプロット
11.6
グループごとの相関
11.7
単回帰
12
時系列のグラフ
12.1
折れ線グラフ
12.2
エラーバー
12.3
グループごとの時系列
13
地図のグラフ
13.1
地図
13.1.1
世界地図
13.1.2
日本地図
13.1.3
都道府県地図
13.2
地域の違い
13.3
空間の分布
13.4
データの繋がり
13.4.1
二点間の繋がりを見る
13.4.2
経路を見る
14
ggplot2いろいろ
14.1
テーマ
14.2
色
14.3
パネルの分割
14.3.1
記述統計のグラフ
14.4
ラベル
14.5
凡例
14.6
強調
14.7
テキスト
III データの収集
15
Googleデータ
15.1
はじめに
15.2
時系列トレンド
15.2.1
一つの単語
15.2.2
複数の単語
15.3
地域別のトレンド
15.4
関連単語
15.5
検索ヒット数*
15.6
Nグラム
16
Wikipediaデータ
16.1
Wikipediaのトレンド
16.2
Wikipediaの記事の情報
16.3
Wikipediaの記事
16.4
Wikipediaの記事のリンク
16.5
Wikipediaの記事の作成日の取得*
IV Appendix
17
Rの分析環境
17.1
Rのインストール
17.1.1
ダウンロード
17.1.2
インストール
17.2
RStudioのインストール
17.2.1
ダウンロード
17.2.2
インストール
17.2.3
RStudioの起動
17.2.4
RStudio Cloud*
17.3
再現可能な分析のために
17.3.1
Rスクリプト
17.3.2
Rプロジェクト
17.3.3
RStudioの設定*
18
Rプログラミング入門
18.1
関数
18.1.1
総称関数*
18.2
オブジェクト
18.3
パッケージ
18.3.1
CRANからのインストール
18.3.2
GitHubからのインストール*
18.3.3
パッケージの読み込み
18.3.4
tidyverse
とは*
19
Rプログラミング応用
19.1
オブジェクトのクラス
19.2
関数の作成
19.3
ループ
19.4
条件分岐
19.5
練習問題
19.5.1
フィボナッチ数列
19.5.2
モンテカルロ・シミュレーション
20
R Markdown: html
20.1
R Markdownファイルの作成
20.1.1
参考になるサイト
20.2
Markdown記法
20.2.1
Markdownとは*
20.2.2
セクション
20.2.3
パラグラフ
20.2.4
箇条書き
20.2.5
文字の強調
20.2.6
引用
20.2.7
リンク
20.2.8
画像、表
20.2.9
数式
20.3
Rチャンク
20.3.1
チャンクオプション
20.4
yamlヘッダー
20.4.1
output
20.4.2
目次
20.4.3
テーマ
20.4.4
htmlとcss
20.5
その他のテンプレート
20.5.1
Distill
20.5.2
Tufte Handout
20.5.3
rmdformats
20.5.4
スライド
20.5.5
ダッシュボード
20.5.6
Microsoft Office
21
R Markdown: pdf
21.1
LaTeXの導入
21.1.1
tinytexのインストール
21.1.2
タイプセット
21.2
日本語環境の構築
21.2.1
LaTeXエンジンのあれこれ*
21.2.2
yamlヘッダー
21.2.3
フォントのインストール
21.2.4
その他のテンプレート
21.2.5
Sumatra PDF
21.3
スライドの作成
21.3.1
テーマ
21.4
LaTeX記法
21.4.1
定理環境
21.4.2
数式
21.5
参考文献と引用
21.5.1
.bibファイル
21.5.2
文献の引用
21.5.3
日本語文献の引用
22
Rのエンコーディング問題
22.1
なぜ文字化けが起こるのか
22.1.1
エンコーディング
22.1.2
RとRStudioにおける問題
22.2
Rスクリプトの文字化け
22.2.1
ファイルを開く
22.2.2
ファイルを保存する
22.3
データの文字化け
22.3.1
標準関数の場合
22.3.2
tidyverseの場合
22.3.3
エンコーディングを確認する方法
22.3.4
もとのデータを見たい場合
22.3.5
データを保存する場合
22.4
その他の問題
22.4.1
アカウント名が日本語の場合
22.4.2
画像で日本語が文字化けする場合
23
パイプ演算子
%>%
について
23.1
基本的な使い方
23.2
データの代入
23.3
左辺の参照
23.4
複数の出力
24
WindowsでR/RStudioをちゃんと使う方法
24.1
はじめに
24.1.1
問題
24.1.2
Linux上のR/RStudioを使う
24.1.3
概要
24.2
WSL2のインストール
24.3
Rのインストール
24.4
RStusio Serverのインストール
24.5
RStudio Server on WSL2の注意点
24.5.1
パッケージのインストール
24.5.2
警告メッセージ
24.5.3
日本語フォント
24.5.4
Windows側のファイルへのアクセス
動作環境
参考文献
© 2020 Shohei Doi
Rで計量政治学入門
参考文献