おわりに

ver.0.4.3 (2025/6/30)

R markdown、Quartoの章を拡充し、9章分（35～43章）に記載しました。
章の変更に伴い、44～47章をずらしました。
tibbleの記載に不足があったため追記しました。

思っていた以上にQuartoの章が長くなりました。特に小分けにしたわけではないのですが、Quartoの内容拡充に伴い中身が長くなりました。思っていたより知らないYAMLやchunkがあり、勉強になりましたが、内容の確認等でもう少し修正が必要です。これ以上内容のあるものを書くのであれば、1冊丸々をQuartoに捧げないとダメそうですので、より詳細を知りたい方はQuartoのGuideやReferenceを参照いただければと思います。文章も書いたばかりで読みにくいかと思いますので、少しずつ修正いたします。

ver.0.4.2.3 (2025/5/2)

3章を5つ（3～8章）に分けました。
章の変更に伴い、各章の番号をずらしました。
faviconを作成し、本のimageを追加しました。

章立てを変更したため、リンクの接続を大幅に見直しました。リンク先が間違っている箇所があるかもしれません。Web上でチェックし、修正していく予定です。Quartoに関する部分を38章から独立させ、39章あたりに置こうと思っています。少し長くなりそうなので、Quartoだけで2～3章ぐらいになってしまうかもしれません。Quartoの章立てに従い、Shinyの章もずれる予定です。

ver.0.4.2 (2025/4/22)

25章にbinom.testとprop.testを追加しました。
26章のlm関数の記載、線形混合モデルの記載を修正しました。
githubへのリンク、twitter・facebookへのリンクを追加しました。

文書をGithub Pagesにデプロイした結果、自分で文章を見直す機会が増え、修正がはかどるようになりました。また、Google Analyticsへの接続の方法が分かりましたので、Google Analyticsでアクセスを確認できるようになりました。大体自分がアクセスしているようです。Google search consoleに登録はしているのですが、sitemapをGoogleが読みこんでくれず、Google検索でまだ引っかかってきません。人に見てもらえるようになるにはもう少しかかりそうです。

教科書を書くのはなかなか大変ではありますが、自分で書いた教科書ほど自分で読むものもありません。読めば読むほど理解と疑いが膨れていくため、非常に勉強になります。オンラインで見れるようにすると、いつでもどこでも自分専用の、自分が最も読みやすく感じる教科書が読めます。一連の手法についてまとめて学ぶのであれば教科書を書き、公開し、自分で何度も読むのが最もよいのではないかと思います。

その昔（2000年頃）、Googleで検索すれば何でもわかるようになりました。検索すればなんでもわかるのだから、記憶することに意味がなくなる、記憶の外部化が起こるんじゃないかと思っていました。2025年になっても未だに記憶することは重要で、記憶は外部化できていません。

2015年頃、Teslaが中心となって自動運転技術が進展しているように見えました。10年後には自動車はすべて自動運転になり、渋滞はなくなり、タクシーやバス、トラックの運転手はいなくなるんじゃないかと思っていました。2025年になっても自動運転は夢の技術で、未だに渋滞でブレーキペダルを踏んで時間をつぶしています。タクシーはともかくバスやトラックドライバーは人手が全く足りていません。

2025年現在、AI開発は花盛りで、AIを使いこなせなければ仕事がなくなる、AIが代替できる仕事はすべてなくなるとされています。正直、仕事などすべてAIに丸投げして、みんながベーシックインカムで生きる世の中になればハッピーなので、是非私の仕事など置き換えてもらいたいところではあります。しかし、上記の通り、思っているよりも技術をうまく使いこなすのは難しく、将来を予測するのはもっと難しいです。無意味な仕事を生み出しては消費していく社会はなかなか変わらず、記憶の外部化もなかなかできず、しばらくは今と大きく変わらない世の中のままなのでしょう。

そもそもAIに仕事を全部任せてしまうと、AIの契約を打ち切られたときに仕事が全く回らなくなります。アメリカのAIを使うにしても、中国のAIを使うにしても、AIが使えなくなるリスクがある限り、なかなか人を切ることはできないのかもしれません。

したがって、しばらくはAIに色々教えてもらいながら、ブレーキを踏み、この教科書を読み、知識を内部化し、生きていくことになりそうです。つらいので偉い人には早く何とかしてほしいところです。

ver.0.4.1 (2025/4/7)

19章（コーディング規約）を追記しました。
リンクの修正、関数の記載の間違い等を修正しました。

ver.0.4 (2025/3/18)

文書を修正し、github pagesで公開しました。

この文書をどうするべきか、しばらく悩んでいました。著作権的にはちょっと怪しげな部分があり（helpで表示されるコードとほぼ同じ部分がある、文献は引用はしているはず）、収益性のあるようなものにはできず、自分が勤めている企業のために作成したものであるものの、企業のコンプライアンス的に企業名などを出すのは難しい、しかし自社には読んでくれる人がいない。間違いがあるのも気になるところで、このまま放置してもよかったのですが、せっかく作ったものですので、公開してみることにしました。

この文で収益をあげる意思は全くなく、できればこのテキストをきっかけに参考文献・教科書を購入してRコミュニティに貢献してくれる方が増えるとよいなと考えています。

PythonがRの役割をほぼこなせるようになり、Rの居場所はなくなっていくのかもしれません。しかし、過去のプログラミング言語もなんだかんだで生き残っているものが多いです。Rがしぶとく生き残るために少しでも貢献できるとうれしいです。

ver 0.3 (2024/10/19)

33章（ネットワーク解析）を追加しました。
34章（Rmarkdown・Quarto）を追加しました。
35章（Shiny）を追加しました。
全体を読み直し、修正しました。

ネットワーク解析、Rmarkdown・Quarto、Shinyの解説を書くのに4か月、はじめから読み直して文書やコードを修正するのに2か月かかりました。特にネットワーク解析は一から勉強したのでなかなか大変でした。文章のボリュームが多すぎて、一度読み通すだけでもなかなか大変です。一から学ぶような場合を除けば、興味のある部分から読み進めてもらった方がよいかもしれません。特に地理空間情報、ネットワーク解析、Shinyあたりは使う人・使わない人が大きく分かれる分野のように思います。

この教科書は元々社内教育のために作成し始めたものです。大分ボリュームも大きくなりましたが、社内には読んでくれる人がほぼいません。せっかく作ったものですので、オンラインで公開する準備を進めたいと思います。

2024年のノーベル化学賞・物理学賞にAI関連の技術が選ばれたように、AI開発が花盛りといったところです。AIについては不勉強でよくわからないのですが、基本的には言語モデルであると理解しています。どのAIもGithubなどを学習していると思うので、RのスクリプトもAIに聞けば教えてくれる時代になっていくのだと思います。そのうちAIが機械語を直接書き出すかもしれません。そうなるとAIのやっていることが完全にブラックボックスになってしまうので、未来は面白いことになりそうです。

将来的にAIで直接統計ができるようになるのは間違いないですが、もうしばらくは統計を行うためにRのスクリプトを教えてもらうような使い方が続くんじゃないかなと思います。また、秘密情報の関係でデータをAIに教えられない場合も多々あります。大企業であれば秘密情報を投げられるAIを契約できても、中小企業や個人経営者、大学の研究者などがそのような契約に大金を支払うのは難しいでしょう。

そもそもAIはとてつもなく計算力を食います。つまり全くエコではないので、大企業がエコを歌いながらAIを使い倒す、というのも何だか矛盾しているように思います。早く仕事も研究もAIにバトンタッチしたいところではありますが、そこらへんにいるヒトはArtificialではないですが、運動機能付きのIntelligenceです。精々2000 kcal/日ぐらいで動くIntelligenceであるヒトを使う方がエコなので、まだしばらくはヒトが働く時代が続くのでしょう。まあ、エネルギー面以外ではヒトは非エコですが…。

特に大学の研究者などは、分析をAI任せにはなかなかできません。データを説明可能にすることも研究者の役割の一つです。AIが吐き出してくれた統計のためのスクリプトを理解するために、しばらくはこのような教科書も有用なのではないかと思います。

ver 0.2（2024/4/14）

31章（purrr）を追加しました。
32章（地理空間情報）を追加しました。
26章にspline回帰と加法モデルについての内容を追記しました。

一般化加法モデル（Generalized Additive Model）については名前は知っていたものの、内容がよくわかっていなかったため以前は記載していませんでした。教科書を読んでわかったことを簡単に表記しています。ただし、スクリプト上ではOzoneが正規分布していないのに正規分布しているようなモデルになっています。いずれ修正します。また、同様によくわかっていなかったpurrrと地理空間情報の取り扱いについても学習し、入門の内容程度のものをまとめました。正直purrrを活用しきれる気があまりしません。apply関数群ですらいまいち使えていないのに…。あと3章（ネットワーク解析、Quartoとrmarkdown、Shiny）ほど書いたらどこかにデプロイしようと思います。

ver 0.1（2024/2/19）

とりあえずRプログラミングの基礎、統計の基礎について最低限の内容は記載したので、公開することとします。内容には（特に統計に関わる24章以降は）間違いがあると思います。できれば手元に統計の教科書（少なくとも統計学入門（基礎統計学Ⅰ）(東京大学教養学部統計学教室 1991)）を置いて、統計的な正しさを確認しながら読んでいただければ幸いです。

Rではここ10年ぐらいで様々なことができるようになりました。このテキストにはまだ記載していませんが、RmarkdownやQuartoといったライブラリを用いればhtmlやwordの文章を、Shinyというライブラリを用いればWebアプリケーションを、Plumberを用いればweb APIを作成することができ、やや「普通のプログラミング言語」に近づいた感じがあります。ただし、RStudioがPositという社名に変更になり、Pythonにも注力し始めたことから、Rが主要な統計プログラミング言語であり続けられるかどうかは微妙なところです。2010年ぐらいまではPythonは2.0から3.0への移行で躓いていたため、統計や機械学習をRで行うのはそれほど不自然ではありませんでしたが、2023年現在では機械学習はほぼPythonで行うものとなり、統計もかなりPythonでできることが増えています。Pythonは汎用言語であり、Rよりもずっと「何でもできる」言語です。RがPythonに立場を完全に奪われるのか、RはRなりに生き延びるのか微妙なところではありますが、このテキストがRを生き延びさせる一助になれば良いなあと考えております。

教科書を書いて思ったこととしては、我ながらRのことも統計のことも全くわかっていないということです。学べば学ぶほど、よくわからないことが増えるのはどの分野でも同じですが、Rと統計に関してはほとんど独学で、人に学んだ経験がほとんどないため、書けば書くほどよくわからなくなっていく感が強いです。自分の専門であった基礎生物学であれば、細胞の分子生物学を一冊読めばある程度の基礎はわかり、もっと専門的なことは論文を読んでおけば学習はできるのですが、統計は手法ごとに教科書があり、数学的なバックグラウンドを求められるため、なかなか学びを進めるのが難しいものです。

とはいえ、私が始めに統計を学んだときよりもわかりやすい教科書が増え、勉強がしやすくなったとは感じます。このテキストも入門としては必要最低限のところは抑えているつもりですが、できれば参考文献に記載した教科書や、Amazon等で検索し、教科書を数冊読んでみることをおススメします。このテキストを入口として、Rと統計を学ぶ人が増えればと感じます。

# おわりに {.unnumbered} ## ver.0.4.3 (2025/6/30) - R markdown、Quartoの章を拡充し、9章分（35～43章）に記載しました。 - 章の変更に伴い、44～47章をずらしました。 - tibbleの記載に不足があったため追記しました。思っていた以上にQuartoの章が長くなりました。特に小分けにしたわけではないのですが、Quartoの内容拡充に伴い中身が長くなりました。思っていたより知らないYAMLやchunkがあり、勉強になりましたが、内容の確認等でもう少し修正が必要です。これ以上内容のあるものを書くのであれば、1冊丸々をQuartoに捧げないとダメそうですので、より詳細を知りたい方は[QuartoのGuide](https://quarto.org/docs/guide/)や[Reference](https://quarto.org/docs/reference/index.html)を参照いただければと思います。文章も書いたばかりで読みにくいかと思いますので、少しずつ修正いたします。 ## ver.0.4.2.3 (2025/5/2) - 3章を5つ（3～8章）に分けました。 - 章の変更に伴い、各章の番号をずらしました。 - [favicon](https://ja.wikipedia.org/wiki/Favicon)を作成し、本のimageを追加しました。章立てを変更したため、リンクの接続を大幅に見直しました。リンク先が間違っている箇所があるかもしれません。Web上でチェックし、修正していく予定です。Quartoに関する部分を38章から独立させ、39章あたりに置こうと思っています。少し長くなりそうなので、Quartoだけで2～3章ぐらいになってしまうかもしれません。Quartoの章立てに従い、Shinyの章もずれる予定です。 ## ver.0.4.2 (2025/4/22) - 25章に`binom.test`と`prop.test`を追加しました。 - 26章の`lm`関数の記載、線形混合モデルの記載を修正しました。 - githubへのリンク、twitter・facebookへのリンクを追加しました。文書をGithub Pagesにデプロイした結果、自分で文章を見直す機会が増え、修正がはかどるようになりました。また、[Google Analyticsへの接続の方法](https://quarto.org/docs/reference/projects/websites.html)が分かりましたので、[Google Analytics](https://developers.google.com/analytics?hl=ja)でアクセスを確認できるようになりました。大体自分がアクセスしているようです。[Google search console](https://search.google.com/search-console/welcome?hl=JA)に登録はしているのですが、sitemapをGoogleが読みこんでくれず、Google検索でまだ引っかかってきません。人に見てもらえるようになるにはもう少しかかりそうです。教科書を書くのはなかなか大変ではありますが、自分で書いた教科書ほど自分で読むものもありません。読めば読むほど理解と疑いが膨れていくため、非常に勉強になります。オンラインで見れるようにすると、いつでもどこでも自分専用の、自分が最も読みやすく感じる教科書が読めます。一連の手法についてまとめて学ぶのであれば教科書を書き、公開し、自分で何度も読むのが最もよいのではないかと思います。その昔（2000年頃）、Googleで検索すれば何でもわかるようになりました。検索すればなんでもわかるのだから、記憶することに意味がなくなる、記憶の外部化が起こるんじゃないかと思っていました。2025年になっても未だに記憶することは重要で、記憶は外部化できていません。 2015年頃、[Tesla](https://www.tesla.com/ja_jp)が中心となって自動運転技術が進展しているように見えました。10年後には自動車はすべて自動運転になり、渋滞はなくなり、タクシーやバス、トラックの運転手はいなくなるんじゃないかと思っていました。2025年になっても自動運転は夢の技術で、未だに渋滞でブレーキペダルを踏んで時間をつぶしています。タクシーはともかくバスやトラックドライバーは人手が全く足りていません。 2025年現在、AI開発は花盛りで、AIを使いこなせなければ仕事がなくなる、AIが代替できる仕事はすべてなくなるとされています。正直、仕事などすべてAIに丸投げして、みんながベーシックインカムで生きる世の中になればハッピーなので、是非私の仕事など置き換えてもらいたいところではあります。しかし、上記の通り、思っているよりも技術をうまく使いこなすのは難しく、将来を予測するのはもっと難しいです。無意味な仕事を生み出しては消費していく社会はなかなか変わらず、記憶の外部化もなかなかできず、しばらくは今と大きく変わらない世の中のままなのでしょう。そもそもAIに仕事を全部任せてしまうと、AIの契約を打ち切られたときに仕事が全く回らなくなります。アメリカのAIを使うにしても、中国のAIを使うにしても、AIが使えなくなるリスクがある限り、なかなか人を切ることはできないのかもしれません。したがって、しばらくはAIに色々教えてもらいながら、ブレーキを踏み、この教科書を読み、知識を内部化し、生きていくことになりそうです。つらいので偉い人には早く何とかしてほしいところです。 ## ver.0.4.1 (2025/4/7) - 19章（コーディング規約）を追記しました。 - リンクの修正、関数の記載の間違い等を修正しました。 ## ver.0.4 (2025/3/18) - 文書を修正し、github pagesで公開しました。この文書をどうするべきか、しばらく悩んでいました。著作権的にはちょっと怪しげな部分があり（helpで表示されるコードとほぼ同じ部分がある、文献は引用はしているはず）、収益性のあるようなものにはできず、自分が勤めている企業のために作成したものであるものの、企業のコンプライアンス的に企業名などを出すのは難しい、しかし自社には読んでくれる人がいない。間違いがあるのも気になるところで、このまま放置してもよかったのですが、せっかく作ったものですので、公開してみることにしました。この文で収益をあげる意思は全くなく、できればこのテキストをきっかけに参考文献・教科書を購入してRコミュニティに貢献してくれる方が増えるとよいなと考えています。 PythonがRの役割をほぼこなせるようになり、Rの居場所はなくなっていくのかもしれません。しかし、過去のプログラミング言語もなんだかんだで生き残っているものが多いです。Rがしぶとく生き残るために少しでも貢献できるとうれしいです。 ## ver 0.3 (2024/10/19) - 33章（ネットワーク解析）を追加しました。 - 34章（Rmarkdown・Quarto）を追加しました。 - 35章（Shiny）を追加しました。 - 全体を読み直し、修正しました。ネットワーク解析、Rmarkdown・Quarto、Shinyの解説を書くのに4か月、はじめから読み直して文書やコードを修正するのに2か月かかりました。特にネットワーク解析は一から勉強したのでなかなか大変でした。文章のボリュームが多すぎて、一度読み通すだけでもなかなか大変です。一から学ぶような場合を除けば、興味のある部分から読み進めてもらった方がよいかもしれません。特に地理空間情報、ネットワーク解析、Shinyあたりは使う人・使わない人が大きく分かれる分野のように思います。この教科書は元々社内教育のために作成し始めたものです。大分ボリュームも大きくなりましたが、社内には読んでくれる人がほぼいません。せっかく作ったものですので、オンラインで公開する準備を進めたいと思います。 [2024年のノーベル化学賞・物理学賞](https://www.nobelprize.org/all-nobel-prizes-2024/)にAI関連の技術が選ばれたように、AI開発が花盛りといったところです。AIについては不勉強でよくわからないのですが、基本的には言語モデルであると理解しています。どのAIもGithubなどを学習していると思うので、RのスクリプトもAIに聞けば教えてくれる時代になっていくのだと思います。そのうちAIが機械語を直接書き出すかもしれません。そうなるとAIのやっていることが完全にブラックボックスになってしまうので、未来は面白いことになりそうです。将来的にAIで直接統計ができるようになるのは間違いないですが、もうしばらくは統計を行うためにRのスクリプトを教えてもらうような使い方が続くんじゃないかなと思います。また、秘密情報の関係でデータをAIに教えられない場合も多々あります。大企業であれば秘密情報を投げられるAIを契約できても、中小企業や個人経営者、大学の研究者などがそのような契約に大金を支払うのは難しいでしょう。そもそもAIはとてつもなく計算力を食います。つまり全くエコではないので、大企業がエコを歌いながらAIを使い倒す、というのも何だか矛盾しているように思います。早く仕事も研究もAIにバトンタッチしたいところではありますが、そこらへんにいるヒトはArtificialではないですが、運動機能付きのIntelligenceです。精々2000 kcal/日ぐらいで動くIntelligenceであるヒトを使う方がエコなので、まだしばらくはヒトが働く時代が続くのでしょう。まあ、エネルギー面以外ではヒトは非エコですが…。特に大学の研究者などは、分析をAI任せにはなかなかできません。データを説明可能にすることも研究者の役割の一つです。AIが吐き出してくれた統計のためのスクリプトを理解するために、しばらくはこのような教科書も有用なのではないかと思います。 ## ver 0.2（2024/4/14） - 31章（`purrr`）を追加しました。 - 32章（地理空間情報）を追加しました。 - 26章にspline回帰と加法モデルについての内容を追記しました。一般化加法モデル（Generalized Additive Model）については名前は知っていたものの、内容がよくわかっていなかったため以前は記載していませんでした。教科書を読んでわかったことを簡単に表記しています。ただし、スクリプト上ではOzoneが正規分布していないのに正規分布しているようなモデルになっています。いずれ修正します。また、同様によくわかっていなかった`purrr`と地理空間情報の取り扱いについても学習し、入門の内容程度のものをまとめました。正直`purrr`を活用しきれる気があまりしません。`apply`関数群ですらいまいち使えていないのに…。あと3章（ネットワーク解析、Quartoとrmarkdown、Shiny）ほど書いたらどこかにデプロイしようと思います。 ## ver 0.1（2024/2/19）とりあえずRプログラミングの基礎、統計の基礎について最低限の内容は記載したので、公開することとします。内容には（特に統計に関わる24章以降は）間違いがあると思います。できれば手元に統計の教科書（少なくとも統計学入門（基礎統計学Ⅰ）[@東京大学教養学部統計学教室1991-07-09]）を置いて、統計的な正しさを確認しながら読んでいただければ幸いです。 Rではここ10年ぐらいで様々なことができるようになりました。このテキストにはまだ記載していませんが、RmarkdownやQuartoといったライブラリを用いればhtmlやwordの文章を、Shinyというライブラリを用いればWebアプリケーションを、Plumberを用いればweb APIを作成することができ、やや「普通のプログラミング言語」に近づいた感じがあります。ただし、RStudioがPositという社名に変更になり、Pythonにも注力し始めたことから、Rが主要な統計プログラミング言語であり続けられるかどうかは微妙なところです。2010年ぐらいまではPythonは2.0から3.0への移行で躓いていたため、統計や機械学習をRで行うのはそれほど不自然ではありませんでしたが、2023年現在では機械学習はほぼPythonで行うものとなり、統計もかなりPythonでできることが増えています。Pythonは汎用言語であり、Rよりもずっと「何でもできる」言語です。RがPythonに立場を完全に奪われるのか、RはRなりに生き延びるのか微妙なところではありますが、このテキストがRを生き延びさせる一助になれば良いなあと考えております。教科書を書いて思ったこととしては、我ながらRのことも統計のことも全くわかっていないということです。学べば学ぶほど、よくわからないことが増えるのはどの分野でも同じですが、Rと統計に関してはほとんど独学で、人に学んだ経験がほとんどないため、書けば書くほどよくわからなくなっていく感が強いです。自分の専門であった基礎生物学であれば、[細胞の分子生物学](https://www.amazon.co.jp/%E7%B4%B0%E8%83%9E%E3%81%AE%E5%88%86%E5%AD%90%E7%94%9F%E7%89%A9%E5%AD%A6-%E7%AC%AC6%E7%89%88-ALBERTS/dp/4315520624/ref=sr_1_1?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&crid=1SKEGGW11UQ9G&keywords=%E7%B4%B0%E8%83%9E%E3%81%AE%E5%88%86%E5%AD%90%E7%94%9F%E7%89%A9%E5%AD%A6&qid=1707651654&sprefix=%E7%B4%B0%E8%83%9E%E3%81%AE%E5%88%86%E5%AD%90%E7%94%9F%E7%89%A9%E5%AD%A6%2Caps%2C181&sr=8-1)を一冊読めばある程度の基礎はわかり、もっと専門的なことは論文を読んでおけば学習はできるのですが、統計は手法ごとに教科書があり、数学的なバックグラウンドを求められるため、なかなか学びを進めるのが難しいものです。とはいえ、私が始めに統計を学んだときよりもわかりやすい教科書が増え、勉強がしやすくなったとは感じます。このテキストも入門としては必要最低限のところは抑えているつもりですが、できれば[参考文献](./references.html)に記載した教科書や、[Amazon](https://www.amazon.co.jp/)等で検索し、教科書を数冊読んでみることをおススメします。このテキストを入口として、Rと統計を学ぶ人が増えればと感じます。