🌱 一、什麼是R語言?
- R 是一種免費開源的編程語言和軟件環境,主要用於統計計算和圖形繪製。
- 廣泛應用於數據科學、生物信息學、金融分析、社會科學等領域。
- 擁有豐富的擴展包(CRAN 上超過 20,000 個包)。
🛠️ 二、安裝與環境準備
- 下載 R
根據你的操作系統(Windows / macOS / Linux)下載並安裝。 - 推薦使用 RStudio(集成開發環境 IDE)
RStudio 讓寫代碼、查看數據、畫圖更方便。
📚 三、零基礎學習路徑(建議順序)
第1步:熟悉基本語法
- 變量賦值:
x <- 5 - 數據類型:數值(numeric)、字符(character)、邏輯(logical)、因子(factor)
- 數據結構:
- 向量
c(1,2,3) - 矩陣
matrix() - 數據框
data.frame()(最常用) - 列表
list()
✅ 練習:創建一個包含姓名、年齡、性別的數據框。
df <- data.frame(
name = c("張三", "李四", "王五"),
age = c(25, 30, 28),
gender = c("男", "女", "男")
)
print(df)
第2步:基礎操作
- 讀取數據:
read.csv("file.csv") - 查看數據:
head(),str(),summary() - 子集選取:
df[df$age > 25, ] - 常用函數:
mean(),sd(),table(),plot()
第3步:數據可視化(基礎)
使用內置繪圖系統或 ggplot2 包(更強大美觀):
# 安裝並加載 ggplot2
install.packages("ggplot2")
library(ggplot2)
# 示例:散點圖
ggplot(mtcars, aes(x = wt, y = mpg)) +
geom_point()
第4步:常用包學習
|
包名
|
用途
|
|
|
數據清洗與操作(篩選、分組、彙總)
|
|
|
數據整形(長寬格式轉換)
|
|
|
高級可視化
|
|
|
快速讀取 CSV 等文件
|
|
|
字符串處理
|
第5步:實戰項目
- 分析一份公開數據集(如 iris、mtcars 內置數據)
- 嘗試做:描述性統計、相關性分析、簡單線性迴歸
- 輸出報告:使用 R Markdown(
.Rmd文件)生成 HTML/PDF 報告
📖 四、推薦學習資源(中文)
- 書籍:
- 《R語言實戰》(Robert I. Kabacoff 著,中文版)
- 《統計學習導論:基於R應用》(ISLR 中文版)
- 在線教程:
- 菜鳥教程 - R語言
- R語言中文社區
- B站搜索 “R語言入門”(推薦“莫煩Python”的R系列)
- 交互式學習:
- DataCamp(英文,有免費部分):
- swirl(在R中邊學邊練):
install.packages("swirl")
library(swirl)
swirl()
本文章為轉載內容,我們尊重原作者對文章享有的著作權。如有內容錯誤或侵權問題,歡迎原作者聯繫我們進行內容更正或刪除文章。