🌱 一、什麼是R語言?

  • R 是一種免費開源的編程語言和軟件環境,主要用於統計計算圖形繪製
  • 廣泛應用於數據科學、生物信息學、金融分析、社會科學等領域。
  • 擁有豐富的擴展包(CRAN 上超過 20,000 個包)。

🛠️ 二、安裝與環境準備

  1. 下載 R
    根據你的操作系統(Windows / macOS / Linux)下載並安裝。
  2. 推薦使用 RStudio(集成開發環境 IDE)

    RStudio 讓寫代碼、查看數據、畫圖更方便。

📚 三、零基礎學習路徑(建議順序)

第1步:熟悉基本語法

  • 變量賦值:x <- 5
  • 數據類型:數值(numeric)、字符(character)、邏輯(logical)、因子(factor)
  • 數據結構:
  • 向量 c(1,2,3)
  • 矩陣 matrix()
  • 數據框 data.frame()(最常用)
  • 列表 list()

✅ 練習:創建一個包含姓名、年齡、性別的數據框。

df <- data.frame(
  name = c("張三", "李四", "王五"),
  age = c(25, 30, 28),
  gender = c("男", "女", "男")
)
print(df)

R語言 基本語法_數據


第2步:基礎操作

  • 讀取數據:read.csv("file.csv")
  • 查看數據:head()str()summary()
  • 子集選取:df[df$age > 25, ]
  • 常用函數:mean()sd()table()plot()

第3步:數據可視化(基礎)

使用內置繪圖系統或 ggplot2 包(更強大美觀):

# 安裝並加載 ggplot2
install.packages("ggplot2")
library(ggplot2)

# 示例:散點圖
ggplot(mtcars, aes(x = wt, y = mpg)) + 
  geom_point()

第4步:常用包學習

包名

用途

dplyr

數據清洗與操作(篩選、分組、彙總)

tidyr

數據整形(長寬格式轉換)

ggplot2

高級可視化

readr

快速讀取 CSV 等文件

stringr

字符串處理


第5步:實戰項目

  • 分析一份公開數據集(如 iris、mtcars 內置數據)
  • 嘗試做:描述性統計、相關性分析、簡單線性迴歸
  • 輸出報告:使用 R Markdown(.Rmd 文件)生成 HTML/PDF 報告

📖 四、推薦學習資源(中文)

  1. 書籍
  • 《R語言實戰》(Robert I. Kabacoff 著,中文版)
  • 《統計學習導論:基於R應用》(ISLR 中文版)
  1. 在線教程
  • 菜鳥教程 - R語言
  • R語言中文社區
  • B站搜索 “R語言入門”(推薦“莫煩Python”的R系列)
  1. 交互式學習
  • DataCamp(英文,有免費部分):
  • swirl(在R中邊學邊練):
install.packages("swirl")
library(swirl)
swirl()