Sep 01 2023
timerrring -
R語言之數值型描述分析
文章和代碼已經歸檔至【Github倉庫:https://github.com/timerring/dive-into-AI 】或者公眾號【AIShareLab】回覆 R語言 也可獲取。
在分析之前,先將數據集 birthwt 中的分類變量 low、race、smoke、ht 和 ui 轉換成因子。
library(MASS)
data(birthwt)
str(birthwt)
optio
r
Aug 30 2023
timerrring -
R語言之 ggplot 2 和其他圖形
文章和代碼已經歸檔至【Github倉庫:https://github.com/timerring/dive-into-AI 】或者公眾號【AIShareLab】回覆 R語言 也可獲取。
1. 初識 ggplot2 包
ggplot2 包提供了一套基於圖層語法的繪圖系統,它彌補了 R 基礎繪圖系統裏的函數缺乏一致性的缺點,將 R 的繪圖功能提升到了一個全新的境界。ggplot2 中各種數據可視
r
Aug 29 2023
timerrring -
R語言之基礎繪圖
文章和代碼已經歸檔至【Github倉庫:https://github.com/timerring/dive-into-AI 】或者公眾號【AIShareLab】回覆 R語言 也可獲取。
R 的基礎繪圖系統由 Ross Ihaka 編寫,功能非常強大,主要由 graphics 包和 grDevices 包組成,它們在啓動 R 時會自動加載。基礎繪圖系統中有兩類函數,一類是高水平作圖函數,另一類
r
Aug 28 2023
timerrring -
R語言之處理大型數據集的策略
文章和代碼已經歸檔至【Github倉庫:https://github.com/timerring/dive-into-AI 】或者公眾號【AIShareLab】回覆 R語言 也可獲取。
在實際的問題中,數據分析者面對的可能是有幾十萬條記錄、幾百個變量的數據集。處理這種大型的數據集需要消耗計算機比較大的內存空間,所以儘可能使用 64 位的操作系統和內存比較大的設備。否則,數據分析可能要花太長時
r
Aug 27 2023
timerrring -
R語言之缺失值處理
文章和代碼已經歸檔至【Github倉庫:https://github.com/timerring/dive-into-AI 】或者公眾號【AIShareLab】回覆 R語言 也可獲取。
缺失值處理
在實際的數據分析中,缺失數據是常常遇到的。缺失值(missing values)通常是由於沒有收集到數據或者沒有錄入數據。
例如,年齡的缺失可能是由於某人沒有提供他(她)的年齡。大部分統計分析方法
r
Aug 26 2023
timerrring -
R語言之數據框的合併
文章和代碼已經歸檔至【Github倉庫:https://github.com/timerring/dive-into-AI 】或者公眾號【AIShareLab】回覆 R語言 也可獲取。
有時數據集來自多個地方,我們需要將兩個或多個數據集合併成一個數據集。合併數據框的操作包括縱向合併、橫向合併和按照某個共有變量合併。
1.縱向合併:rbind( )
要縱向合併兩個數據框,可以使用 rbind(
r
Aug 25 2023
timerrring -
R語言之 dplyr 包
文章和代碼已經歸檔至【Github倉庫:https://github.com/timerring/dive-into-AI 】或者公眾號【AIShareLab】回覆 R語言 也可獲取。
這個包以一種統一的規範更高效地處理數據框。dplyr 包裏處理數據框的所有函數的第一個參數都是數據框名。
下面以 MASS 包裏的 birthwt 數據集為例,介紹 dplyr 包裏常用函數的用法。該數據集來
r
Aug 24 2023
timerrring -
R語言之基本包
文章和代碼已經歸檔至【Github倉庫:https://github.com/timerring/dive-into-AI 】或者公眾號【AIShareLab】回覆 R語言 也可獲取。
用 R 基本包
在實際的數據分析中,分析者往往需要花費大量的精力在數據的準備上,將數據轉換為分析所需要的形式。遺憾的是,大多數統計學教材很少涉及這一重要問題。整理數據是統計學的任務之一。我們開始關注 R 中最
r
Aug 23 2023
timerrring -
R語言之數據導出
文章和代碼已經歸檔至【Github倉庫:https://github.com/timerring/dive-into-AI 】或者公眾號【AIShareLab】回覆 R語言 也可獲取。
1. 導出數據
由於 R 主要用於數據分析,導入文件比導出文件更常用,但有時我們也需要將數據或分析結果導出。函數 write.table( ) 和 write.csv( ) 可以分別將數據導出到一個 .txt
r
Aug 22 2023
timerrring -
R語言之數據獲取操作
文章和代碼已經歸檔至【Github倉庫:https://github.com/timerring/dive-into-AI 】或者公眾號【AIShareLab】回覆 R語言 也可獲取。
實際上,R 中有大量的內置數據集可用於分析和實踐,我們也可以在R 中創建模擬特定分佈的數據。而在實際工作中,數據分析者更多時候面對的是來自多種數據源的外部數據,即各式各樣擴展名的數據文件,如 .txt、.cs
r
Aug 18 2023
timerrring -
R語言的數據結構與轉換
文章和代碼已經歸檔至【Github倉庫:https://github.com/timerring/dive-into-AI 】或者公眾號【AIShareLab】回覆 R語言 也可獲取。
任何數據分析的第一步都是按照所需要的格式創建數據集。在 R 中,這個任務包括兩個步驟:首先選擇一種數據結構來存儲數據,然後將數據輸入或者導入這個數據結構中。下面介紹 R 中用於存儲數據的多種數據結構。
R 的
r
Aug 17 2023
timerrring -
R 語言入門與介紹
文章和代碼已經歸檔至【Github倉庫:https://github.com/timerring/dive-into-AI 】或者公眾號【AIShareLab】回覆 R語言 也可獲取。
常用算術運算符
運算符
描述
+
加法
−
減法
*
乘法
/
除法
r