熱線電話:13121318867

登錄
首頁精彩閱讀R語言數據可視化之散點圖
R語言數據可視化之散點圖
2016-05-05
收藏

R語言數據可視化散點圖

散點圖簡介

散點圖通常是用來表述兩個連續變量之間的關系,圖中的每個點表示目標數據集中的每個樣本。

同時散點圖中常常還會擬合一些直線,以用來表示某些模型。

繪制基本散點圖

本例選用如下測試數據集:

數據集

繪制方法是首先調用ggplot函數選定數據集,并在aes參數中指明橫軸縱軸。然后調用散點圖函數geom_point()便可繪制出基本散點圖。R語言示例代碼如下:

<a href='/map/sandiantu/' style='color:#000;font-size:inherit;'>散點圖</a>代碼

運行結果:

<a href='/map/sandiantu/' style='color:#000;font-size:inherit;'>散點圖</a>結果

基于顏色和點形對數據進行分組

本例選用如下測試數據集:

分組數據集

繪制方法是在基礎散點圖之上再在基函數的美學參數集里設置一個美學變量??芍付╟olour或者shape兩種參數,分別將不同分組以不同顏色/點形表述。R語言示例代碼(基于顏色分組)如下:

數據集代碼

運行結果:

分組結果

R語言示例代碼(基于點形分組)如下:

分組

運行結果:

散點

說明:可自定義點形,共有大概36種點形可供選擇。具體請參考R語言ggplot2手冊。


映射連續型變量

本例選用如下測試數據集:

變量數據集

上一個示例中,映射到分組的變量是離散型變量。而對于除了橫軸縱軸之外的連續型變量,也可以映射到散點圖的色深和點大小上。R語言示例代碼(綁定顏色)如下:

<a href='/map/sandiantu/' style='color:#000;font-size:inherit;'>散點圖</a>代碼

運行結果:

R語言示例代碼(綁定大小)如下:


運行結果:

處理散點重疊

本例選用如下測試數據集:

處理散點

如果圖中的散點重疊現象比較嚴重,可以在散點圖中設置散點的透明度來進行可視化。R語言示例代碼如下:

散點代碼

運行結果:

散點結果

添加回歸模型擬合線

本例選用如下測試數據集:

擬合線數據

如果需要網散點圖中添加回歸模型擬合線,最主要是調用stat_smooth()函數。R語言示例代碼如下:

模擬回歸代碼

運行結果:

模擬結果

線段為曲線是因為參與擬合模型為局部線性回歸模型。往geom_smooth()函數中加入”method = lm”即可擬合經典線性回歸。結果如下圖:線性結果 

添加自定義模型擬合線

本例選用如下測試數據集:

自定義模擬

上面一小節展示了用全局/局部回歸模型擬合樣本點并展示擬合線段,它使用ggplot2提供的geom_smooth()函數自動擬合并完成繪制。

但在更多時候,我們會使用其他包的模型(非ggplot2內置模型)擬合。針對這種情況,我們需要自定義一個函數。該函數接受模型、橫縱軸名、橫軸范圍、橫軸樣本點數量等參數,輸出一個包含預測變量和預測值的數據框。R語言實現代碼如下:

自定義模擬代碼

在使用其他模型建模好之后,將新的模型等各參數傳遞進上述函數,便得到預測結果數據集。最后將新的數據集輸出為折線圖即可。

下面展示一個略微復雜的例子,它將數據集根據不同性別分為兩組,分別建立回歸模型并繪制其擬合線。R語言實現代碼如下:

模擬代碼

運行結果:

結果 

散點圖添加邊際地毯

本例選用如下測試數據集:

散點數據集

方法很簡單,在原先散點圖繪制函數的基礎上增加邊際地毯函數就行。R語言實現代碼如下:

散點代碼

運行結果:

散點結果 

散點圖添加標簽

本例選用如下測試數據集:

散點標簽散點圖中添加標簽的方法也很簡單,在原有散點圖函數的基礎上增加文本函數即可。R語言實現代碼如下:

散點標簽代碼

運行結果:

運行結果

PS:該示例中我們在文本繪制函數中重定義了美學特征集。之后文本繪制函數將使用新的美學特征集,但其他繪制函數的不變。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢