
R語言中qplot()的用法
a, b, c, d, e, f, g, h = range(8)
ggplot2()函數
ggplot2是一個強大的作圖工具,它可以讓你不受現有圖形類型的限制,創造出任何有助于解決你所遇到問題的圖形。
qplot()
qplot()屬于ggplot2(),可以理解成是它的簡化版本。
qplot 即“快速作圖”(quick plot),顧名思義,能快速對數據進行可視化分析。它的用法和R base包的plot函數很相似。
qplot()
參數
qplot(x, y = NULL, ..., data, facets = NULL,
margins = FALSE, geom = "auto", stat = list(NULL),
position = list(NULL), xlim = c(NA, NA),
ylim = c(NA, NA), log = "", main = NULL,
xlab = deparse(substitute(x)),
ylab = deparse(substitute(y)), asp = NA)
各項參數詳解
1.x, y:變量名
2.data: 為數據框(data.frame)類型;如果有這個參數,那么x,y的名稱必需對應數據框中某列變量的名稱
3.facets: 圖形/數據的分面。這是ggplot2作圖比較特殊的一個概念,它把數據按某種規則進行分類,每一類數據做一個圖形,所以最終效果就是一頁多圖
4.margins: 是否顯示邊界
5.geom: 圖形的幾何類型(geometry),這又是ggplot2的作圖概念。ggplot2用幾何類型表示圖形類別,比如point表示散點圖、line表示曲線圖、bar表示柱形圖等。
6.stat: 統計類型(statistics),這個更加特殊。直接將數據統計和圖形結合,這是ggplot2強大和受歡迎的原因之一。
7.position: 圖形或者數據的位置調整,這不算太特殊,但對于圖形但外觀很重要
8.xlim, ylim, 設置軸的上下限
9.xlab, ylab, 在x,y軸上增加標簽
10.asp: 圖形縱橫比
qplot做散點圖
使用向量數據
plot函數一樣,如果不指定圖形的類型,qplot默認做出散點圖。對于給定的x和y向量做散點圖,qplot用法也和plot函數差不多
> library(ggplot2)
> x <- 1:1000
> y <- rnorm(1000)
> plot(x, y, main="Scatter plot by plot()")
> qplot(x,y, main="Scatter plot by qplot()")
使用數據框數據
雖然可以直接使用向量數據,但ggplot2更傾向于使用數據框類型的數據作圖。使用數據框有幾個好處:數據框可以用來存儲數值、字符串、因子等不同類型等數據;把數據放在同一個R數據框對象中可以避免使用過程中數據關系的混亂;數據外觀的整理和轉換方便。ggplot2中使用數據框作圖的最直接的一個效果就是:你可以直接用數據的分類特性(數據框中的列變量)來決定圖形元素的外觀,這個過程在ggplot2中稱為映射(mapping),是自動的。
在演示使用數據框作圖的好處之前我們先了解以下ggplot2提供的一組有關鉆石的示范數據 diamonds:
> str(diamonds)
Classes ‘tbl_df’, ‘tbl’ and 'data.frame': 53940 obs. of 10 variables:
$ carat : num 0.23 0.21 0.23 0.29 0.31 0.24 0.24 0.26 0.22 0.23 ...
$ cut : Ord.factor w/ 5 levels "Fair"<"Good"<..: 5 4 2 4 2 3 3 3 1 3 ...
$ color : Ord.factor w/ 7 levels "D"<"E"<"F"<"G"<..: 2 2 2 6 7 7 6 5 2 5 ...
$ clarity: Ord.factor w/ 8 levels "I1"<"SI2"<"SI1"<..: 2 3 5 4 2 6 7 3 4 5 ...
$ depth : num 61.5 59.8 56.9 62.4 63.3 62.8 62.3 61.9 65.1 59.4 ...
$ table : num 55 61 65 58 58 57 57 55 61 61 ...
$ price : int 326 326 327 334 335 336 336 337 337 338 ...
$ x : num 3.95 3.89 4.05 4.2 4.34 3.94 3.95 4.07 3.87 4 ...
$ y : num 3.98 3.84 4.07 4.23 4.35 3.96 3.98 4.11 3.78 4.05 ...
$ z : num 2.43 2.31 2.31 2.63 2.75 2.48 2.47 2.53 2.49 2.39 ...
可以看到這是數據框(data.frame)類型,有10個變量(列),每個變量有53940個測量值(行)。第一列為鉆石的克拉數(carat),為數字型數據;第二列為鉆石的切工好壞(cut),為因子類型數據,有5個水平;第三列為鉆石顏色(color),為7水平的因子;后面還有其他數據。由于數據太多,我們只取前7列的100個隨機觀測值。數據基本就是我們平時記錄原始數據的樣式:
> set.seed(1000) # 設置隨機種子,使隨機取樣具有可重復性
> datax<- diamonds[ seq(1,7)]
> head(datax, 4)
## carat cut color clarity depth table price
## 17686 1.23 Ideal H VS2 62.2 55 7130
## 40932 0.30 Ideal E SI1 61.7 58 499
## 6146 0.90 Good H VS2 61.9 58 3989
## 37258 0.31 Ideal G VVS1 62.8 57 977
如果要做鉆石克拉和價格關系的曲線圖,用plot和qplot函數都差不多:
plot(x=datax$carat, y=datax$price, xlab="Carat", ylab="Price", main="plot function")
qplot(x=carat, y=price, data=datax, xlab="Carat", ylab="Price", main="qplot function")
但如果要按切工進行分類作圖,plot函數的處理就復雜了,你首先得將數據進行分類提取,然后再一個個作圖。雖然可以用循環完成,但作圖后圖標的添加還得非常小心,你得自己保證數據和圖形外觀之間的對應關系:
plot(x=datax$carat, y=datax$price, xlab="Carat", ylab="Price", main="plot function", type='n')
cut.levels <- levels(datax$cut)
cut.n <- length(cut.levels)
for(i in seq(1,cut.n)){
subdatax <- datax[datax$cut==cut.levels[i], ]
points(x=subdatax$carat, y=subdatax$price, col=i, pch=i)
}
legend("topleft", legend=cut.levels, col=seq(1,cut.n), pch=seq(1,cut.n), box.col="transparent", cex=0.8)
但用ggplot2作圖你需要考慮數據分類和圖形元素方面的問題就很少,你只要告訴它用做分類的數據就可以了:
qplot(x=carat, y=price, data=datax, color=cut, shape=cut, main="qplot function")
qplot做曲線圖
和plot函數一樣,qplot也可以通過設置合適的參數產生曲線圖,這個參數就是geom(幾何類型)。圖形的組合非常直接,組合表示幾何類型的向量即可:
qplot(x=carat, y=price, data=datax, color=cut, geom="line", main="geom=\"line\"")
qplot(x=carat, y=price, data=datax, color=cut, geom=c("line", "point"), main="geom=c(\"line\", \"point\")")
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25