
R語言:基本函數、統計量、常用操作函數
先言:R語言常用界面操作
幫助:help(nnet) = ?nnet =??nnet
清除命令框中所有顯示內容:Ctrl+L
清除R空間中內存變量:rm(list=ls())、gc()
獲取或者設置當前工作目錄:getwd、setwd
保存指定文件或者從磁盤中讀取出來:save、load
讀入、讀出文件:read.table、wirte.table、read.csv、write.csv
1、一些簡單的基本統計量
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
#基本統計量
sum/mean/sd/min #一些基本統計量
which.min() #找出最小值的序號
以上是單數列,如果是多變量下的呢?
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
#多元數據
colMeans() #每列,row是行(橫向)
colnames() #列名
colSums() #列求和
cov() #協方差陣
cor() #相關矩陣
cor.test() #相關系數
abs 絕對值
sqrt 平方根
exp e^x次方
log 自然對數
log2,log10 其他對數
sin,cos,tan 三角函數
sinh,cosh,tanh 雙曲函數
poly 正交多項式
polyroot 多項式求根
對象操作:
assign 賦值操作,等同于“<-”
rm 刪除對象
ls 顯示內存中的對象
str 顯示對象的內在屬性或簡要說明對象
ls.str 展示內存中所有對象的詳細信息
length 返回對象中元素的個數
names 顯示數據的名稱,對于數據框則是列名字
levels 因子向量的水平
dim 數據的維度
nrow 矩陣或數據框的行數
ncol 列數
rownames 數據的行名字
colnames 列名字
class 數據類型
mode 數據模式
head 數據的前n行
tail 數據的后n行
summary 顯示對象的概要
attr x的屬性類型
is.na 檢測變量的類型
is.null
is.array
is.data.frame
is.numeric
is.complex
is.character
簡單統計:
max 最大元素
min 最小元素
range 最小值和最大值組成的向量
sum 和
prod 元素連乘
pmax 向量間相同下標進行比較最大者,并組成新的向量
pmin 向量間相同下標進行比較最小者,并組成新的向量
cumsum 累積求和
cumprod 連乘
cummax 最大
cummin 最小
mean 均值
weighted,mean 加權平均數
median 中位數
sd 標準差
norm 正態分布
f F分布
unif 均勻分布
cauchy 柯西分布
binom 二項分布
geom 幾何分布
chisq.test 卡方檢驗,進行獨立性檢驗
prop.test 對總體均值進行假設檢驗
shapiro.test 正態分布檢驗
t.test T檢驗,對總體均值進行區間估計
aov 方差分析
anova 一個或多個模型對象的方差分析
2、向量
向量在循環語句中較為廣泛
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
#向量
#向量在循環語句中較為廣泛
M=vector(length = 8);M #生成一個長為8的布爾向量
M[1]="1";M #賦值之后就會定義為字符
M[1]=1;M #賦值之后,定義為數值
邏輯向量使用
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
y[y < 0] <- -y[y < 0] #表示將向量(-y)中 與向量y的負元素對應位置的元素 賦值給 向量y中 與向量y負元素對應的元素。作用相當于: y <- abs(y)
3、數據儲存形式
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
#數據儲存形式
data.frame(wi=iris,ci=cars) #數據框形式,可以直接定義變量名
list(wi=iris,ci=cars) #list,也可以直接定義變量名
注意:attach()、detach()
可以將數據框中的變量釋放到Rs內存中,然后就可以直接調用。
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
attach(iris)
names(setosa)
detach(iris)
在data.frame中,是可以實現數據集重命名的,比如data.frame(x=iris,y=cars),
也可以實現橫向、縱向重命名,data.frame(x=iris,y=cars,row.names=iris)
4、數據查看函數——names、str、unique組合、typeof()、mode()、class()
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
##數據查看函數
names(iris) #查看所有變量名字
str(iris) #變量屬性(int整數,num數值)
unique(iris$setosa) #查看分類變量的水平
table(iris$setosa) #分類水平,不同水平的個數(=unique+sum功能)
summary(iris) #所有變量各自的均值、分位數、眾數、最大、最小值等統計量,在回歸中就是系數表等
attributes(iris) #包括names(變量名)、row.names(序號的名稱)、class(數據形式)
一般names、str、unique會組合使用。
如何查看數據類型——typeof()、mode()、class()的區別?
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
我這里用個因子例子來說明,希望能講清楚
> gl(2,5) #新建一個因子
[1] 1 1 1 1 1 2 2 2 2 2
Levels: 1 2
> class(gl(2,5)) #查看變量的類,顯示為因子;
[1] "factor"
> mode(gl(2,5)) #查看數據大類,顯示為數值型;
[1] "numeric"
> typeof(gl(2,5)) #查看數據細類,顯示為整數型;
[1] "integer"
#來自:http://f.dataguru.cn/thread-99785-1-1.html
從精細度上說,typeof>mode>class.
5、矩陣的基本知識與注意
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
#矩陣的基本知識
t() #轉置
det() #行列式,方陣
x%*%y #向量內積
x%o%y#向量外積
A=array(1:9,dim=c(3,3))
A*A #這個代表矩陣內兩兩子元素相乘
A%*%A #才是我們想要的結果
crossprod(A,A) #等于t(A)%*%A
crossprod(t(A),A) #等于A%*%A,所以需要t(A)一下
t 矩陣轉置
rowsum 行求和
colsum 列求和
rowmeans 行平均
colmeans 列平均
solve 對線性方程求解或求矩陣的逆
diag 對角陣
6、因子
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
##因子(≈文本+數字的組合)
#SPSS中值標簽定義有異曲同工之妙
M=factor(iris$setosa,levels=c(1,0),labels=c("M","F"));M #能夠轉化因子格式+定義值標簽
M=as.factor(iris$setosa);M #上面的函數更有效,因為as.factor只能轉化成因子格式
7、輸入輸出
library 加載包
data 加載制定數據集
load 加載save或者save.image保存的數據
read.table 讀取表格
read.csv 讀取以逗號分割的表格
read.delim 讀取以tab分割個表格
read.fwf 以fixed width formatted 形式讀取數據至表格
save 二進制保存指定對象
save.image 二進制保存當前線程內所有對象
write.table 將數據以表格形式寫入文本
write.csv 將數據以CSV表格形式寫入文本
cat 強制轉化為字符后輸出
sink 輸出轉向到指定文件
print 輸出屏幕
format 格式化
8、邏輯運算
!x 邏輯非
x & y 邏輯與
x && y 邏輯與(僅匹配并返回第一個值)
x | y 邏輯或
x || y 邏輯或(僅返回第一個值)
x or (x,y) 異或
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25