數據框的下標與子集的提取數據框的下標與子集的提取與矩陣基本相同. 不同的是: 對于列我們可以使用變量的名稱, 仍以數據集Puromycin進行舉例說明. ?1、提取單個元素> Puromycin[1, 1][1] 0.022、提取一個子集,例如第1, 3, 5行,第1, 3列 > Puromycin[c(1, 3, 5), c(1, 3)] conc state1 0.02 treated3
衛明真
2020-08-30
統計分析中一個完整的數據集通常是由若干個變量的若干個觀測值組成的, 在R中稱為數據框. 數據框是一個對像, 它與前面講的矩陣與二維數組形式上是類似的, 也是二維的,也有維數這個屬性, 且各個變量的觀測值有相同的長度. 但不同的是: 在數據框中, 行與列的意義是不同的, 其中的列表示變量,而行表示觀測. 顯示數據框時左側會顯示觀測值的序號.數據框的建立分為直接的與簡接的兩種方法: 數據框的直接建立若
衛明真
2020-08-30
數組與矩陣的建立 前面已經指出數組是一個kp¥ 1q維的數據表; 矩陣是數組的一個特例,其 維數k 2,而上面所述的向量自然也可看成維數為k 1的數組5. 而且向量、 數組或者矩陣中的所有元素都必須是同一種類型的. 對于一個向量,其屬性由 其類型和長度構成;而對于數組與矩陣, 除了類型和長度兩個屬性外, 還需要 維數dim這個屬性來描述. 因此如果一個向量需要在R中以數組的方式被處理, 則必須
衛明真
2020-08-23
開窗函數是在滿足某種條件的記錄集合上執行的特殊函數。對于每條記錄都要在此窗口內執行函數,有 的函數隨著記錄不同,窗口大小都是固定的,這種屬于靜態窗口;有的函數則相反,不同的記錄對應著 不同的窗口,這種動態變化的窗口叫滑動窗口。開窗函數的本質還是聚合運算,只不過它更具靈活性, 它對數據的每一行,都使用與該行相關的行進行計算并返回計算結果。語法:開窗函數名([<字段名>]) over([partiti
衛明真
2020-08-23
數值型向量的運算 向量可以用于算術表達式中,操作是按照向量中的元素一個一個進行的.同一個表達式中的向量并不需要具有相同的長度, 如果它們的長度不同,表達式的結果是一個與表達式中最長向量有相同長度的向量, 表達式中較短的向量會根據它的長度被重復使用若干次(不一定是整數次),直到與長度最長的向量相匹配, 而常數將被不斷重復 — 這一規則稱為循環法則(recycling rule). 例如, 命令> x
衛明真
2020-08-22
主流的關系型數據庫? Oracle:運行穩定、可移植性高、功能齊全、性能超群,適用于大型企業 ? DB2:速度快、可靠性好、適用于海量數據、恢復性極強,適用于大中型企業 ? MySQL:開源、體積小、速度快,適用于中小型企業 ? SQL server:全面高效、界面友好易操作,但是不跨平臺,適用于中小型企業MySQL簡介最早是由瑞典MySQL AB公司開發,僅供內部使用。2000年基于GPL協議開
衛明真
2020-08-22
邏輯型向量的建立 與數值型向量相同,R允許對邏輯向量進行操作. 一個邏輯向量的值可以 是TRUE, FALSE和NA. 前兩個通常簡寫為T和F2 . 邏輯向量是由條件給出的. 譬如> x <- c(10.4, 5.6, 3.1, 6.4, 21.7)> temp <- x > 13> temp[1] FALSE FALSE FALSE FALSE TRUE temp為一個與x長度相同,元素根據是否
衛明真
2020-08-22
向量的建立 數值型向量的建立統計分析中最為常用的是數值型的向量, 它們可用下面的四種函數建立:1) seq( )或“:” # 若向量(序列)具有較為簡單的規律2) rep( )# 若向量(序列)具有較為復雜的規律3) c( ) # 若向量(序列)沒有什么規律4) scan( ) # 通過鍵盤逐個輸入例子> 1:10[1] 1 2 3 4 5 6 7 8 910 > 1:10-1[1] 0 1 2
衛明真
2020-08-21
數據倉庫(Data Warehouse) 是一個面向主題的(Subject Oriented)、集成的(Integrate)、穩定 的(Non-Volatile)、反映歷史變化的(Time Variant)數據集合,用于支持管理決策。面向主題:數據倉庫側重于數據分析工作,所以數據倉庫中的數據是按照一定的主題進行組織和存 儲。集成:對原有分散的數據庫數據經過系統加工、整理,消除源數據中的不一致
衛明真
2020-08-21
1、R的對象與屬性 我們已經知道R通過一些對象來運行,這些對象是用它們的名稱和內容來 刻畫的,其次也通過對象的數據類型即屬性來刻畫. 所有的對象都有兩個內在 屬性:類型和長度. 類型是對象元素的基本種類,共有四種:數值型, 包括– 整型– 單精度實型 – 雙精度實型字符型復數型1邏輯型(FALSE、TRUE或NA) 雖然還存在其它的類型,例如函數或表達式, 但是它們并不能用來表示數 據;長度是
衛明真
2020-08-20
變量寬度(Width)、列顯示寬度(Columns)每種類型的變量都有自己的變量寬度、顯示寬度,其中變量寬度是變量允許的最大字符位數,SPSS默認的是8位,顯示寬度是數據編輯窗口中顯示每列的字符位數, SPSS默認的是顯示寬度也是8位。小數位數(Decimals)對于數值型變量,SPSS默認的小數位數是2位。變量名標簽(Variable label)變量名標簽是對變量名含義的進一步解釋說明,它可以
衛明真
2020-08-18
如果R已經安裝在你的計算機中,它就能立即運行一些可執行的命令了。R默認的命令提示符是‘>’,它表示正在等待輸入命令. 如果一個語句在一行中輸不完, 按回車鍵, 系統會自動產生一個續行符“+”, 語句或命令輸完后系統又會回到命令提示符. 在同一行中輸入多個命令語句, 則需要使用分號來隔開. 在Windows系統中, 能直接運行下拉菜單中的一些操作命 令. 在學習一些R的命令之前,讓我們先了解R的
衛明真
2020-08-18
一、SPSS數據文件的特點(1)SPSS數據文件是一種有結構的數據文件,它由數據結構和內容兩部分組成,(2)數據結構是對SPSS中各列變量及其屬性的描述,主要記錄數據變量的名稱、類型、變量寬度、小數位數、變量名標簽、變量值標簽、缺失值、顯示寬度、對齊方式和計量尺度等必要信息,(3)數據的內容才是那些待分析的具體數據。(4)相關概念:個案(或記錄)、變量、變量值。個案:數據編輯窗口中的一行稱為一個個
衛明真
2020-08-17
一、現在越來越多的人開始接觸、學習和使用R, 因為它有其顯著的優點, 主要包括:1) 免費: 盡管S-PLUS是非常優秀的統計分析軟件,但你需要支付一筆費用, 而R是一個免費的統計分析軟件(環境);2) 浮點運算功能強大: R可以作為一臺高級科學計算器, 因為R同Matlab一 樣不需要編譯就可執行代碼;3) 不依賴于操作系統: R可以在運行于UNIX, Linux, Windows 和Macin
衛明真
2020-08-17
統計基礎中的參數估計一、參數估計的基本原理1、參數估計就是用樣本統計量去估計總體的參數在參數估計中,用來估計總體參數的統計量稱為估計量,而根據一個具體的樣本算出來的估計量的數值稱為估計值2、點估計和區間估計a、點估計:就是用樣本統計量的某個取值直接作為總體參數的估計值b、區間估計:實在點估計的基礎上,給出總體參數估計的一個區間范圍,該區間通常由樣本統計量加減誤差得到的,與點估計不同,進行區間估計時
衛明真
2020-08-17