熱線電話:13121318867

登錄
首頁數據分析教程數據分析師教程《統計學極簡入門》第1節 統計學簡介
數據分析師教程《統計學極簡入門》第1節 統計學簡介
2024-10-09
收藏

1.統計學簡介

聽說你已經被統計學勸退,被Python唬住……先別著急劃走,看完這篇再說!

先說結論,大多數情況下的學不會都不是知識本身難,而是被知識的傳播者勸退的。

比如大佬們授課,雖邏輯嚴謹、思維縝密,但你只能望其項背,因為大佬們往往無法體會菜鳥的痛苦。再比如一些照本宣科的老師,他們沒有深入研究這些知識,無法用通俗的語言幫你解釋,只能貌似努力地幫你認真地讀完所有PPT……

究其本質而言,這種情況多半是按 “是什么、有什么用,怎么用” 的方式在學,而對在大多數人而言,第一步就學懂“是什么”,或許難度有點大,因為得從定義出發,了解性質,推導出原理,一套流程下來直接勸退了,反而最關心的有什么用、怎么用的問題沒有解決。

所以接下來的內容我將用“MVP(最小可行化產品)” 的思路來篩選重點內容,幫你厘清哪些內容是不可或缺及必須要學的。然后以 “有什么用,怎么用,是什么” 的順序展開,快速提升當你急需Get某個技能時候的學習效率。

另外教程的標題既然含有“極簡入門”,那么至少有2個原則:

  • 盡量不廢話
  • 盡量說人話

說“盡量”是因為有些時候,不得不說些廢話才能引起你的注意,比如以上內容…

好,我們正式開始!首先來看第一個問題:

1. 數據的種類

我們都知道,一般數據可以分為兩類,即定性數據(類別型數據)定量數據(數值型數據)

(1). 定性數據, 表示研究對象的類別。很好理解,這里的表示類別用的數字沒有大小之分,不能進行算術四則運算。

定性數據可以分為:

① 定類數據
表現為類別,但不區分順序,是由定類尺度計量形成的。一般可以從非數值型數據中編碼轉換而來,數值本身沒有意義,只是為了區分類別做出的數值型標識

例如性別用1代表男性,用2代表女性;血型用1,2,3,4來表示A、B、AB及O四種;

② 定序數據
表現為類別,但有順序,是由定序尺度計量形成的。運算符也沒有意義,

例如受教育程度用 文盲 = 1,半文盲 = 2,小學 = 3,初中 =4,高中 = 5,大專 = 6,本科 = 7,(研究生)碩士 = 8,(研究生)博士 = 9表示。

(2). 定量數據, 表示的是研究對象的數量特征,如人群中人的身高、體重等。

定量數據可以分為以下幾種:

① 定距數據
表現為數值,可進行加、減運算,是由定距尺度計量形成的。定距數據的特征是沒有絕對的零點,例如溫度,不能說10攝氏度的一倍是20攝氏度。因此乘、除法對于定距數據來說也是沒有意義的。

② 定比數據
表現為數值,可進行加、減、乘、除運算,是由定比尺度計量形成的。定比數據存在絕對的零點。例如價格,100元的2倍就是200元。

2. 什么是統計學

先看一個例子,這里有一組數據 2,23,4,17,12,12,13,16,請思考你要怎么描述它?

你可能會說他們的平均數是12.375,中位數是12.5,最大值是23,最小值是2,等等。

沒錯,這里其實你已經在用平均數、中位數、最大值、最小值的來描述這組數據。

那么用幾個數來描述一堆數就是統計學的基本概念:統計學是一門將 數據匯總為統計量或圖表的學問。

Tips:通俗來說就是,數據太多記不住且不好描述,需要簡化為更少的數字或圖表,于是有了統計學和統計圖表

知道了統計學的定義再接著看:

3. 統計學的知識體系是什么樣的?

通常我們把統計學分為兩大方向,通過計算出來的統計量來概括已有數據叫做描述統計學,通過樣本獲取總體特征的叫做推斷統計學

Tips:“算”出來的統計量,比如 中位數、平均值、眾數 這些;“猜”出來的叫推斷統計學,比如通過樣本數據來推斷總體的數字特征。

下面這張圖展示了統計學兩大分支:描述統計與推斷統計。其中推斷統計又分兩大學派,頻率學派與貝葉斯學派。這些內容大家先知道就行,后面再展開。

下期預告:《Python統計學極簡入門》第2節 描述性統計

這里分享一個你一定用得到的小程序——CDA數據分析師考試小程序。 它是專為CDA數據分析認證考試報考打造的一款小程序??梢詭湍憧焖賵竺荚?、查成績、查證書、查積分,通過該小程序,考生可以享受更便捷的服務。 掃碼加入CDA小程序,與圈內考生一同學習、交流、進步!

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢