
作者 | CDA數據分析師
Tableau內置的連接器可以連接到所有常用的數據源。
數據連接器
目前可以連接70多種數據源,分為本地連接和服務器連接。 Tableau支持的本地連接包括Excel、txt、csv、json等各類常見的源數據格式,還支持多種空間文件, 為使用地圖分析提供了條件。
Tableau支持的服務連接包括各類數據庫(如Mysql、Oracle、MongoDB)、在線數據服務(如google analtics)等,可以根據使用需要,與目標服務器建立連接關系。
如果以上提供的連接不滿足您的需求,可以選擇使用“其他數據庫 (ODBC)”或“Web 數據連接器”創建自己的連接。
設置數據源
Tableau數據源是數據與Tableau之間的鏈接,本質上是數據、連接信息以及基于數據進行的自定義操作的總和。
數據源包含:
本地文件連接
打開Tableau Desktop進入數據連接界面,在連接到文件中選擇要連接的文件類型。這里以Excel文件為例,單擊“Microsoft Excel”在彈出的“打開”對話框中找到想要連接的文件。
雙擊或拖動表名至畫布區,下方會顯示數據預覽。
數據庫連接
在數據連接界面,連接到服務器中選擇要連接的服務器。這里以“MySQL”為例,單擊“MySQL”在彈出“MySQL”對話框輸入服務器IP、端口號、用戶名及密碼即可登錄到MySQL服務器。
建立連接后,在數據庫列表中選擇要連接的數據庫,下方會顯示當前數據庫下可用的工作表。雙擊或拖動表名至畫布區,下方會顯示數據預覽。
也可以雙擊或拖動“新自定義SQL”至畫布區,輸入SELECT語句以連接想要的數據。
剪貼板粘貼
組合數據源
在一個工作簿中可以同時創建不同的數據連接。
數據聯結
當需要從多個數據表中獲取數據時,則要用到數據聯接操作。這里以兩表聯結為例,以兩個表的共有字段作為關鍵字段來建立聯結關系。 為了簡單直觀的操作演示,本文使用自制的Excel數據集demo,文件中包含table1和table2兩個數據表。
聯結方式
Tableau中支持四種聯結方式:內聯接、左聯接、右聯接和完全外部聯接。通常情況,Tableau會自動判斷兩張表的關鍵字段并進行關聯,如果關聯不正確或關鍵字段不一致無法自動關聯,可以手動進行關聯。
數據合并
當需要將有多個結構一致的數據表整合匯總在一起時,則可以使用數據合并。數據聯接是橫向擴展,數據合并是縱向增加。 進行數據合并的要求是,每個數據表的==字段名、個數、順序和數據類型必須完全一致==。 為了簡單直觀的操作演示,本文使用自制的Excel數據集demo,文件中包含三個數據表。
手動數據合并
雙擊或拖放“新建并集”至畫布區,將需要合并的數據表拖入彈出的并集(手動)對話框。
合并后的數據表包含三個數據表的所有數據,并且各字段一一對應。需要注意的是,新增了sheet和table name兩個字段,用于說明并集中的值的來源。
自動數據合并
雙擊或拖放“新建并集”至畫布區,在彈出的“并集”對話框中選擇“通配符(自動)”。 在“工作表”位置,將匹配內容改寫為“班”,其中“班”是共有的名稱,是通配符,用于匹配三個工作表。
合并后的數據表包含三個數據表的所有數據,并且各字段一一對應。需要注意的是,新增了path、sheet兩個字段,用于說明并集中的值的來源路徑及表名稱。
數據連接方式
與數據源完成連接后,將數據表拖放至畫布區,就可以在畫布區看到“連接”方式的選擇,分別是“實時”和“數據提取”。 實時:直接從數據源實時查詢獲取數據信息,Tableau不對源數據進行存儲。 數據提取:將數據源的數據保存到本地計算機,大幅縮短Tableau查詢載入源數據的時間。
為什么有兩種連接方式
數據提取
數據提取是保存的數據子集。 在創建數據的數據提取時,可以通過使用篩選器和配置其他限制來減少數據總數。 創建數據提取后,可使用原始數據中的數據對其進行刷新。在刷新數據時,可以選擇進行完全刷新或增量刷新。 完全刷新:默認方式,每次都會重新獲取數據源的數據,創建的本地副本與數據源一致。 增量刷新:僅刷新自上次數據提取后新增的行。
數據提取的優勢
創建數據提取
選擇數據提取后,會顯示“編輯”和“刷新”按鈕。單擊“編輯”在彈出的“數據提取”對話框中設置數據提取的要求。
指定在數據提取中存儲數據的方式
PS:“單個表”和“多個表”選項只會影響數據提取中數據的存儲方式,不影響數據提取中的表在“數據源”頁面上的顯示方式。 假設您的數據提取由三個表組成。如果直接打開配置為使用默認選項“單個表”的數據提取 (.hyper) 文件,在“數據源”頁面上只會顯示一個表。但是,如果打開使用打包數據源 (.tdsx) 文件的數據提取或包含其對應數據提取 (.hyper) 文件的數據源 (.tdsx) 文件,在“數據源”頁面上可以看到包含數據提取的全部三個表。
指定要提取的數據量
設置完成后,單擊工作表標簽頁可啟動數據提取創建過程。在隨后顯示的對話框中,選擇一個用于保存數據提取的位置,為該數據提取文件指定名稱,然后單擊“保存”即可。
在抽樣數據與整個數據提取之間切換
當您使用大型數據提取時,您可能需要創建一個帶數據樣本的數據提取,以便每次將字段放在工作表標簽頁中的功能區上時,您都可以設置視圖,同時避免長時間查詢。然后,可以在使用帶數據樣本的數據提取和使用整個數據源之間進行切換,方法是在“數據”菜單中選擇數據源,然后選擇“使用數據提取”。
實時和數據提取的選擇
什么情況下選擇“實時”
什么情況下選擇“數據提取”
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25在當今數字化時代,數據分析師的重要性與日俱增。但許多人在踏上這條職業道路時,往往充滿疑惑: 如何成為一名數據分析師?成為 ...
2025-04-24