
2013年是大數據元年,在美國,大數據的應用正在各個行業風生水起,大至奧巴馬競選總統,小至互聯網公司的數據挖掘。2014年,數據挖掘技術已經廣泛應用于通訊、醫療、銀行、證券、保險、制造、商業、市場研究、科研、教育等多個行業和領域。
為追隨數據時代的到來,人大經濟論壇將于暑期8月開設系列數據挖掘特訓班。
分為兩大類《基于SAS和weka的商業數據挖掘》和《基于SPSS Modeler的數據挖掘案例實務》
課程 |
時間 |
地點 |
價格 |
報名 |
基于SAS和weka的商業數據挖掘 |
8.2-3,9-10 |
北京,對外經貿大學 |
5000/4000學生 |
|
基于SPSS Modeler的數據挖掘案例實務 |
8.14-17 |
北京,對外經貿大學 |
4000/2500學生 |
|
全程合報 |
8.2-3,9-10, 14-17 |
北京,對外經貿大學 |
8000/5500學生 |
基于SAS和weka的大數據商業數據挖掘
課程內容及目標:
內容包含:
1. 數據挖掘的基本知識;
2. 數據挖掘常用工具的使用與操作;
3. 具體應用案例介紹;
4. 最新熱點趨勢。
目的:
讓大家在大數據時代背景下,用最短的時間快速掌握數據挖掘的工具,從商用大數據中挖掘有用的信息與數據的價值,實現商業模式的創新與完善。
課程特點:
(1)課程中穿插實際案例,從基礎到應用,由淺入深,通俗易懂;每一章節都配備有足夠的案例和數據分析,保證大家能夠掌握數據挖掘的基本操作。
(2)現場演示基于數據挖掘工具軟件SAS/Weka軟件的數據挖掘操作,,并免費給大家提供常用的數據挖掘工具包和數據挖掘數據集。
(3)講義以美國著名商學院的數據挖掘教材為基礎,精選出對目前對符合國內大數據應用情況的內容,同時結合主講人對大數據前沿問題最新研究成果和實戰經驗編寫而成。
(4)內容分為基礎篇和應用篇:基礎篇強調數據挖掘基本知識和基本技術的掌握;應用篇則將數據挖掘和實際應用聯系起來,講授數據挖掘在真正的商業環境中的應用。
課程大綱:
一、基礎篇(授課時間為兩天): 數據挖掘基礎+小規模數據挖掘的應用實例
(1) 數據挖掘概述
1.1) 大數據時代的數據挖掘
1.2) 數據挖掘的經典案例
1.3) 數據挖掘實現的十步法
1.4) 數據挖掘的研發利器及比較:SAS/Weka,Matlab,C++, Java, R, SPSS)
(2) 四大傳統數據挖掘方法及典型應用案例演示
2.1)聚類分析(Clustering analysis)及其在客戶細分中的應用
2.2) 分類分析(Classification analysis)及其在文檔分析中的應用
2.3) 關聯規則(Association rule)及其在商場購物促銷中的應用
2.4)預測分析及其及客戶流失中的應用;
2.5)四大傳統數據挖掘算法應用的實際操作
(3) 面向大數據的數據挖掘之一: 文本挖掘及互聯網海量數據分析的應用
3.1)文本大數據挖掘的基本步驟,和傳統挖掘的區別及難點剖析
3.2) 文本挖掘的前沿技術應用實例:網頁分析及輿情發現
3.3)大數據時代其它非結構化數據(圖像、語音、視頻、傳感數據等)挖掘及其應用,例如圖像檢索
(4)面向大數據的數據挖掘之二:基于復雜網絡的數據挖掘及其在社交網絡分析上的應用
4.1)復雜網絡分析:典型的大數據模型
4.2)社交網絡的應用:朋友圈發現和社交搜索(Graph search)
4.3) 排列分析(Ranking analysis)及在網絡搜索中的應用
4.5)一圖勝千言(A picture is more than one thousand words):挖掘結果的可視化實現
(5)數據挖掘商業應用實例
5.1)利用數據挖掘進行欺詐檢測
5.2)商品銷售中推薦系統 (Recommending system) 的基本原理
5.3)推薦系統的應用
(6)大數據時代的機遇與挑戰
6.1)對大數據(big data )時代的理解
62)大數據技術掃描:從基礎設施、軟件平臺,計算模式到挖掘模型
6.3)大數據會給我們帶來什么改變:機遇和挑戰
二、應用篇(授課時間為兩天):在真實的商業環境的應用,對真實的大數據進行挖掘
(2) 金融領域風險預測評分,數據來源:國外某跨國商業銀行
(3) 電子商務大規模推薦系統的應用,數據來源:國內最大的電子商務網站之一
(4) 復雜網絡分在信息科學以及金融的應用,數據來源:路透社和某國有大型銀行
(5) 文本挖掘及其應用,數據來源:路透社和PUMED數據庫
(6) 基于大數據平臺下的數據挖掘具體實現簡介,基于阿里巴巴的ODPS平臺
基礎+應用,最系統最全面的數據挖掘課程!
Number2:
基于SPSS Modeler的數據挖掘案例實務
培訓時間: 2014年8月14-17日(4天)@北京,對外經貿大學 授課安排: (1) 授課方式:中文多媒體互動式授課方式 (2) 授課時間:上午9:00-12:00,下午13:30-16:30(16:30-17:00答疑) (3) 所有軟件:SPSS Modeler 邀請函下載: 數據挖掘班邀請函 訪問碼:ec01 |
講師介紹:
李御璽 (Yue-Shi Lee),國立臺灣大學計算機工程博士,銘傳大學計算機工程學系教授兼系主任暨所長,銘傳大學數據挖掘中心主任,廈門大學數據挖掘中心顧問,中國人民大學數據挖掘中心顧問。其研究領域專注于數據倉庫、數據挖掘、與文本挖掘。
在其相關研究領域已發表超過260篇以上的研究論文,同時也是國科會與教育部多個相關研究計劃的主持人。服務過的客戶包括:中國工商局、中信銀行、臺新銀行、聯邦銀行、新光銀行、 新竹國際商業銀行(現已并入渣打銀行)、第一銀行、永豐銀行、遠東銀行、美商大都會人壽、嘉義基督教醫院、臺灣微軟、零售業如赫蓮娜(Helena Rubinstein)化妝品公司、特立和樂(HOLA)公司、航空公司如東方航空公司、中華航空公司、汽車行業如福特(Ford)汽車公司;ZF行業如國稅局等。
課程大綱:
案例1:Drug Treatments: In this case, imagine that you are a medical researcher compiling data for a study. You have collected data about a set of patients, all of whom suffered from the same illness. During their course of treatment, each patient responded to one of five medications. Part of your job is to use data mining to find out which drug might be appropriate for a future patient with the same illness.
藥物治療(醫療業):在這個案例中,想象你是一個醫學研究人員,并收集許多患有相同疾病的病患資料。在他們的治療過程中,每一個病人會被記錄對哪一種藥物有療效(總共有五種針對此疾病的藥物)。此案例的目的是想利用數據挖掘(分類模型-多目標決策樹(Decision Tree))找出,哪種藥物適用于哪一種類型的病人。
案例2:Modeling Customer Response: This case is based on a company that wants to achieve more profitable results in future marketing campaigns by matching the right offer to each customer. Specifically, this case identifies the characteristics of customers who are most likely to respond, based on previous promotions, and generates a mailing list based on the results.
對客戶響應建模(零售業):本案例是某公司希望通過提供客戶對的營銷活動,在未來實現更多的獲利。此案例的目的是想根據以往的促銷活動,利用數據挖掘(分類模型-決策列表(Decision List))找出會對營銷活動有響應的客戶特征,并根據建模的結果產生要郵寄的促銷客戶名單。
案例3:Classifying Telecommunications Customers: Suppose a telecommunications provider has segmented its customer base by service usage patterns, categorizing the customers into four groups. If demographic data can be used to predict group membership, you can customize offers for individual prospective customers.
:電信客戶分類(電信業):假設某電信服務提供商通過客戶使用服務的方式,將客戶分為四類人。此案例的目的是想根據人口統計數據(分類模型-多目標羅吉斯回歸(Multinomial Logistic Regression)),利用數據挖掘找出這四類人的特征,并發掘這四類人的潛在新客戶。
案例4:Telecommunications Churn: Suppose a telecommunications provider is concerned about the number of customers it is losing to competitors. If service usage data can be used to predict which customers are liable to transfer to another provider, offers can be customized to retain as many customers as possible. This example focuses on using usage data to predict customer loss (churn).
電信客戶流失(電信業):假設某電信服務提供商非常關注客戶流失到競爭對手的數量。假如服務使用的數據可以用來預測哪些客戶有可能被轉移到另一個供貨商,則此供貨商可提供客制化的優惠,以盡可能留住客戶。此案例的目的是想根據服務使用的數據,利用數據挖掘(分類模型-二元羅吉斯回歸(Binomial Logistic Regression))來預測客戶的流失。
案例5:Forecasting Bandwidth Utilization: An analyst for a national broadband provider is required to produce forecasts of user subscriptions in order to predict utilization of bandwidth. Forecasts are needed for each of the local markets that make up the national subscriber base. This example will use time series modeling to produce forecasts for the next three months for a number of local markets.
預測帶寬使用率(通訊業):某全國寬帶網絡供貨商的分析師需進行客戶使用網絡的預估,以便預測帶寬的使用。全國網絡的使用是全國各局域網絡使用的加總,因此分析師需逐一對給個區域市場進行帶寬使用的預測。此案例的目的是想利用數據挖掘中的時間序列模型(預測模型-簡單時間序列(Simple Time Series))來預測每個區域市場下三個月的帶寬使用量。
案例6:Forecasting Catalog Sales: A catalog company is interested in forecasting monthly sales of its men’s clothing line, based on their sales data for the last 10 years. This example takes a closer look at the two methods that are available when choosing a model yourself—exponential smoothing and ARIMA.
預測型錄商品的銷售(零售業):某型錄公司希望根據過去10年的銷售記錄,利用數據挖掘來預測男裝生產線每月的銷售。此案例的目的是想利用數據挖掘中的兩個時間序列模型-Exponential Smoothing和ARIMA(預測模型-復雜時間序列(Exponential Smoothing & ARIMA))來解決這個問題。
案例7:Making Offers to Customers: This example teaches you how to predict which offers are most appropriate for customers and the probability of the offers being accepted. These sorts of models are most beneficial in customer relationship management, such as marketing applications or call centers.
提供對的產品給對的客戶(銀行業):此案例的目的是想利用數據挖掘(分類模型-自學響應模型(Self-Learning Response Model))來預測客戶對不同產品報價的接受程度,以便預測哪些產品適合提供給哪些客戶。此類模型適合運用在顧客關系管理中的目標市場營銷及客服中心。
案例8:Predicting Loan Defaulters: Suppose a bank is concerned about the potential for loans not to be repaid. If previous loan default data can be used to predict which potential customers are liable to have problems repaying loans, these “bad risk” customers can either be declined a loan or offered alternative products.
預測貸款逾期者(銀行業):某銀行希望根據客戶過去的貸款數據,利用數據挖掘(分類模型-貝式網絡(Bayesian Network))來預測新的貸款者,核貸后會逾期的機率,以做為銀行是否核貸的依據,或提供給客戶其他類型的貸款產品。
案例9:Retail Sales Promotion: This example deals with data that describes retail product lines and the effects of promotion on sales. The goal of this example is to predict the effects of future sales promotions.
零售業銷售促銷(零售業):此案例的目的是想根據零售產品過去的促銷記錄,利用數據挖掘(預測模型-神經網絡及回歸樹(Neural Network & Regression Tree))來預測未來的銷售成效。
案例10:Condition Monitoring: This example concerns monitoring status information from a machine and the problem of recognizing and predicting fault states. The data consists of a number of concatenated series measured over time. Each record is a snapshot report on the machine.
狀態監測(信息業):此案例的目的是想根據機器監控狀態的信息,利用數據挖掘(分類模型-神經網絡及決策樹(Neural Network & Decision Tree))來預測機器發生故障的機率。此案例的數據包含在時間軸上連續的機器監控狀態信息。因此,每一筆記錄是機器在某個時間點的狀態報告。
案例11:Classifying Cell Samples: A medical researcher has obtained a dataset containing characteristics of a number of human cell samples extracted from patients who were believed to be at risk of developing cancer. Analysis of the original data showed that many of the characteristics differed significantly between benign and malignant samples. The researcher wants to develop a model to give an early indication of whether their samples might be benign or malignant.
細胞樣本分類(醫療業):某醫學研究中心收集癌癥病患的細胞樣本特征數據,以便進行研究。原始的數據顯示良性樣本與惡性樣本間的許多特征有顯著的差異。此案例的目的是想根據此數據,利用數據挖掘(分類模型-支持向量機(Support Vector Machine))來提早發現某樣本是良性還是惡性的樣本。
案例12:Market Basket Analysis: This example deals with data describing the contents of supermarket baskets (that is, collections of items bought together) plus the associated personal data of the purchaser, which might be acquired through a loyalty card scheme. The goal is to discover groups of customers who buy similar products and can be characterized demographically, such as by age, income, and so on.:
購物籃分析(零售業):此案例的目的是想根據會員卡所記錄的客戶的個人信息及每次購買商品的數據,利用數據挖掘(關聯模型-Apriori &決策樹(Decision Tree))來發掘購買類似商品的客群,以及客群的特征(例如,年齡、收入、等)。
12個真實案例玩轉數據挖掘!
(詳情請參照:http://bbs.pinggu.org/thread-3019568-1-1.html)
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA數據分析師證書考試體系(更新于2025年05月22日)
2025-05-26解碼數據基因:從數字敏感度到邏輯思維 每當看到超市貨架上商品的排列變化,你是否會聯想到背后的銷售數據波動?三年前在零售行 ...
2025-05-23在本文中,我們將探討 AI 為何能夠加速數據分析、如何在每個步驟中實現數據分析自動化以及使用哪些工具。 數據分析中的AI是什么 ...
2025-05-20當數據遇見人生:我的第一個分析項目 記得三年前接手第一個數據分析項目時,我面對Excel里密密麻麻的銷售數據手足無措。那些跳動 ...
2025-05-20在數字化運營的時代,企業每天都在產生海量數據:用戶點擊行為、商品銷售記錄、廣告投放反饋…… 這些數據就像散落的拼圖,而相 ...
2025-05-19在當今數字化營銷時代,小紅書作為國內領先的社交電商平臺,其銷售數據蘊含著巨大的商業價值。通過對小紅書銷售數據的深入分析, ...
2025-05-16Excel作為最常用的數據分析工具,有沒有什么工具可以幫助我們快速地使用excel表格,只要輕松幾步甚至輸入幾項指令就能搞定呢? ...
2025-05-15數據,如同無形的燃料,驅動著現代社會的運轉。從全球互聯網用戶每天產生的2.5億TB數據,到制造業的傳感器、金融交易 ...
2025-05-15大數據是什么_數據分析師培訓 其實,現在的大數據指的并不僅僅是海量數據,更準確而言是對大數據分析的方法。傳統的數 ...
2025-05-14CDA持證人簡介: 萬木,CDA L1持證人,某電商中廠BI工程師 ,5年數據經驗1年BI內訓師,高級數據分析師,擁有豐富的行業經驗。 ...
2025-05-13CDA持證人簡介: 王明月 ,CDA 數據分析師二級持證人,2年數據產品工作經驗,管理學博士在讀。 學習入口:https://edu.cda.cn/g ...
2025-05-12CDA持證人簡介: 楊貞璽 ,CDA一級持證人,鄭州大學情報學碩士研究生,某上市公司數據分析師。 學習入口:https://edu.cda.cn/g ...
2025-05-09CDA持證人簡介 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度、美團、阿里等 ...
2025-05-07相信很多做數據分析的小伙伴,都接到過一些高階的數據分析需求,實現的過程需要用到一些數據獲取,數據清洗轉換,建模方法等,這 ...
2025-05-06以下的文章內容來源于劉靜老師的專欄,如果您想閱讀專欄《10大業務分析模型突破業務瓶頸》,點擊下方鏈接 https://edu.cda.cn/g ...
2025-04-30CDA持證人簡介: 邱立峰 CDA 數據分析師二級持證人,數字化轉型專家,數據治理專家,高級數據分析師,擁有豐富的行業經驗。 ...
2025-04-29CDA持證人簡介: 程靖 CDA會員大咖,暢銷書《小白學產品》作者,13年頂級互聯網公司產品經理相關經驗,曾在百度,美團,阿里等 ...
2025-04-28CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-27數據分析在當今信息時代發揮著重要作用。單因素方差分析(One-Way ANOVA)是一種關鍵的統計方法,用于比較三個或更多獨立樣本組 ...
2025-04-25CDA持證人簡介: 居瑜 ,CDA一級持證人國企財務經理,13年財務管理運營經驗,在數據分析就業和實踐經驗方面有著豐富的積累和經 ...
2025-04-25