CDA數(shù)據(jù)分析員培訓

  培訓講師:駱飛

講師背景:
駱飛老師北京郵電大學-移動互聯(lián)網(wǎng)與信息化實驗室-研究員;北京郵電大學-信息與通信工程學院-外聘講師;網(wǎng)銳國家網(wǎng)絡實驗室-研究員;中國移動集團廣東移動有限分公司特邀講師;中國移動集團山東移動有限分公司特邀講師。2006年中國移動通信集團光傳輸 詳細>>

駱飛
    課程咨詢電話:

CDA數(shù)據(jù)分析員培訓詳細內容

CDA數(shù)據(jù)分析員培訓

CDA數(shù)據(jù)分析員培訓
【授課對象】
本課程要求有一定的數(shù)學基礎,掌握概率論和統(tǒng)計理論基礎,有一定的數(shù)據(jù)分析經驗。
適合于如下人員:數(shù)據(jù)分析師、大數(shù)據(jù)系統(tǒng)研發(fā)人員、大數(shù)據(jù)系統(tǒng)架構師、業(yè)務支撐部等對業(yè)務數(shù)據(jù)分析與挖掘有專業(yè)要求的相關人員。
【課程目標】
CDA(Certified Data Analyst)全稱“注冊數(shù)據(jù)分析師”,由“CERTIFIED DATA ANALYST INSTITUTE(CDA數(shù)據(jù)分析師協(xié)會)”發(fā)起成立的職業(yè)簡稱,旨在培養(yǎng)正規(guī)化、科學化、專業(yè)化的數(shù)據(jù)分析人才隊伍,進一步提升數(shù)據(jù)分析師的職業(yè)素養(yǎng)與能力水平,促進數(shù)據(jù)分析行業(yè)的高質量持續(xù)快速發(fā)展。CDA數(shù)據(jù)分析師面向商業(yè)職場數(shù)據(jù)分析,分為三個等級,在國內由人大經濟論壇主辦資格考試,通過考試者可以獲得CDA協(xié)會頒發(fā)的數(shù)據(jù)分析師資格證書,此證書代表數(shù)據(jù)分析師人才技能水平,為企業(yè)事業(yè)單位選拔和聘用專業(yè)人才的參考依據(jù)。
本課程基于CDA的認證知識要求,圍繞商業(yè)問題,全面介紹了數(shù)據(jù)挖掘的標準流程,數(shù)據(jù)預處理,數(shù)據(jù)挖掘方法,數(shù)據(jù)挖掘模型,模型評估,模型參數(shù)優(yōu)化,等等,使得學員掌握數(shù)據(jù)挖掘的方法、模型、工具。
通過本課程的學習,達到如下目的:
了解數(shù)據(jù)分析與數(shù)據(jù)挖掘的基本知識,理解大數(shù)據(jù)思維方式。
掌握數(shù)據(jù)挖掘的基本過程和步驟,掌握數(shù)據(jù)挖掘的思路和框架。
能夠理解分析模型原理,掌握模型應用場景,能夠利用模型解決復雜的商業(yè)問題。
掌握常用的數(shù)據(jù)模型,能夠根據(jù)商業(yè)問題選擇合適的分析模型。
熟悉SPSS基本操作,掌握分析操作,能夠解讀分析結果,并轉化為業(yè)務策略。
【授課時間】
4~5天時間
【學員要求】
每個學員自備一臺便攜機(必須)。
便攜機中事先安裝好Excel 2013軟件。
便攜機中事先安裝好SPSS v19軟件。
注:講師可以提供試用版本軟件及分析數(shù)據(jù)源。
【授課方式】
基礎知識精講 + 案例講解 + 操作演練 + 實際業(yè)務問題分析 + SPSS實際操作
本課程突出數(shù)據(jù)挖掘的實際應用,結合行業(yè)的典型應用特點,從實際問題入手,引出相關知識,進行大數(shù)據(jù)的收集與處理;引導學員思考,構建分析模型,進行數(shù)據(jù)分析與挖掘,以及數(shù)據(jù)呈現(xiàn)與解讀,全過程演練操作,以達到提升學員的數(shù)據(jù)綜合分析能力,支撐運營決策的目的。
【課程大綱】
第一部分:數(shù)據(jù)集基礎知識(了解你的數(shù)據(jù)集)
數(shù)據(jù)集概述
數(shù)據(jù)集的類型
數(shù)據(jù)集屬性的類型
標稱
序數(shù)
度量
數(shù)據(jù)質量三要素
準確性
完整性
一致性
數(shù)據(jù)預處理的內容
數(shù)據(jù)清理(缺失值、離群值的處理方法)
數(shù)據(jù)歸約(維災難、維歸約、主成分分析)
特征子集選擇
特征創(chuàng)建/屬性構造
數(shù)據(jù)離散化和二元化
屬性/變量轉換
數(shù)據(jù)探索性分析
統(tǒng)計匯總
可視化
演練:描述性分析(頻數(shù)、描述、探索、分類匯總)
第二部分:數(shù)據(jù)挖掘流程(基礎,決定你的高度)
數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘的標準流程(CRISP-DM)
商業(yè)理解
數(shù)據(jù)準備
數(shù)據(jù)理解
模型建立
模型評估
模型應用
案例:4G終端營銷項目挖掘過程分析
案例:客戶匹配度模型—數(shù)據(jù)建模
常用數(shù)據(jù)統(tǒng)計指標
集中程度:均值、中位數(shù)、眾數(shù)
離開程度:方差、標準差、極差
分布趨勢:偏度、峰度
理解分布:正態(tài)分布、T分布、F分布
SPSS基本操作(預處理)
數(shù)據(jù)導入
數(shù)據(jù)排序(排序個案)
重復數(shù)據(jù)處理(標識重復個案)
缺失值處理(替換缺失值)
生成新變量(計算變量、重新編碼)
數(shù)據(jù)分組(分類匯總)
數(shù)據(jù)合并(合并文件)
演練:SPSS基本操作
第三部分:數(shù)據(jù)挖掘實戰(zhàn)篇
參數(shù)檢驗分析(樣本均值檢驗)
商業(yè)問題:如何驗證營銷效果的有效性?
參數(shù)檢驗概述
單樣本T檢驗
兩獨立樣本T檢驗
兩配對樣本T檢驗
參數(shù)檢驗原理以及步驟
參數(shù)檢驗適用場景
案例:電信運營商的ARPU值評估分析(單樣本)
案例:信用卡消費金額評估分析(單樣本)
案例:營銷方式與產品銷量的影響分析(兩獨立樣本)
案例:吸煙與膽固醇升高的分析(兩獨立樣本)
案例:營銷方式有效性評估(兩配對樣本)
案例:減肥效果評估(兩配對樣本)
非參數(shù)檢驗分析(樣本分布檢驗)
商業(yè)問題:這些屬性數(shù)據(jù)的分布情況如何?如何從數(shù)據(jù)分布中看出問題?
非參數(shù)檢驗概述
單樣本檢驗
兩獨立樣本檢驗
兩相關樣本檢驗
兩配對樣本檢驗
非參數(shù)檢驗原理
卡方檢驗、二項分布、游程檢驗的原理及適用場景
案例:死亡分布檢驗(單樣本-卡方檢驗)
案例:產品合格率檢驗(單樣本-二項分布)
案例:身高分布差異檢驗(單樣本-KS檢驗)
案例:設備正常工作檢驗(單樣本-隨機分布)
案例:制造工藝差異檢驗(兩獨立樣本-MW檢驗)
案例:訓練新方法有效性檢驗(兩配對樣本-符號/秩檢驗)
案例:促銷方式效果檢驗(多相關樣本-Friedman檢驗)
案例:客戶滿意度差異檢驗(多相關樣本-Cochran Q檢驗)
案例:評委評判黑幕檢驗(多相關樣本-Kendall W檢驗)
相關分析(相關程度計算)
商業(yè)問題:這兩個屬性是否會相互影響?影響程度大嗎?
相關分析概述
計算相關系數(shù)的三個公式
案例:家庭生活開支的相關分析(Pearson簡單相關系數(shù))
案例:營銷費用與銷售額的相關分析
案例:哪些因素與汽車銷量有相關性
案例:腰圍與體重的相關分析(偏相關分析)
方差分析(影響因素分析)
商業(yè)問題:哪些才是影響銷量的關鍵因素?
方差分析原理
方差分析的步驟
方差分析適用場景
如何解讀方差分析結果
案例:終端陳列位置對終端銷量的影響分析(單因素)
案例:廣告形式、地區(qū)對銷量的影響因素分析(多因素)
案例:2015年大學生工資與父母職業(yè)的關系
案例:飼料對生豬體重的影響分析(協(xié)方差分析)
回歸分析(預測分析)
商業(yè)問題:如何預測未來的銷售量(定量分析)?
回歸分析概述及適用場景
回歸分析的檢驗過程
如何選擇最優(yōu)回歸模型
解讀回歸分析結果
案例:推廣費用、辦公費用與銷售額的關系(線性回歸)
案例:人均現(xiàn)金消費支出對人均食品消費支出的影響(曲線回歸)
帶分類變量的回歸分析
比如,如何預測隨著季節(jié)性變化的銷量情況
案例:員工工齡、性別與終端銷售的關系分析
案例:產品銷量的季節(jié)性變化預測
邏輯回歸分析(預測分析)
商業(yè)問題:如果評估用戶購買某產品的概率?
邏輯回歸分析原理
邏輯回歸分析的適用場景
案例:客戶購買預測分析(二元邏輯回歸)
案例:品牌選擇預測分析(多項邏輯回歸)
時間序列分析(預測分析)
商業(yè)問題:隨著時間變化,未來的銷量變化趨勢如何?
時序分析概述
移動平均MA模型
指數(shù)平滑ES模型
自回歸滑動平均ARIMA模型
季節(jié)分解模型
時序分析適用場景
案例:汽車銷量預測分析(指數(shù)平滑)
案例:上交所指數(shù)收益率預測分析(ARIMA)
案例:服裝銷售數(shù)據(jù)季節(jié)性趨勢預測分析(季節(jié)分解)
第四部分:高級數(shù)據(jù)挖掘方法
聚類分析(Clustering)
商業(yè)問題:我們的客戶有幾類?各類特征是什么?
聚類方法原理介紹
聚類方法適用場景
系統(tǒng)聚類(層次聚類)算法原理
如何判定最佳聚類類別數(shù)量
案例:數(shù)據(jù)聚類分析--小康指數(shù)劃分(Q型聚類)
案例:變量聚類分析--裁判標準一致性分析(R型聚類)
K均值聚類(快速聚類)算法原理
案例:移動三大品牌細分市場合適嗎?
案例:如何評選優(yōu)秀員工(固定聚類中心)
演練:如何選擇新產品試銷地點?
決策樹分類分析(Classification)
商業(yè)問題:這類客戶有什么特征?有什么潛在銷售機會?
決策樹原理介紹
構建決策樹的三個關鍵問題
如何選擇最佳屬性來構建節(jié)點
如何分裂變量
修剪決策樹
選擇最優(yōu)屬性
熵、基尼索引、分類錯誤
屬性劃分增益
如何分裂變量
多元劃分與二元劃分
連續(xù)變量離散化(最優(yōu)劃分點)
修剪決策樹
剪枝原則
預剪枝與后剪枝
如何評估分類性能
案例:銀行低信用客戶特征分析(決策樹分類)
基于規(guī)則的分類
基于規(guī)則分類原理介紹
評估規(guī)則的質量
構建分類規(guī)則:順序覆蓋法
規(guī)則增長策略
最近鄰分類
樸素貝葉斯分類
貝葉斯分類原理
計算類別屬性的條件概率
估計連續(xù)屬性的條件概率
預測分類概率(計算概率)
案例:評估銀行用戶拖欠貨款的概率
人工神經網(wǎng)絡(ANN)
神經網(wǎng)絡基本原理
神經網(wǎng)絡的結構
ANN關鍵問題
MLP與RBF
案例:評估銀行用戶拖欠貨款的概率
判別分析
判別分析原理
距離判別法
典型判別法
貝葉斯判別法
案例:MBA學生錄取判別分析
案例:上市公司類別評估
關聯(lián)分析(Association)
商業(yè)問題:購買A產品的顧客還常常要購買其他什么產品?
關聯(lián)規(guī)則原理介紹
關聯(lián)規(guī)則的兩個關鍵參數(shù)
支持度
置信度
Apriori算法介紹
FP-Growth算法介紹
關聯(lián)規(guī)則適用場景
案例:商品套餐設計、商品交叉銷售(關聯(lián)分析)
客戶價值評估RFM模型
商業(yè)問題:如何評估客戶的價值?不同價值客戶的營銷策略有什么區(qū)別?
RFM模型介紹
RFM模型用戶分類與業(yè)務策略
RFM與客戶活躍度分析
案例:客戶價值如何評估(什么才是VIP用戶)
案例:如何選擇促銷用戶(響應模型與促銷)
案例:回頭客用戶特征分析(決策樹分析)
主成分分析
主成分分析方法介紹
主成分分析基本思想
主成分分析步驟
案例:評估汽車購買者關注的哪些因素
第五部分:統(tǒng)計圖表篇(看圖說話)
柱狀圖/線圖/餅圖/高低圖/箱圖/散點圖/直方圖
圖形的表達及適用場景
案例:各種圖形繪制
實戰(zhàn)1:客戶流失預警與客戶挽留之真實數(shù)據(jù)分析實踐
實戰(zhàn)2:銀行信用風險分析
結束:課程總結與問題答疑。

 

駱飛老師的其它課程

互聯(lián)網(wǎng)思維和語音IP化應用(課程大綱)“互聯(lián)網(wǎng)已經改變了音樂、游戲、媒體、零售和金額行業(yè),未來互聯(lián)網(wǎng)精神將改變每一個行業(yè),傳統(tǒng)行業(yè)即使還想不出怎么去結合互聯(lián)網(wǎng),也一定要具備互聯(lián)網(wǎng)思維。”(馬化騰)互聯(lián)網(wǎng)思維是零距離、網(wǎng)絡化的經營管理思維。互聯(lián)網(wǎng)思維下,企業(yè)管理需要以更加靈活的組織應對復雜的環(huán)境。張瑞敏說,互聯(lián)網(wǎng)時代的管理沒有標桿,企業(yè)只有自己去尋求適合的管理

 講師:駱飛詳情


《5G移動通信技術發(fā)展方向及未來趨勢分析》課程大綱【培訓目標】5G移動通信技術作為目前最前沿的通信技術,是應2020年后通信技術發(fā)展需求而生的,目前該技術尚處于探索研究階段。本課程從移動通信技術的發(fā)展歷程展開分析,對5G移動通信技術的特點、優(yōu)點及未來發(fā)展趨勢等幾方面出發(fā)進行概述,分析關鍵指標和技術,引領我國移動通信行業(yè)的新一輪變革?!九嘤枌ο蟆肯嚓P員工【培訓

 講師:駱飛詳情


《5G移動通信技術發(fā)展方向及未來趨勢分析》課程大綱【培訓目標】5G移動通信技術作為目前最前沿的通信技術,是應2020年后通信技術發(fā)展需求而生的,目前該技術尚處于探索研究階段。本課程從移動通信技術的發(fā)展歷程展開分析,對5G移動通信技術的特點、優(yōu)點及未來發(fā)展趨勢等幾方面出發(fā)進行概述,分析關鍵指標和技術,引領我國移動通信行業(yè)的新一輪變革?!九嘤枌ο蟆肯嚓P員工【培訓

 講師:駱飛詳情


課程大綱:課程章節(jié)內容提要課程時間從概念到落地:智能家居與智慧家庭技術及應用概述智慧家庭/智能家居發(fā)展概述從數(shù)字化、信息化到智能化、智慧化概述未來城市及家庭的信息服務需求及趨勢智能家居/智慧家庭概念模型規(guī)劃設計基本建設思路解決方案總體架構描述應用+家庭云平臺管+端互聯(lián)網(wǎng)+信息通信+家庭生活傳統(tǒng)電信運營的戰(zhàn)略抉擇(以中國電信為例)中國電信集團智慧家庭戰(zhàn)略解讀中

 講師:駱飛詳情


智慧家庭認證工程師①培訓目標在“智慧家庭”的這一戰(zhàn)場上,各個運營商都卯足了勁,戰(zhàn)術各不相同。中國移動押寶“和·家庭”計劃并推出“魔百和”系列產品。中國電信成立智慧家庭產業(yè)聯(lián)盟并發(fā)布產品“悅me”、全新智能寬帶電視“天翼高清”,為用戶提供家庭信息化服務綜合解決方案;中國聯(lián)通發(fā)布“智慧沃家”業(yè)務,滿足家庭的智能化信息需求。本課程以智慧家庭建設目前存在的四大挑戰(zhàn)為

 講師:駱飛詳情


智慧家庭組網(wǎng)技術①培訓目標本課程以電信運營商智慧家庭WLAN網(wǎng)絡目前存在的四大挑戰(zhàn)為切入點,重點介紹電信運營商電信級WLAN網(wǎng)絡體系結構、核心平臺以及標準技術體系、關鍵核心技術等內容,并進一步重點介紹WLAN網(wǎng)絡規(guī)劃方法、流程和重點工作,同時重點闡述WLAN網(wǎng)絡優(yōu)化基礎技術與方法,WLAN重點優(yōu)化內容以及實際案例。②大綱【培訓對象】網(wǎng)優(yōu)中心及地市公司W(wǎng)LAN

 講師:駱飛詳情


云原生架構與Devops運維課程定位與課程目標互聯(lián)網(wǎng)行業(yè)的火爆讓“敏捷”和“DevOps”的管理理念成為IT項目管理的主流?!懊艚荨笔强焖夙憫枨笞兓皶r交付階段性產出,達到讓客戶滿意的一種軟件開發(fā)管理模式。“DevOps”理念更是超越了項目管理方面的范疇,它關注的是IT企業(yè)各部門角色能夠更好的交流和協(xié)作的文化變革。課程通過大量真實的案例,縱向對比國外流行

 講師:駱飛詳情


政企產品經理解決方案能力提升課程定位與課程目標2021年,世界飛速變化。以5G、大數(shù)據(jù)、云計算、人工智能為代表的新一輪科技革命和以數(shù)字化、信息化、智能化為標志的產業(yè)變革蓄勢待發(fā)。新冠肺炎疫情的疊加影響,又使得數(shù)字經濟的作用突顯。后疫情時代,數(shù)字化轉型將成為推動經濟社會發(fā)展的新引擎。在新一輪數(shù)字化浪潮中,千行百業(yè)面臨革新。作為中國領先的綜合信息服務提供商,中國

 講師:駱飛詳情


智慧城市交付項目管理課程定位與課程目標2014年稱為中國的智慧城市建設元年,在這一重要的時間節(jié)點上,有必要對智慧城市概念、技術和發(fā)展進行一次全方位的梳理與總結。從技術的角度,對智慧城市的概念出現(xiàn)、發(fā)展現(xiàn)狀、總體技術框架、核心關鍵技術、標準與評估體系、運營與應用模式等方面,進行盡可能詳細和系統(tǒng)的闡述與介紹。希望能夠為讀者提供一個智慧城市技術發(fā)展的全景式概覽。目

 講師:駱飛詳情


云計算基礎課程定位與課程目標云計算(cloudcomputing)是基于互聯(lián)網(wǎng)的相關服務的增加、使用和交付模式,通常涉及通過互聯(lián)網(wǎng)來提供動態(tài)易擴展且經常是虛擬化的資源。云是網(wǎng)絡、互聯(lián)網(wǎng)的一種比喻說法。過去在圖中往往用云來表示電信網(wǎng),后來也用來表示互聯(lián)網(wǎng)和底層基礎設施的抽象。狹義云計算指IT基礎設施的交付和使用模式,指通過網(wǎng)絡以按需、易擴展的方式獲得所需資源;

 講師:駱飛詳情


COPYRIGT @ 2001-2018 HTTP://m.musicmediasoft.com INC. ALL RIGHTS RESERVED. 管理資源網(wǎng) 版權所有