Spark大數(shù)據(jù)分析 5天

  培訓(xùn)講師:孫增輝

講師背景:
孫增輝老師講師資質(zhì)?Oracle數(shù)據(jù)庫DBA認(rèn)證?SAS數(shù)據(jù)分析高級程序員認(rèn)證?Hadoop大數(shù)據(jù)及數(shù)據(jù)分析講師講師簡介?數(shù)據(jù)庫專家。孫增輝老師多年從事數(shù)據(jù)庫的管理和教學(xué)工作。對oracle、sqlserver、mysql等關(guān)系型數(shù)據(jù)庫有豐 詳細(xì)>>

    課程咨詢電話:

Spark大數(shù)據(jù)分析 5天詳細(xì)內(nèi)容

Spark大數(shù)據(jù)分析 5天

Spark數(shù)據(jù)分析
課程介紹
本課程將關(guān)注spark的數(shù)據(jù)分析技術(shù)實(shí)際應(yīng)用。
課程目標(biāo)
數(shù)據(jù)分析
培訓(xùn)對象
開發(fā)人員
課程長度
5天(30學(xué)時(shí))
培訓(xùn)方式
案例分析、情景演練
課程內(nèi)容
第1天
主題
Spark 的環(huán)境搭建與運(yùn)行
大綱
Spark 的本地安裝與配置
Spark 集群
Spark 編程模型
主題
數(shù)據(jù)分析系統(tǒng)商業(yè)案例
大綱
個(gè)性化
目標(biāo)營銷和客戶細(xì)分
預(yù)測建模與分析
機(jī)器學(xué)習(xí)的系統(tǒng)架構(gòu)
第2天
主題
Spark 上數(shù)據(jù)的獲取、處理與準(zhǔn)備
大綱
獲取公開數(shù)據(jù)集
處理與轉(zhuǎn)換數(shù)據(jù)
從數(shù)據(jù)中提取有用特征
主題
構(gòu)建基于Spark 的推薦引擎
大綱
推薦模型的分類
提取有效特征
訓(xùn)練推薦模型
使用推薦模型
推薦模型效果的評估.
第3天
主題
Spark 構(gòu)建分類模型
大綱
分類模型的種類
從數(shù)據(jù)中抽取合適的特征
訓(xùn)練分類模型
使用分類模型
評估分類模型的性
改進(jìn)模型性能以及參數(shù)調(diào)優(yōu).
主題
Spark 構(gòu)建回歸模型
大綱
回歸模型的種類
從數(shù)據(jù)中抽取合適的特征
回歸模型的訓(xùn)練和應(yīng)用
評估回歸模型的性能
改進(jìn)模型性能和參數(shù)調(diào)優(yōu).
第4天
主題
Spark 構(gòu)建聚類模型
大綱
聚類模型的類型
從數(shù)據(jù)中提取正確的特征
訓(xùn)練聚類模型
使用聚類模型進(jìn)行預(yù)測
評估聚類模型的性能
主題
Spark 應(yīng)用于數(shù)據(jù)降維大綱
降維方法的種類
從數(shù)據(jù)中抽取合適的特征
訓(xùn)練降維模型使用降維模型第5天
主題
Spark 高級文本處理技術(shù)
大綱
處理文本數(shù)據(jù)有什么特別之處
從數(shù)據(jù)中抽取合適的特征
評估文本處理技術(shù)的作用
主題
Spark Streaming 在實(shí)時(shí)機(jī)器學(xué)習(xí)上的應(yīng)用
大綱
在線學(xué)習(xí).
流處理.
使用Spark Streaming 進(jìn)行在線學(xué)習(xí)

 

孫增輝老師的其它課程

大數(shù)據(jù)處理技術(shù)培訓(xùn)課程介紹Hadoop實(shí)現(xiàn)了一個(gè)分布式文件系統(tǒng)(HadoopDistributedFileSystem),簡稱HDFS。HDFS有高容錯(cuò)性的特點(diǎn),并且設(shè)計(jì)用來部署在低廉的(low-cost)硬件上;而且它提供高傳輸率(highthroughput)來訪問應(yīng)用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(largedataset)的應(yīng)用程序。課程目標(biāo)掌握

 講師:孫增輝詳情


信息安全5天    12.08

信息安全課程介紹本課程涵蓋了信息安全從概念到細(xì)節(jié)的多個(gè)方面。本課程同樣適用于初學(xué)者和專業(yè)人員,相對全面地提供了一站式的參考內(nèi)容。課程目標(biāo)安全基礎(chǔ)數(shù)據(jù)安全如何保護(hù)網(wǎng)絡(luò)上的資產(chǎn)網(wǎng)絡(luò)安全計(jì)算機(jī)安全應(yīng)用程序安全安全操作培訓(xùn)對象相關(guān)的技術(shù)人員、管理人員、運(yùn)維人員課程長度5天課程內(nèi)容第1天主題信息安全概述大綱信息保護(hù)的重要性信息安全的演變合理的安全投資安全方法論建立一個(gè)

 講師:孫增輝詳情


應(yīng)用容器引擎Docker課程介紹Docker是基于GO語言實(shí)現(xiàn)的云開源項(xiàng)目,誕生于2013年初。Docker希望達(dá)到應(yīng)用組件級別的“一次封裝,到處運(yùn)行”。學(xué)員可以簡單將docker容器理解為沙盒。每個(gè)容器運(yùn)行一個(gè)應(yīng)用,不同的容器互相隔離,容器之間也可以建立通信機(jī)制。容器的創(chuàng)建和停止十分快速,容器自身對資源的需求也十分有限,遠(yuǎn)遠(yuǎn)低于虛擬機(jī)。很多時(shí)候直接把容器黨

 講師:孫增輝詳情


云計(jì)算openstack課程介紹云計(jì)算從提出到成熟,中間經(jīng)歷了較長的時(shí)間。云計(jì)算的各種概念也在不斷發(fā)展更新。本課程能夠給想要學(xué)習(xí)云計(jì)算知識的人們,提供一個(gè)可供學(xué)習(xí)的云計(jì)算系統(tǒng),幫助大家學(xué)習(xí)、實(shí)驗(yàn)和使用。課程目標(biāo)了解云計(jì)算,知道云計(jì)算產(chǎn)生的原因以及應(yīng)用場景。了解云存儲,知道云計(jì)算系統(tǒng)中大數(shù)據(jù)的存儲方式。私有云和公有云。云計(jì)算的兩種不同應(yīng)用場景,它們的聯(lián)系與區(qū)別

 講師:孫增輝詳情


mysql 4天    12.08

MYSQL數(shù)據(jù)庫課程介紹本課程介紹MySQL的啟動(dòng)、連接等基礎(chǔ)應(yīng)用開始,SQL語句的使用、MySQL內(nèi)置函數(shù)、備份與恢復(fù)、數(shù)據(jù)庫優(yōu)化、數(shù)據(jù)庫安全等主題,介紹相關(guān)開發(fā)實(shí)例課程目標(biāo)了解mysql數(shù)據(jù)庫的體系結(jié)構(gòu)創(chuàng)建和管理mysql數(shù)據(jù)庫備份和恢復(fù)數(shù)據(jù)庫培訓(xùn)對象軟件開發(fā)人員、數(shù)據(jù)庫管理員課程長度5天(30學(xué)時(shí))培訓(xùn)方式案例分析、情景演練課程內(nèi)容第1天主題體系結(jié)構(gòu)大

 講師:孫增輝詳情


Oracle數(shù)據(jù)庫管理(DBA)課程介紹本課程是你作為Oracle專業(yè)人員走向成功的第一步。課程設(shè)計(jì)為你打下基本的數(shù)據(jù)庫管理的堅(jiān)實(shí)基礎(chǔ)并幫助你準(zhǔn)備通過OracleCertifiedAssociate考試。課程目標(biāo)課程中,你將學(xué)習(xí)如何安裝和維護(hù)Oracle數(shù)據(jù)庫。學(xué)員將獲得Oracle數(shù)據(jù)庫結(jié)構(gòu)的概念性理解,以及它的組件是如何彼此協(xié)調(diào)工作的。學(xué)員將學(xué)習(xí)如何創(chuàng)建

 講師:孫增輝詳情


Oracle調(diào)優(yōu)培訓(xùn)課程介紹該培訓(xùn)課程面向大中型企業(yè)中的數(shù)據(jù)庫相關(guān)的開發(fā)人員和管理人員。課程的主要內(nèi)容是Oracle11g數(shù)據(jù)庫性能調(diào)優(yōu)的各種實(shí)例、方法、技巧以及與之對應(yīng)的原理的講解通過本課程地學(xué)習(xí)。學(xué)員可以大大的提升數(shù)據(jù)庫性能調(diào)優(yōu)的能力。課程結(jié)合大量案例,使學(xué)員能夠理論結(jié)合實(shí)際,學(xué)以致用。課程目標(biāo)←掌握Oracle11g數(shù)據(jù)庫性能調(diào)優(yōu)的各種實(shí)例、方法、技巧

 講師:孫增輝詳情


Oracle數(shù)據(jù)庫調(diào)優(yōu)課程課時(shí):4天1.課程適合對象Oracle數(shù)據(jù)庫運(yùn)維人員(DBA)2.培訓(xùn)所需實(shí)驗(yàn)設(shè)備及軟件清單編號設(shè)備及軟件名稱對應(yīng)課程1Oracle11g數(shù)據(jù)庫課程安排上午(9:00-12:00)下午(14:00-17:00)第一天(1).Oracle數(shù)據(jù)庫性能診斷工具?最根本的性能信息工具——數(shù)據(jù)庫數(shù)據(jù)字典和動(dòng)態(tài)性能視圖?診斷性能定位問題工具:S

 講師:孫增輝詳情


SAS數(shù)據(jù)分析從入門到精通課程介紹SAS數(shù)據(jù)分析軟件是應(yīng)用最廣泛的商業(yè)統(tǒng)計(jì)分析軟件之一。本課程是從基礎(chǔ)開始到專業(yè)應(yīng)用的整體內(nèi)容,幫助您理解數(shù)據(jù)分析的操作。課程目標(biāo)SAS編程基礎(chǔ)SAS常用函數(shù)及應(yīng)用SAS數(shù)據(jù)集處理操作SAS宏編程SASPROCSQL描述統(tǒng)計(jì)T檢驗(yàn)方差分析回歸分析。培訓(xùn)對象數(shù)據(jù)庫管理員、開發(fā)人員課程長度5天(30學(xué)時(shí))培訓(xùn)方式案例分析、情景演練

 講師:孫增輝詳情


課程名稱課程介紹本課程是大數(shù)據(jù)與使用sas做數(shù)據(jù)挖掘的基礎(chǔ)課。主要內(nèi)容是:1、介紹了大數(shù)據(jù)的定義?;仡櫞髷?shù)據(jù)的時(shí)代背景、大數(shù)據(jù)的構(gòu)成,已經(jīng)大數(shù)據(jù)的“4v”特征。并且介紹了大數(shù)據(jù)的技術(shù)與應(yīng)用范圍。并介紹了大數(shù)據(jù)已經(jīng)對我們產(chǎn)生的影響。以及一個(gè)廣受歡迎的大數(shù)據(jù)支撐產(chǎn)品---hadoop軟件的安裝2、大數(shù)據(jù)是數(shù)據(jù)分析的前提,也是從數(shù)據(jù)中產(chǎn)生價(jià)值的基礎(chǔ)。真正產(chǎn)生價(jià)值,

 講師:孫增輝詳情


COPYRIGT @ 2001-2018 HTTP://m.musicmediasoft.com INC. ALL RIGHTS RESERVED. 管理資源網(wǎng) 版權(quán)所有