為什么越來越多人學(xué)習(xí)大數(shù)據(jù)?
大數(shù)據(jù)相關(guān)人才的欠缺將會成為影響大數(shù)據(jù)市場發(fā)展的一個重要因素
《大數(shù)據(jù)人才報告》指出,未來3-5年內(nèi)將會出現(xiàn)150萬的大數(shù)據(jù)人才的缺口
大數(shù)據(jù)方面職位列在本??茖I(yè)畢業(yè)生“高薪榜”前五且人才缺少
中國的大數(shù)據(jù)市場規(guī)模已達(dá)到2485億元, 并且市場規(guī)模每年都在持續(xù)上升
緊扣行業(yè)需求,傳授專業(yè)知識
課程階段 | 課程內(nèi)容 |
Hadoop離線計算 | 大數(shù)據(jù)概述和Hadoop環(huán)境安裝 云計算和分布式、大數(shù)據(jù)應(yīng)用場景、分布式文件系統(tǒng)設(shè)計原理、Hadoop集群環(huán)境的安裝、HDFS的基本操作(命令行)、HDFS的配置文件的核心相關(guān)參數(shù)。 HDFS原理和應(yīng)用 HDFS原理分析、HDFS工作流程分析、訪問HDFS、分布式日志采集案例。 MapReduce和Yarn MapReducer原理分析、MapReducer的算法模型、MapReduce和Yarn集群的配置、Yarn模型的運(yùn)行管理機(jī)制、MapReduce的本地運(yùn)行模式。 MapReduce編程案例 流量統(tǒng)計、匯總排序、訂單分組topN、線段重疊統(tǒng)計、電影評分的topN、倒排索引、JOIN算法、MapReduce分布式啟動運(yùn)行流程、MapReduce數(shù)據(jù)處理流程、數(shù)據(jù)傾斜。 Hadoop架構(gòu)和源碼分析 |
數(shù)據(jù)倉庫 | Hive Hive核心工作機(jī)制、Hive的安裝和運(yùn)行、Hive的DDL操作、SQL語法加強(qiáng)。 Hive加強(qiáng) Hive數(shù)據(jù)類型、單行函數(shù)、聚合函數(shù)和表生成函數(shù)、Hive案例、窗口函數(shù)、Hive自定義函數(shù)等。 Hadoop生態(tài)圈組件 Flume工作機(jī)制、Flume安裝和配置、Flume攔截器、Flume高可用、日志采集分類匯總、Sqoop工作機(jī)制、Sqoop的安裝部署、Sqoop的導(dǎo)入導(dǎo)出案例案例、Azkaban的工作流調(diào)度器介紹、Azkaban的安裝部署和使用配置等。 HBASE HBASE概述和核心特點、HBASE工作原理、HBASE的集群部署、shell客戶端的基本操作、Java操作HBASE、HBASE讀寫操作和流程等。 |
Storm實時計算 | Storm編程入門 Storm概述和原理、Storm的本地和集群模式、Storm的核心組件詳解、Storm的并行運(yùn)算和分組運(yùn)算、Storm集群執(zhí)行過程分析,Storm案例。 Storm架構(gòu)和源碼分析 Storm核心機(jī)制 Ack機(jī)制概述、Storm通信機(jī)制、Storm數(shù)據(jù)分發(fā)機(jī)制。 消息中間件Kafka的使用 KafKa概述和原理、KafKa的集群環(huán)境部署、KafKa的生產(chǎn)者和消費者、KafKa分組策略、KafKa配置詳解。 |
Scala語言 | Scala語言基礎(chǔ)、Scala函數(shù)和方法、Scala數(shù)據(jù)結(jié)構(gòu)、Scala面向?qū)ο蟆㈦[式參數(shù)、隱式參數(shù)類型轉(zhuǎn)換、泛型、視圖界定、上下文界定、Akka的RPC通信框架等。 |
Spark內(nèi)存計算 | Spark入門 Spark原理、Spark架構(gòu)分析、Spark集群安裝、Spark-shell單機(jī)和集群、Spark任務(wù)執(zhí)行流程、Spark程序調(diào)試。 Spark RDD RDD運(yùn)行架構(gòu)、Transformation操作API、RDD分區(qū)數(shù)據(jù)的讀取、Action操作API、Spark編程案例、自定義排序、Stage切分、Spark整體執(zhí)行流程。 Spark SQL Spark SQL原理、Spark SQL應(yīng)用場景、Spark SQL性能分析、Spark SQL的案例、Spark SQL函數(shù)。 Spark Streaming Stream運(yùn)行架構(gòu)、SparkStream工作原理、Spark Stream和KafKa整合、Spark Stream和Redis的整合等。 Spark架構(gòu)和源碼分析 |
大數(shù)據(jù)項目 | 大型日志采集系統(tǒng)、大數(shù)據(jù)綜合項目 |
Python、人工智能 |
大數(shù)據(jù)的應(yīng)用價值廣闊
借助于大數(shù)據(jù)技術(shù),分析客戶行為,進(jìn)行商品針對性廣告投放
哪種題財?shù)挠耙曌髌犯邇r值,明星流量關(guān)注群體等數(shù)據(jù)分析
利用大數(shù)據(jù)優(yōu)化物流的網(wǎng)絡(luò),提高物流的效率,降低物流資金
利用大數(shù)據(jù)的技術(shù)分析用戶用電模式,設(shè)計電力需求響應(yīng)系統(tǒng)
高頻交易、社交情緒分析和信貸風(fēng)險分析三大金融創(chuàng)新領(lǐng)域發(fā)揮重大作用。
大數(shù)據(jù)技術(shù)構(gòu)建起強(qiáng)大的安全體系,企業(yè)可以利用大數(shù)據(jù)抵御網(wǎng)絡(luò)攻擊。
利用大數(shù)據(jù)實現(xiàn)餐飲O2O模式,改變傳統(tǒng)餐飲經(jīng)營方式。
利用數(shù)據(jù)挖掘來了解客戶的內(nèi)在需求,消費群體消費能力等等。
叩丁狼為什么要聯(lián)合Java+大數(shù)據(jù)授課?
在企業(yè)中做大數(shù)據(jù)開發(fā)要求必須熟練掌握J(rèn)ava,必須擁有多年Java開發(fā)經(jīng)驗。
大數(shù)據(jù)中很多技術(shù)都基于JVM,如果不懂Java,不能很好運(yùn)用Java,是沒法做好大數(shù)據(jù)開發(fā)。
大數(shù)據(jù)中的Hadoop是采用Java語言開發(fā)的,不熟悉Java,如何深入研究Hadoop。
大數(shù)據(jù)中的Spark采用Scala語言實現(xiàn),和Java很像,同時也是基于JVM。
沒有基本的開發(fā)思維和項目經(jīng)驗,談何大數(shù)據(jù)開發(fā)?連基礎(chǔ)的小規(guī)模數(shù)據(jù)量項目都不能搞定。
沒有任何項目經(jīng)驗和開發(fā)思維,就開始學(xué)大數(shù)據(jù),無法領(lǐng)悟什么是數(shù)據(jù)量和項目經(jīng)驗。
舒適環(huán)境、健康學(xué)習(xí)
校區(qū)路口
校區(qū)過道
校區(qū)走廊
上課環(huán)境
沈陽校區(qū)
校區(qū)走廊
上課地點: 文章來源:沈陽大數(shù)據(jù)課程 已關(guān)注: 731人