大数据处理技术培训
课程背景
第一讲 云计算及大数据处理技术介绍
1)云计算的概念
2)云计算发展现状
3)大数据的概念
4)大数据的应用
5)大数据关键技术
第二讲 Google中的关键技术
1)GFS文件系统
2)Chubby中的Paxos算法
3)MapReduce技术机制
4)Bigtable表管理技术
第三讲 Hadoop文件系统HDFS及其文件结构
1)Hadoop项目简介
2)HDFS体系结构
3)HDFS关键运行机制
4)Hadoop vs Google
5)Hadoop API
第四讲 MapReduce编程模型及其应用开发
1) MapReduce产生背景
2) MapReduce编程模型
3) MapReduce实现机制
4) MapReduce案例分析
第五讲 Pig Latin及其使用
1)Pig 设计的目标
2)Pig Latine介绍
3)Pig关键性技术
4)Pig的实用案例
第六讲 数据仓库Hive使用
1) Hive设计目标
2) Hive数据模型
3) Hive关键性技术
4) Hive的使用案例
第七讲 Hbase和ZooKeeper使用
1)Hbase运行机制简介
2)Hbase与 HDFS
3)Hbase的对外接口
4)ZooKeeper的数据模型
5)ZooKeeper的读写机制
6)ZooKeeper的使用方法
第八讲 数据抽取工具Sqoop使用
1)数据抽取技术介绍
2)Sqoop中的关键技术
3)Sqoop数据抽取策略
4)数据挖掘及分析
第九讲 当前数据中心的改造和转换分析
1)主流商业大数据解决方案比较
2)主流开源云计算系统比较
3)国内代表性大数据平台比较
第十讲 各厂商最新的大数据产品介绍
1)IBM的大数据技术
2)HP的大数据技术
3)Teradata的大数据技术
4)其它厂商的大数据处理
培训目标
1,全面了解大数据处理技术的相关知识。
2,学习Hadoop的核心技术方法以及应用特征。
3,深入使用Hadoop相关工具在大数据中的使用。
4,掌握传统数据中心向云计算中心转换的关键技术。
培训师介绍
杨老师
主要研究网络信息分析以及云计算相关技术,长期从事通信网管系统、网络信息处理、商务智能(BI)以及电信决策支持系统的研究开发工作,主持和参与了多个国家和省部级基金项目,具有丰富的工程实践及软件研发经验。
大数据处理技术培训