课程大纲及内容简介:
每节课约35分钟,共不下40讲
第一章(11讲)
·分布式和传统单机模式
·Hadoop背景和工作原理
·Mapreduce工作原理剖析
·第二代MR--YARN原理剖析
·Cloudera Manager 4.1.2安装
·Cloudera Hadoop 4.1.2 安装
·CM下集群管理一
·CM下集群管理二
·Hadoop fs 命令详解
·cloudera manager管理集群
·cloudera manager下集群高级管理
第二章(约10讲)
·Hive数据表和数据存储·Hive的Java扩展开发·Hive UDF和UDAF开发·Hive JDBC连接·Hive常见场景,实战练习·Hive -f 传参框架开发 由于hive自带命令hive -f无法传参数,导致hive跨文件的使用基本瘫痪, 无法大量推广。该框架可以任意传参,让hive企业级应用开发更高效和简洁。第三章(约5讲)
·Sqoop原理·Sqoop使用详解·用Sqoop实现HDFS/Hive与关系数据库的数据交互·用Sqoop实现HBase与关系数据库的数据交互 第四章(约8讲) ·Hbase原理·Hbase系统架构·Hbase存储机制·Hbase基本使用·Hbase表设计思路和方案·常见应用场景·和Hive交互·Java访问、WEB开发 第五章 项目实战(约8讲) 电商业日志流量分析项目,互联网企业对海量日志的分析是Hadoop应用的一个重要用途,也是对网站流量、客户行为分析的重要途径。该项目整合Hive、Hbase、Sqoop等常用组件,涉及从后台处理到前台呈现的每一个技术环节。包括: ·业务需求介绍 ·数据建模 ·后台算法设计 ·后台业务处理 ·前台WEB展示等 ...课程详细大纲列表:
第一讲:Cloudera Manager介绍与安装
第二讲:Cloudera Manager详解第三讲:CDH4.1介绍与环境搭建一第四讲:CDH4.1环境搭建二第五讲:Hadoop工作原理、调度策略第六讲:Hadoop开发作业形式第七讲:CM下CDH4.1集群高级管理一第八讲:CM下CDH4.1集群高级管理二第九讲:小结及Hadoop工作原理第十讲:Hive工作原理和基本使用第十一讲:Hive元数据管理和语法详解第十二讲:Hive表和存储结构第十三讲:运维案例分享_单机存储均衡和坏block处理第十四讲:Hive QL 一第十五讲:Hive QL 二第十六讲:UDF和UDAF开发第十七讲:UDAF开发和JDBC访问第十八讲:Hive优化规则总结第十九讲:Hive数据压缩技术第二十讲:Hive-f封装支持传参一第二十一讲:Hive-f封装支持传参二第二十二讲:Sqoop使用一第二十三讲:Sqoop使用二第二十四讲:Sqoop作业调度第二十五讲:HBase体系结构第二十六讲:HBase 表设计案例第二十七讲:HBase数据加载(Sqoop和Java)第二十八讲:HBase存储机制第二十九讲:Java操作HBase一第三十讲:Java操作HBase二第三十一讲:Java操作HBase三第三十二讲:hbase与Hive接口及项目介绍第三十三讲:订单在线实时查询_Schema设计和HBase数据加载第三十四讲:订单在线实时查询_DAO层实现第三十五讲:订单在线实时查询_DAO层和前台实现第三十六讲:电商日志流量分析_项目介绍第三十七讲:电商日志流量分析_业务实现一第三十八讲:电商日志流量分析_业务实现二第三十九讲:电商日志流量分析_业务实现三第四十讲:电商日志流量分析_业务实现四第四十一讲:CDH5搭建之CM5安装部署
第四十二讲:CDH5搭建和CM界面化集群管理