案例介绍
1.使用Spark Sql 直接读取采集到的数据根据项目需求进行离线分析, 结果存入Mysql;
2.使用Flume 将采集到的数据进行读取, 使用Kafka Sink 将数据发送到Kafka 进行解耦和削峰, 使用Spark Streaming 对接Kafka, Streaming Context 消费Kafka 中的数据并进行广告点击量计算, 计算结果存入Mysql。
3.离线分析部分: 完成对浏览交易时长占比统计, 浏览深度统计, 页面跳失率的统计, 交易成功人数, 浏览-下单-支付转化率, 热门品类Top10 统计和分区域Top10 商品统计。
4.实时分析部分: 完成各省广告点击量的实时统计和最近一小时里各省每分钟的广告点击量统计