2019年第2期 Apache Kylin Innovation Meetup


2019年第2期 Apache Kylin Innovation Meetup 即将在北京开启,此次分享我们邀请到了来自小米、58同城以及 Kyligence 的资深大数据技术专家为大家分享最新的应用案例及实践。             

活动日程

13:00-13:30   签到

13:30-14:10   《Kylin 在小米大数据中的应用》

14:10-14:50   《Kylin Real-time OLAP 的设计和实现》

14:50-15:10   茶歇

15:10-15:50   《Kylin 在58集团的实践和应用》

15:50-16:30   《大数据分析常用去重(Count Distinct)算法分析》

16:30-17:00   会后交流
              

演讲嘉宾

Talk 1:《Apache Kylin 在小米大数据中的应用》            

演讲人:陈学辉  小米大数据平台 OLAP 负责人

演讲概要:小米有互联网、电商、金融、AI、IoT等丰富的业务,许多业务都有强烈的数据分析和统计需求。本次分享主要给大家介绍Kylin在小米内部的使用情况,包括适用的业务场景,遇到的一些坑,源自业务实践中的功能优化点。



Talk 2:《Apache Kylin Real-time OLAP 的设计和实现》

演讲人:俞霄翔   Kyligence 大数据研发工程师

演讲概要:面对越来越多的实时分析需求,eBay向Kylin贡献了实时流式 OLAP 分析的新功能,该功能目前已经开源,会在未来的版本中发布给社区使用。本次分享主要讲解该功能的原理分析和使用方法。          


Talk 3:《Apache Kylin 在58集团的实践和应用》

演讲人:何良均  58大数据平台资深工程师

演讲概要:58集团的底层计算(Hadoop)和存储(HBase)平台都是多租户平台,从多个方面对用户的访问进行限制和隔离。Kylin也有多用户登录的概念,不过在使用底层计算和存储平台资源进行Cube构建及数据存储查询时没有区分用户,导致Kylin使用的Yarn集群队列资源、基于HBase的数据存储查询无法按用户进行隔离,最终无法按用户进行成本核算。本次分享介绍我们如何让Kylin在Cube构建以及数据存储查询中与底层多租户计算(Hadoop)和存储(HBase)平台进行整合,以及在其他方面的一些改进。


Talk 4:《大数据分析常用去重(Count Distinct)算法分析》

演讲人:陶加涛  Kyligence 大数据研发工程师

演讲概要:去重在日常分析中的使用频率非常高,然而如何快速地对大数据进行去重一直是一大难点。Kylin同时支持精确和非精确的预计算去重方式,本次分享主要讲解这两种去重方式中所应用的算法,帮助大家理解Kylin为何能快速去重。

报名链接
https://www.huodongxing.com/event/7484371439700