2019年第2期 Apache Kylin Innovation Meetup
2019年第2期 Apache Kylin Innovation Meetup 即将在北京开启,此次分享我们邀请到了来自小米、58同城以及 Kyligence 的资深大数据技术专家为大家分享最新的应用案例及实践。
活动日程
13:00-13:30 签到
13:30-14:10 《Kylin 在小米大数据中的应用》
14:10-14:50 《Kylin Real-time OLAP 的设计和实现》
14:50-15:10 茶歇
15:10-15:50 《Kylin 在58集团的实践和应用》
15:50-16:30 《大数据分析常用去重(Count Distinct)算法分析》
16:30-17:00 会后交流
演讲嘉宾
Talk 1:《Apache Kylin 在小米大数据中的应用》
演讲人:陈学辉 小米大数据平台 OLAP 负责人
演讲概要:小米有互联网、电商、金融、AI、IoT等丰富的业务,许多业务都有强烈的数据分析和统计需求。本次分享主要给大家介绍Kylin在小米内部的使用情况,包括适用的业务场景,遇到的一些坑,源自业务实践中的功能优化点。
Talk 2:《Apache Kylin Real-time OLAP 的设计和实现》
演讲人:俞霄翔 Kyligence 大数据研发工程师
演讲概要:面对越来越多的实时分析需求,eBay向Kylin贡献了实时流式 OLAP 分析的新功能,该功能目前已经开源,会在未来的版本中发布给社区使用。本次分享主要讲解该功能的原理分析和使用方法。
Talk 3:《Apache Kylin 在58集团的实践和应用》
演讲人:何良均 58大数据平台资深工程师
演讲概要:58集团的底层计算(Hadoop)和存储(HBase)平台都是多租户平台,从多个方面对用户的访问进行限制和隔离。Kylin也有多用户登录的概念,不过在使用底层计算和存储平台资源进行Cube构建及数据存储查询时没有区分用户,导致Kylin使用的Yarn集群队列资源、基于HBase的数据存储查询无法按用户进行隔离,最终无法按用户进行成本核算。本次分享介绍我们如何让Kylin在Cube构建以及数据存储查询中与底层多租户计算(Hadoop)和存储(HBase)平台进行整合,以及在其他方面的一些改进。
Talk 4:《大数据分析常用去重(Count Distinct)算法分析》
演讲人:陶加涛 Kyligence 大数据研发工程师
演讲概要:去重在日常分析中的使用频率非常高,然而如何快速地对大数据进行去重一直是一大难点。Kylin同时支持精确和非精确的预计算去重方式,本次分享主要讲解这两种去重方式中所应用的算法,帮助大家理解Kylin为何能快速去重。
报名链接
https://www.huodongxing.com/event/7484371439700