学术讲座-基于近似方法的高性能大数据分析

27.09.2017  15:59

举办单位:信息科学与工程学院

讲座题目

基于近似方法的高性能大数据分析

讲 座 人

黄群

讲座人

职称、职务

副研究员,入选中科院“百人计划

主持人

廖律超副院长

讲座类型

R自然科学

讲座对象

全校师生

举办时间

2017年9月30日下午3点

□社会科学

举办地点

C2-1楼道德讲堂

黄群,副研究员,硕士生导师,入选中科院“百人计划”。主要研究方向包括分布式系统、分布式算法与网络数据分析与测量等,在SIGCOMM、VLDB、INFOCOM等国际会议上发表多篇论文,同时获得中国、美国多项技术专利。2011年于北京大学获得学士学位,2015年于香港中文大学获得博士学位,2015年至2017年间任职于华为(香港)未来网络理论实验室。

讲座

主要内容

传统的分布式计算系统在设计提供严格的确定性并以此保证其行为与单机计算相一致。然而,这种强确定性保证通常会引入巨大的开销并导致严重的性能下降。而在大数据计算的背景下,这一强确定性保证可以在一定程度上得到放松。其直观上的理由在于,即便底层系统引入若干计算误差,只要这些误差足够微小、可被控制并且容易在后续计算中被消除,那么这些误差也是可以被接受的。在本次演讲中,演讲人讲介绍两个分布式系统领域的工作。这两个系统都采用近似方法优化系统设计,使得系统可以在性能与精度之间进行权衡。其中,第一个工作AF-Stream发表于数据库领域顶级会议VLDB,它在流式计算中通过牺牲微小的精度来大大减少由于故障容错引起的性能开销;第二个工作SkechVisor是一个网络数据分析系统,它基于一个新型的架构设计来扩展现有的sketch数据分析技术来达到高性能与高精度的设计目的,该工作也已经发表于计算机网络顶级会议ACM SIGCOMM上。我们希望通过对这两个工作的介绍能够对未来的大数据处理系统有所启示。