谢希科研究员团队在图计算系统方面取得重要进展
近日,中国科大苏州高研院医学影像智能与机器人研究中心(MIRACLE)的DDL实验室(Data Darkness Lab)在图计算方面的研究论文“Play like a Vertex: A Stackelberg Game Approach for Streaming Graph Partitioning”被国际顶级学术会议ACM International Conference on Management of Data(SIGMOD)2024录用。
在图计算领域中,图分区是在分布式大图分析与处理的关键性技术,该技术可以将大图分割到计算集群中,从而使单机无法处理的大图可以通过并行和分布式计算来得到处理。因此,图分区的质量和效率至关重要。论文提出一种流式分区技术Skewness-aware Vertex Partitioner (S5P),仅通过对大图的流式遍历就可以完成高质量和高效率的分区,并有效提高下游图计算任务的执行效率。论文的主要思想在于用极小的计算代价获得关于大图的偏斜分布特征与初始分区结果,并结合博弈论来指导和优化分区过程。相比于已有最好基线方法,S5P在分区质量上提升可达51%,在分布式图计算系统PowerGraph的通讯开销可降低81%,运行效率可提升130%,并提供了关于分区质量的理论下界。
该论文的第一、二作者分别为大数据学院硕士生丁泽中和计算机学院硕士生向泳安,通讯作者为谢希科研究员,其他合作者还包括大数据学院硕士生王上游和生医工学院周少华教授。中国科学技术大学为唯一单位。据ACM Digital Library统计,在SIGMOD 2024之前,中国科学技术大学作为唯一单位没有该会议的论文发表记录。
注:SIGMOD是数据管理领域国际公认的最高水平学术会议,由美国计算机协会(ACM)数据管理专业委员在1975年发起并举办,具有悠久的历史和很高的影响力。在中国计算机学会(CCF)推荐的“数据库/数据挖掘/内容检索”A类学术会议中,SIGMOD位居首位,其收录论文代表着该领域内的最高学术水平。