版艺学院张明西副教授研究成果被国际知识发现和数据挖掘大会录用

发布时间:2023-05-22

浏览次数:420

近日,第29届国际知识发现和数据挖掘大会(The 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, KDD 2023)论文接收结果公布,版艺学院新媒体技术专业副教授、国家重点研发计划“文化产品产权价值评估与确权标识应用技术研究”项目骨干张明西完成的“基于路径聚合的高效单源SimRank相似度查询”(Efficient Single-source SimRank Query by Path Aggregation)被大会的研究赛道(Research Track)录用。

KDD是数据挖掘领域的顶级国际学术会议,也是中国计算机学会(CCF)推荐的A类国际学术会议,被誉为全球数据挖掘最高级别学术会议。自1995年以来,该会议已经举办二十多届,已经成为数据科学领域的顶级学者和知名企业展示成果的重要场所。会议录用成果代表了知识发现和数据挖掘领域最前沿的研究趋势,今年会议将于86日至10日在美国洛杉矶举行。这是上海理工大学首次以第一单位完成的科研成果被KDD录用,标志着我校在人工智能和大数据研究方向上取得突破性进展。

作为人工智能和数据科学领域的研究热点之一,相似度查询的目标是发现相似的实体,这是推荐系统、链路预测等现实网络应用的重要依据。研究团队提出一种高效的单源SimRank相似度查询方法VecSim,基于路径聚合提升查询效率。为了进一步加速计算,利用修剪技术减少低值元素带来的影响,并从理论上证明了精确度损失。与当前最先进的算法相比,VecSim的主要优势体现在仅需要在内存中维护少数向量即可实现高效精准的单源相似度查询。实验表明,在精确度相当的前提下,VecSim在查询效率方面显著领先现有方法,并在每个测试数据集上都能够以0.1秒或更低的时间开销达到级别的平均误差。

近年来,版艺学院新媒体技术、数字出版等学科的团队致力于新媒体数据挖掘、人工智能、图像处理、产权价值评估、电力数据分析等方向研究,承担了国家重点研发计划、国家自然科学基金等项目,已经有多项成果入围CIKMACCVICTAI等顶级学术会议上。

路径聚合示例

平均误差与查询时间的权衡(tradeoff)关系

精确度与查询时间的权衡(tradeoff)关系