报告标题:高维向量量化:通用框架、最新进展与未来方向
报告时间:2025年12月16日上午9:30-12:00
报告地点:民主楼222
报告人:龙程副教授,新加坡南洋理工大学
摘要:高维向量数据是众多现代应用的核心,包括推荐系统、大规模检索以及检索增强生成等。如何高效管理和处理这类数据既充满机遇,也面临挑战。在这一背景下,向量量化作为关键技术,可以在压缩高维向量的同时保留其重要的相似性信息。本报告将首先探讨为何向量量化对于可扩展且高效的高维向量管理至关重要,随后介绍向量量化的通用框架及主流方法。在此基础上,我将重点介绍我们近期提出的一项研究成果 - RaBitQ,这是一种针对二值和标量量化的优化方法,具有渐近最优性。RaBitQ 已被集成到Meta、字节跳动、Elastic、Apple、阿里巴巴、Milvus、OceanBase 等多家大型企业的生产级向量数据库和搜索引擎中。最后,我将展望向量量化未来的研究方向。
讲者简介:龙程是新加坡南洋理工大学计算与数据科学学院(CCDS)的副教授。他于2015年在香港科技大学(HKUST)获得博士学位,2010年在华南理工大学获得工学学士学位。他的研究兴趣涵盖数据管理与数据挖掘,近年来主要聚焦于高维向量数据的管理及其在大型模型(如检索增强生成式人工智能)中的应用。他的研究成果获得了多项荣誉与奖项,包括香港ACM颁发的“最佳研究奖”、香港研究资助局颁发的“富布赖特-RGC研究奖”、IEEE香港分会颁发的“研究生论文竞赛奖”以及香港科技大学颁发的“海外研究奖”。