Other
Supervisor of Doctorate Candidates
Supervisor of Master's Candidates
在动态数据场景中高效管理和检索高维向量,是大模型推理系统支持动态记忆管理与推理的核心能力:
流数据自适应压缩:提出了一系列面向流数据环境的自适应压缩方法,有效支持动态向量检索与存储更新,为大模型推理与高维检索提供基础支撑, DEBS’23, ICDE’23,TKDE’24, SIGMOD’25
新的动态向量检索算法:提出了一系列软硬件结合的自适应弹性向量增量检索机制,优化实时向量数据流下的向量检索与更新效率,适应多样化动态场景的需求。
面向大模型推理的高效内存管理机制:探索设计支持动态知识插入与更新的内存管理机制,结合向量数据库的动态操作优化,为大模型推理提供实时、高效的存储与查询能力。