Current position: Home >>Research Focus
ZHANG SHUHAO

Personal Information

Other  
Supervisor of Doctorate Candidates  
Supervisor of Master's Candidates  

Research Focus

代表性工作二:动态向量检索与内存管理

在动态数据场景中高效管理和检索高维向量,是大模型推理系统支持动态记忆管理与推理的核心能力:

  • 流数据自适应压缩:提出了一系列面向流数据环境的自适应压缩方法,有效支持动态向量检索与存储更新,为大模型推理与高维检索提供基础支撑, DEBS’23, ICDE’23,TKDE’24, SIGMOD’25

  • 新的动态向量检索算法:提出了一系列软硬件结合的自适应弹性向量增量检索机制,优化实时向量数据流下的向量检索与更新效率,适应多样化动态场景的需求。

  • 面向大模型推理的高效内存管理机制:探索设计支持动态知识插入与更新的内存管理机制,结合向量数据库的动态操作优化,为大模型推理提供实时、高效的存储与查询能力。