个人简介Personal Profile
研究方向
文字是人类文明的核心载体,可视文本智能解析与理解是智慧教育、办公自动化、司法安全与社会高效治理的重要支撑,更是推动中华文明历史溯源的关键技术。长期聚焦“可视文本解析"领域,围绕场景文字识别-理解-推理(含古文字破译)开展系列研究工作。在包括IEEE TPAMI、IJCV、IEEE TIP、CVPR、ICDAR等重要国际期刊和会议发表学术论文50余篇,包括人工智能国际顶刊 TPAMI/IJCV 10篇,CCF A类会议最佳论文、Top'15、Oral、Spotlight、Highlight等论文, H-index 35。主持国家自然科学基金青年项目、国家重点研发计划子课题等省部级以上项目 6 项,与华为、金山办公、阿里、字节跳动、腾讯、百度、合合信息、CVTE等开展过多项产学研合作项目。
最新工作:
MonkeyOCR: Document Parsing with a Structure-Recognition-Relation Triplet Paradigm
文章:https://arxiv.org/abs/2506.05218
代码:https://github.com/Yuliang-Liu/MonkeyOCR
体验:http://vlrlabmonkey.xyz:7685/
支持密集PDF文档,PPT, 表格,报纸,公式等多类文档内容解析。
研究团队
所在VLRLab团队由白翔教授领衔,长期从事计算机视觉与模式识别、场景文字识别领域前沿研究,团队依托多谱信息处理国家重点实验室、图像信息处理与智能控制教育部重点实验室、国家防伪工程技术研究中心、机器视觉与智能系统湖北省工程研究中心等高水平科研平台,具备扎实的理论积累和技术储备,拥有完善的高性能计算资源和数据支持条件。
三项代表性工作
文字解析 ABCNet (CCF A类 国际顶会 CVPR'20, Oral, 满分评审论文)
国际学者评价:两次 Marr 奖(CV 最高论文奖)得主 Zhuowen Tu 教授(CVPR'22)评价其为“经典的(classical)方法···提出恰当的(appropriate)文本边界表征方式”
文字理解 Monkey (CCF A类 国际顶会 CVPR'24,Highlight, Paper Digest'15)
国际学者评价:图灵奖得主 Yoshua Bengio 教授(ICLR'25)评价其为“在文档理解中表现突出的(excelling)模型”
古文字辅助推断 OBSD (CCF A类 国际顶会 ACL'24,Best Paper Award)
国际学者评价:ACL大会总主席 Claire Cardie代表委员会颁奖时评价该成果“规避了(circumvent)破译古代语言对大规模语料的依赖”
人工智能国际顶刊 T-PAMI (IF = 20.8) / IJCV (IF = 11.6) CCF A类,中科院一区Top期刊
PAMI'25 VimTS: A Unified Video and Image Text Spotter for Enhancing the Cross-domain Generalization
PAMI'25 Privacy-Preserving Biometric Verification With Handwritten Random Digit String
PAMI'24 Turning a Clip Model into a Scene Text Spotter
IJCV'24 SwinTextSpotter v2: Towards Better Synergy for Scene Text Spotting,
PAMI'23 SPTS v2: Single-point Scene Text Spotting
PAMI'22 ABCNet: Real-Time Scene Text Spotting with Adaptive Bezier-Curve Network
IJCV'22 Pagenet: Towards End-to-end Weakly Supervised Page-level Handwritten Chinese ... Recognition
PAMI'21 Structured multimodal attentions for textvqa
IJCV'21 Separating content from style using adversarial learning for recognizing text in the wild
IJCV'21 Exploring the capacity of a ... discretization network for multi-orientation scene text detection
近一年发表论文
· 🚀 一篇论文被 ACL'25 (CCF A)接收
· 🚀 一篇论文被 TPAMI'25 (中科院一区,AI顶刊)接收
· 🚀 一篇论文被 PR'25 (中科院一区)接收
· 🚀 一篇论文被 TPAMI'25 (中科院一区,AI顶刊)接收
· 🚀 一篇论文被 IJCV'25 (中科院一区,AI顶刊)接收
· 🚀 一篇论文被 CVPR'25(CCF A) 接收
· 🚀 一篇论文被 SCIS'24(中科院一区, CCF A)接收
· 🚀 一篇论文被 Scientific Data(JCR Q1区,Nature旗下期刊) 接收
· 🚀 一篇论文被 ICLR'25(CCF A) 接收
· 🚀 一篇论文被 TPAMI'24 (中科院一区,AI顶刊)接收
欢迎具有较好人工智能/计算机/数学背景的本科/硕士生攻读硕/博士研究生
招生:是否参与过组内学习 /与组契合度/ IPad本科生创新团队/ 科研经历及学科竞赛
招生方式:遵循契约精神
组内风格:要求高,纪律严,就业好
学术兼职
Science China Information Science客座编委
中国图象图形学报青年编委
中国计算机学会计算机视觉专委会委员(CCF-CV)
中国图象图形学学会机器视觉专委会委员(CSIG-MV)
中国人工智能学会智能服务专委会委员(CAAI-智能服务)
中国自动化学会模式识别与机器智能专委会委员(CAA-PRMI)
中国图象图形学学会文档分析与识别专委会副秘书长(CSIG-DAIR)
曾任CCF A类会议高级程序委员会委员SPC
学术服务
ICDAR 2025 General Introduction to Oracle Bone Scripts Processing, Tutorial
ICDAR 2025 Multimodal Document Understanding, Workshop
ICDAR 2023 MHME 多行手写公式识别竞赛,Organizers
ICDAR 2023 STE-VRD 富文档结构化文本抽取竞赛,Organizers
ICDAR 2023 DTT 异常图像文本检测竞赛,Organizers
ICDAR 2023 Seal 印章文字阅读竞赛,Organizers
ICPR 2022 MMSR 视频字幕阅读竞赛,Organizers
ICDAR 2021 ICT 芯片文字阅读竞赛,Organizers
ICDAR 2019 LSVT 大规模街景文字阅读竞赛,Organizers
ICDAR 2019 ArT 任意形状文本阅读竞赛,Organizers
ICPR 2018 MTWI 网络图像的文本检测竞赛,Organizers
TPAMI/IJCV/TIP/TMM/TITS/TCSVT/SCIS/CVPR/ICCV/ECCV/ICML/NeurIPS/IJCAI/AAAI 等 30 余种国际权威期刊/顶会审稿人
奖励荣誉
· 中国科协青年托举人才计划
· AI 2000全球人工智能学者
· CCF A类会议 ACL'24 最佳论文奖
· 斯坦福全球“前 2%”顶尖科学家榜单
· 教育部第1批海外引才专项
· 中国图象图形学学会优秀博士论文奖 (当年全国10人)
· 中国图象图形学报年度优秀论文奖、封面论文
· 湖北省海外高层次特聘专家
· 华中科技大学卓越青年学者
· 华中科技大学年度重大学术进展
· 华中科技大学青年五四奖章
· 华为东湖青年学者
· 第十届中国大学生“互联网+”创新大赛产业赛道全国金奖
· 第八届中国大学生“互联网+”创新大赛红旅赛道全国金奖
· 第六届中国大学生“互联网+”创新大赛高教主赛道全国金奖
· 第十九届挑战杯“揭榜挂帅”专项赛擂主
· CVPR'20 TextVQA 文本视觉问答竞赛冠军
· ICDAR'19 ReCTS 中文街景文字检测识别双赛道冠军
· ICDAR'17 MLT 多语言文字检测及分类双赛道冠军
教授课程
视觉与自然语言处理
Digital Image Processing (全英)
人工智能前沿
大模型应用
智能芯片设计
人机交互
部分纵向科研课题
中国科协青年人才托举工程计划项目,2023-2025 (主持)
国家自然科学基金青年科学基金项目,基于深度感知模型的非受限场景文字检测及识别,2023-2025 (主持)
国家重点研发计划,新发突发传染病多点触发预警体系及关键技术的研发和示范,2022-2025 (子课题负责人)
国家重点研发计划,面向检察办案的电子化签名与电子捺印全链条可信关键技术研究,2022-2025(子课题负责人)
江苏省无锡市科技局未来技术太湖创新基金,多途径人工智能辅助破译甲骨文,2024-2026 (主持)
国家自然科学基金重点项目,面向数字人文的中文古籍文档图像智能识别与理解,2020-2024(参与)
联系方式:ylliu(at)hust.edu.cn