许炜

个人信息Personal Information

教授   硕士生导师  

性别:男

在职信息:在职

所在单位:电子信息与通信学院

学历:研究生(博士)毕业

学位:工学博士学位

毕业院校:华中科技大学

学科:信号与信息处理

个人简介Personal Profile

许 炜

华中科技大学 电子信息与通信学院 | 教授

教育经历

  • 2000-09 至 2008-07,华中科技大学,通信工程,博士(导师:杨宗凯)

  • 1996-09 至 2000-07,华中科技大学,计算机科学,学士

科研与学术工作经历

  • 2025-11 至今,华中科技大学,电子信息与通信学院,教授

  • 2010-11 至 2025-11,华中科技大学,电子信息与通信学院,副教授

  • 2005-11 至 2010-11,华中科技大学,电子与信息工程系,讲师

  • 2000-07 至 2005-11,华中科技大学,电子与信息工程系,助教

研究方向

  • 音乐智能:将人工智能技术深度应用于音乐教育领域,解决音乐技能的客观评价与智能辅助问题,实现自动转录、精准评分与个性化反馈。

  • 课堂智能:通过多模态感知技术对课堂教学全过程量化分析,实现学生注意力评估、师生互动识别、教学行为编码,构建数据驱动的教学效能评价体系。

  • 计算机视觉:研究视觉模型鲁棒性、生成与编辑,建立对抗鲁棒性基准,探索基于扩散模型的视觉内容编辑技术。

主持或参加的国家自然科学基金项目

  1. 国家自然科学基金面上项目,62277019,面向音乐教育的唱歌智能评价技术研究,2023-01-01 至 2026-12-31,在研,主持

  2. 国家自然科学基金面上项目,62277019,钢琴教学中智能辅助技术研究,2018-01-01 至 2022-12-31,结题,主持

  3. 国家自然科学基金国际(地区)合作与交流项目,62381260591,参加艺术与科技学术研讨会,2023-09-30 至 2023-12-31,结题,主持

主持或参加的其他科研项目

  1. 国家重点研发计划,学生综合素养多模态数据智能处理技术,2021-11 至 2026-11,在研,主持

  2. 国家重点研发计划,教学行为编码识别技术与教学效能评价技术,2018-05 至 2021-04,结题,主持

  3. 国家科技支撑计划,面向电子书包的教育出版资源与教学评测,2015-04 至 2017-12,结题,主持

  4. 国家科技支撑计划,基于硬件的多媒体内容检测技术研究,2011-01至2013-12,结题,主持

  5. 国家科技支撑计划,音乐数字化集成与服务关键技术研究,2011-01至2013-12,结题,主持

  6. 湖北省科技支撑计划项目,基于云计算的智慧教育平台关键技术研究,2020-01至2022-12,结题,第二参与

  7. 国家科技支撑计划项目,乐器资源数字化关键技术研究与平台开发,2014-01至2016-12,结题,第二参与

成果转化

  1. 爱唱歌(2011-2013):智能在线K歌平台,用户规模10万+,为海信推出“嗨唱”智能电视K歌应用

  2. 青桔音乐(2016-2018):与易班网联合开展“校园好声音”大赛,提供全国海选技术支持

  3. 微助教(2016至今):基于微信的教学互动平台,覆盖全国高校师生1000万

  4. 轻慕课(2019):基于iPad的轻量级慕课录制工具

  5. 皮皮龙音乐(2018):AI钢琴陪练APP(iOS)

  6. 视唱达人(2019至今):微信小程序视唱练习评测系统,用户1.7万,评测140万次

  7. 艺智评(2025至今):音乐闯关小程序,用户1万,评测70万次

  8. 数智教学管理(2022至今):课堂行为分析系统,覆盖教室1.4万间

期刊论文

  1. Yuqing, Li; Xianke, Wang; Ruimin, Wu; Wei, Xu; Wenqing, Cheng. A Two-Stage Audio-Visual Fusion Piano Transcription Model Based on the Attention Mechanism, IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2024, 32(1): 3618-3630

  2. Yifan, Wu; Jiawei, Du; Ping, Liu; Yuewei, Lin; Wei, Xu; Wenqing, Cheng. DD-RobustBench: An Adversarial Robustness Benchmark for Dataset Distillation, IEEE TRANSACTIONS ON IMAGE PROCESSING, 2025, 34(1): 2052-2066

  3. Weiming, Yang; Xianke, Wang; Bowen, Tian; Wei, Xu; Wenqing, Cheng. A Multi-Stage Automatic Evaluation System for Sight-Singing, IEEE TRANSACTIONS ON MULTIMEDIA, 2023, 25(1): 3881-3893

  4. Jiacheng, Wang; Ping, Liu; Jingen, Liu; Wei, Xu. Text-guided Eyeglasses Manipulation with Spatial Constraints, IEEE TRANSACTIONS ON MULTIMEDIA, 2023, 26: 4375-4388

  5. Xianke, Wang; Bowen, Tian; Weiming, Yang; Wei, Xu; Wenqing, Cheng. MusicYOLO: A Vision-Based Framework for Automatic Singing Transcription, IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING, 2022, 31: 229-241

  6. Yipeng, Liu; Ruimin, Wu; Yifan, Wu; Lijie, Luo; Wei, Xu. A Stave-Aware Optical Music Recognition on Monophonic Scores for Camera-Based Scenarios. APPLIED SCIENCES, 2023, 13(16): 9360.

部分会议论文

  1. TianRui, Li; Qikai, He; Ruimin, Wu; MengQiao, Chen; Wei,Xu. Frequency-Conformer for Automatic Piano Transcription. ICME 2026.

  2. Zhen, Liao; Gaole, Dai; Mengqiao, Chen; Wenqing, Cheng; Wei, Xu. Dual-Strategy-Enhanced ConBiMamba for Neural Speaker Diarization. ICASSP 2026.

  3. Mengqiao, Chen; Qikai, He; Wei, Xu; Wenqing, Cheng. MusicDETR: A Position aware Spectral Note Detection Model for Singing Transcription. ICASSP 2026.

  4. Kepeng, Lin; Qizhe, Zhang; Rui, Wang; Xuehai, Hu; Wei, Xu. PlantBiMoE: A Bidirectional Foundation Model with SparseMoE for Plant Genomes. BIBM 2025.

  5. Weiwei, Jiang; Long, Rao; Gaole, Dai; Yifan, Wu; Wei, Xu. Gaze-Driven Active Speaker Detection in Meetings. ICIC 2025.

  6. Yan, Zhang; Jie, Luo; Tianrui, Li; Wei, Xu. SPED: A Sight-singing Dataset for Performance Evaluation. ICASSP 2025.

  7. Yuqing, Li; Ying, Zhang; Xianke, Wang; Ruimin, Wu; Wei Xu. CNN-Transformer Ensemble: Advancing Visual Piano Transcription with Global and Local Features. IJCNN 2024.

  8. Ruimin, Wu; Xianke, Wang; Yuqing, Li; Wei, Xu; Wenqing, Cheng. Piano Transcription with Harmonic Attention. ICASSP 2024.

  9. Ying, Zhang; Yan, Zhang; Wei, Xu; Zhifeng, Wang; Jianwen, Sun. Singpad: A knowledge tracing dataset based on music performance assessment. EDM 2024.

  10. Xinghao, Huang; Weiwei, Jiang; Long, Rao; Wei, Xu; Wenqing, Cheng. Active Speaker Detection in Fisheye Meeting Scenes with Scene Spatial Spectrums. INTERSPEECH 2024.

  11. Jiacheng, Wang; Ping, Liu; Wei, Xu. Unified Diffusion-Based Rigid and Non-Rigid Editing with Text and Image Guidance. ICME 2024.

  12. Long, Rao; Xinghao, Huang; Shipeng, Cai; Bowen, Tian; Wei, Xu; Wenqing, Cheng. A Dual-Path Approach for Gaze Following in Fisheye Meeting Scenes. PRCV 2023.

  13. Xianke, Wang; Wei, Xu; Weiming, Yang; Wenqing Cheng. Musicyolo: A Sight-Singing Onset/Offset Detection Framework. ICASSP 2022.

奖励

  1. 以能力为导向的电子信息类高层次创新人才培养体系探索与实践,湖北省人民政府,省部一等奖,2023(程文青; 李震彪; 白翔; 张林; 刘威; 曾喻江; 邓天平; 许炜

  2. 网络内容分析关键技术与应用,湖北省人民政府,科技进步一等奖,2011(杨宗凯; 郑庆华; 许炜等)

专利

  1. 许炜, 杨未铭, 王先科, 李雨晴. 基于目标检测的视唱音高检测方法、系统、设备及介质. 专利号:202210656997.0,授权日期:2024.9.13

  2. 许炜; 李雨晴; 王先科; 一种基于图卷积的多模态钢琴转录装置及其训练方法,2022-12-07,202211566507.4

  3. 许炜, 郑祎能, 蔡世鹏, 饶龙. 课程视频视线修正系统及其训练方法、视线落点估计方法. 专利号:202210537861.8,授权日期:2022.9.2

  4. 许炜, 刘威, 向敏, 徐晶, 程文青. 基于声源定位和面部检测的PBL课堂记录方法和系统. 专利号:202011161783.3,授权日期:2022.1.11

  5. 许炜, 田博文, 郭春麟, 肖宇. 一种课堂注意力评估方法及系统. 专利号:202110669216.7,授权日期:2021.9.14

  6. 许炜, 孔思聪, 廖望, 蔡孝直. 一种基于计算机视觉的课堂行为检测系统. 专利号:201710830828.3,授权日期:2020.10.30

  7. 许炜; 崔玉蕾; 周为; 一种基于音视频特征融合的课堂粗粒度声音事件检测方法. 专利号:202311820919.0, 授权日期:2025.1.28

最后修改时间:2026年03月18日


  • 教育经历Education Background
  • 工作经历Work Experience
    暂无内容
  • 研究方向Research Focus
  • 社会兼职Social Affiliations