|
个人信息Personal Information
教授 硕士生导师
性别:男
在职信息:在职
所在单位:电子信息与通信学院
学历:研究生(博士)毕业
学位:工学博士学位
毕业院校:华中科技大学
学科:信号与信息处理
个人简介Personal Profile
许 炜
华中科技大学 电子信息与通信学院 | 教授
教育经历
2000-09 至 2008-07,华中科技大学,通信工程,博士(导师:杨宗凯)
1996-09 至 2000-07,华中科技大学,计算机科学,学士
科研与学术工作经历
2025-11 至今,华中科技大学,电子信息与通信学院,教授
2010-11 至 2025-11,华中科技大学,电子信息与通信学院,副教授
2005-11 至 2010-11,华中科技大学,电子与信息工程系,讲师
2000-07 至 2005-11,华中科技大学,电子与信息工程系,助教
研究方向
音乐智能:将人工智能技术深度应用于音乐教育领域,解决音乐技能的客观评价与智能辅助问题,实现自动转录、精准评分与个性化反馈。
课堂智能:通过多模态感知技术对课堂教学全过程量化分析,实现学生注意力评估、师生互动识别、教学行为编码,构建数据驱动的教学效能评价体系。
计算机视觉:研究视觉模型鲁棒性、生成与编辑,建立对抗鲁棒性基准,探索基于扩散模型的视觉内容编辑技术。
主持或参加的国家自然科学基金项目
国家自然科学基金面上项目,62277019,面向音乐教育的唱歌智能评价技术研究,2023-01-01 至 2026-12-31,在研,主持
国家自然科学基金面上项目,62277019,钢琴教学中智能辅助技术研究,2018-01-01 至 2022-12-31,结题,主持
国家自然科学基金国际(地区)合作与交流项目,62381260591,参加艺术与科技学术研讨会,2023-09-30 至 2023-12-31,结题,主持
主持或参加的其他科研项目
国家重点研发计划,学生综合素养多模态数据智能处理技术,2021-11 至 2026-11,在研,主持
国家重点研发计划,教学行为编码识别技术与教学效能评价技术,2018-05 至 2021-04,结题,主持
国家科技支撑计划,面向电子书包的教育出版资源与教学评测,2015-04 至 2017-12,结题,主持
国家科技支撑计划,基于硬件的多媒体内容检测技术研究,2011-01至2013-12,结题,主持
国家科技支撑计划,音乐数字化集成与服务关键技术研究,2011-01至2013-12,结题,主持
湖北省科技支撑计划项目,基于云计算的智慧教育平台关键技术研究,2020-01至2022-12,结题,第二参与
国家科技支撑计划项目,乐器资源数字化关键技术研究与平台开发,2014-01至2016-12,结题,第二参与
成果转化
爱唱歌(2011-2013):智能在线K歌平台,用户规模10万+,为海信推出“嗨唱”智能电视K歌应用
青桔音乐(2016-2018):与易班网联合开展“校园好声音”大赛,提供全国海选技术支持
微助教(2016至今):基于微信的教学互动平台,覆盖全国高校师生1000万
轻慕课(2019):基于iPad的轻量级慕课录制工具
皮皮龙音乐(2018):AI钢琴陪练APP(iOS)
视唱达人(2019至今):微信小程序视唱练习评测系统,用户1.7万,评测140万次
艺智评(2025至今):音乐闯关小程序,用户1万,评测70万次
数智教学管理(2022至今):课堂行为分析系统,覆盖教室1.4万间
期刊论文
Yuqing, Li; Xianke, Wang; Ruimin, Wu; Wei, Xu; Wenqing, Cheng. A Two-Stage Audio-Visual Fusion Piano Transcription Model Based on the Attention Mechanism, IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2024, 32(1): 3618-3630
Yifan, Wu; Jiawei, Du; Ping, Liu; Yuewei, Lin; Wei, Xu; Wenqing, Cheng. DD-RobustBench: An Adversarial Robustness Benchmark for Dataset Distillation, IEEE TRANSACTIONS ON IMAGE PROCESSING, 2025, 34(1): 2052-2066
Weiming, Yang; Xianke, Wang; Bowen, Tian; Wei, Xu; Wenqing, Cheng. A Multi-Stage Automatic Evaluation System for Sight-Singing, IEEE TRANSACTIONS ON MULTIMEDIA, 2023, 25(1): 3881-3893
Jiacheng, Wang; Ping, Liu; Jingen, Liu; Wei, Xu. Text-guided Eyeglasses Manipulation with Spatial Constraints, IEEE TRANSACTIONS ON MULTIMEDIA, 2023, 26: 4375-4388
Xianke, Wang; Bowen, Tian; Weiming, Yang; Wei, Xu; Wenqing, Cheng. MusicYOLO: A Vision-Based Framework for Automatic Singing Transcription, IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING, 2022, 31: 229-241
Yipeng, Liu; Ruimin, Wu; Yifan, Wu; Lijie, Luo; Wei, Xu. A Stave-Aware Optical Music Recognition on Monophonic Scores for Camera-Based Scenarios. APPLIED SCIENCES, 2023, 13(16): 9360.
部分会议论文
TianRui, Li; Qikai, He; Ruimin, Wu; MengQiao, Chen; Wei,Xu. Frequency-Conformer for Automatic Piano Transcription. ICME 2026.
Zhen, Liao; Gaole, Dai; Mengqiao, Chen; Wenqing, Cheng; Wei, Xu. Dual-Strategy-Enhanced ConBiMamba for Neural Speaker Diarization. ICASSP 2026.
Mengqiao, Chen; Qikai, He; Wei, Xu; Wenqing, Cheng. MusicDETR: A Position aware Spectral Note Detection Model for Singing Transcription. ICASSP 2026.
Kepeng, Lin; Qizhe, Zhang; Rui, Wang; Xuehai, Hu; Wei, Xu. PlantBiMoE: A Bidirectional Foundation Model with SparseMoE for Plant Genomes. BIBM 2025.
Weiwei, Jiang; Long, Rao; Gaole, Dai; Yifan, Wu; Wei, Xu. Gaze-Driven Active Speaker Detection in Meetings. ICIC 2025.
Yan, Zhang; Jie, Luo; Tianrui, Li; Wei, Xu. SPED: A Sight-singing Dataset for Performance Evaluation. ICASSP 2025.
Yuqing, Li; Ying, Zhang; Xianke, Wang; Ruimin, Wu; Wei Xu. CNN-Transformer Ensemble: Advancing Visual Piano Transcription with Global and Local Features. IJCNN 2024.
Ruimin, Wu; Xianke, Wang; Yuqing, Li; Wei, Xu; Wenqing, Cheng. Piano Transcription with Harmonic Attention. ICASSP 2024.
Ying, Zhang; Yan, Zhang; Wei, Xu; Zhifeng, Wang; Jianwen, Sun. Singpad: A knowledge tracing dataset based on music performance assessment. EDM 2024.
Xinghao, Huang; Weiwei, Jiang; Long, Rao; Wei, Xu; Wenqing, Cheng. Active Speaker Detection in Fisheye Meeting Scenes with Scene Spatial Spectrums. INTERSPEECH 2024.
Jiacheng, Wang; Ping, Liu; Wei, Xu. Unified Diffusion-Based Rigid and Non-Rigid Editing with Text and Image Guidance. ICME 2024.
Long, Rao; Xinghao, Huang; Shipeng, Cai; Bowen, Tian; Wei, Xu; Wenqing, Cheng. A Dual-Path Approach for Gaze Following in Fisheye Meeting Scenes. PRCV 2023.
Xianke, Wang; Wei, Xu; Weiming, Yang; Wenqing Cheng. Musicyolo: A Sight-Singing Onset/Offset Detection Framework. ICASSP 2022.
奖励
以能力为导向的电子信息类高层次创新人才培养体系探索与实践,湖北省人民政府,省部一等奖,2023(程文青; 李震彪; 白翔; 张林; 刘威; 曾喻江; 邓天平; 许炜)
网络内容分析关键技术与应用,湖北省人民政府,科技进步一等奖,2011(杨宗凯; 郑庆华; 许炜等)
专利
许炜, 杨未铭, 王先科, 李雨晴. 基于目标检测的视唱音高检测方法、系统、设备及介质. 专利号:202210656997.0,授权日期:2024.9.13
许炜; 李雨晴; 王先科; 一种基于图卷积的多模态钢琴转录装置及其训练方法,2022-12-07,202211566507.4
许炜, 郑祎能, 蔡世鹏, 饶龙. 课程视频视线修正系统及其训练方法、视线落点估计方法. 专利号:202210537861.8,授权日期:2022.9.2
许炜, 刘威, 向敏, 徐晶, 程文青. 基于声源定位和面部检测的PBL课堂记录方法和系统. 专利号:202011161783.3,授权日期:2022.1.11
许炜, 田博文, 郭春麟, 肖宇. 一种课堂注意力评估方法及系统. 专利号:202110669216.7,授权日期:2021.9.14
许炜, 孔思聪, 廖望, 蔡孝直. 一种基于计算机视觉的课堂行为检测系统. 专利号:201710830828.3,授权日期:2020.10.30
许炜; 崔玉蕾; 周为; 一种基于音视频特征融合的课堂粗粒度声音事件检测方法. 专利号:202311820919.0, 授权日期:2025.1.28
最后修改时间:2026年03月18日

