0
国家知识产权局信息显示,华东师范大学;博音听力技术(上海)有限公司申请一项名为“一种基于三视角特征解耦与门控融合的语音情感识别方法”的专利,公开号CN122024771A,申请日期为2026年3月。
专利摘要显示,本发明公开了一种基于三视角特征解耦与门控融合的语音情感识别方法,包括:利用CNN对语谱图时频结构进行建模,利用Bi‑LSTM对MFCC序列进行时序动态建模,利用HuBERT模型对原始语音波形进行深度表示学习并采用部分解冻微调策略进行适配性训练,分别得到各视角的话语级特征表示;通过参数共享的视角无关编码器与视角特定编码器将话语级特征表示解耦为视角无关特征表示与视角特定特征表示,并采用差异损失约束降低子空间冗余;融合视角无关特征表示生成全局情感共识;基于自适应门控机制动态调节共识信息与视角特定线索的融合比例得到判别性强的初步融合特征;将初步融合特征拼接输入分类器进行情感分类。本发明显著提高了语音情感识别的准确率与鲁棒性。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
00:02