论文

论文#

  • Self-Supervised Speech Representation Learning: A Review

    • 链接: https://arxiv.org/abs/2205.10643

    • 简介: 这是一篇综述性论文,探讨了语音处理领域的自监督学习方法。它解决了传统模型依赖大量标注数据的痛点,回顾了如何利用海量无标签的音频数据来预训练通用语音模型。文章将现有方法分为生成式、对比式和预测式三种,其目标是学习一种普适性的语音表示,从而能用很少的标注数据来适应各种下游任务(如语音识别、声纹识别等)。