1.2语音识别分类语音识别系统根据对说话人说话方式的要求,可以分为孤立字(词)语音识别系统、连接字语音识别系统和连续语音识别系统;根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统;根据词汇量大小可以分为小词汇量、中等词汇量、大词汇量以及无限词汇量语音识别系统([3])。2. 发展趋势20世纪50年代:语音识别的研究从上个世纪50年代开始,1952年,三位贝尔实验室的研究人员研究出了世界上第一个能识别10个英文数字发音的系统——Audry系统。该系统被普遍认为是自动语音识别系统的开端。20世纪60年代:60年代计算机的应用推动了语音识别的发展。其中动态规划(DP)和线性预测分析技术(LP)等技术的提出和运用对语音识别的发展产生了深远影响。20世纪70年代:70年代LP技术得到进一步发展,动态时间归正技术(DTW)基本成熟。特别是矢量量化(VQ)和隐马尔可夫模型(HMM)理论在实践上的运用初步实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。20世纪80年代:20世纪80年代随着HMM模型和人工神经元网络(ANN)等技术在语音识别中的成功应用人们终于在实验室突破了大词汇量、连续语音和非特定人这三大语音识别障碍。首次把这三个特性都集成在一个系统中,比较有代表性的是卡耐基梅隆大学研发的Sphinx系统。20世纪90年代:90年代之后语音识别与自然语言处理相结合发展到基于自然口语识别和理解的人机对话系统。与机器翻译技术相结合逐步发展出面向不同语种人类之间交流的直接语音翻译技术。 语言识别技术在中国的发展 We should meet tomorrow at the booth at 2 pm. We (person) should meet tomorrow (date) at the booth (location) at 2 pm (time). We (person) should (modifier) meet (action) tomorrow (date) at the booth (location) at 2 pm (time). We (person) should (modifier) meet (action) tomorrow (date) at the booth (location) at 2 pm (time—13:00:00 UTC). We should meet tomorrow at the booth at 2 pm. How about Tuesday? How about Tuesday? (Tuesday=Nov.21) Step 7: Sentiment Analysis We should meet tomorrow at the booth at 2 pm. How about Tuesday? You know that’s not possible! (sentiment: negative) 注:科大讯飞转写准确度也有待加强,在上下文语境充分的情况下,也会出现“识别错误”“语法错误”等基础错误。如图中的:COVID-19被识别成了Covey 19;If compared to the developed countries around the world被转写成了It compared to the developed countries 在软件转写准确性有待提高的情况下,人工后续的编辑成本就会上升。 4. 总结与启发 特别说明:本文仅供学习交流,如有不妥欢迎后台联系 - END - 原创来源:北外CAT课程展示-张莹玥 推文编辑:张莹玥