特定人语音识别算法—DTW算法
2012-09-14 20:09阅读:
不知不觉暑假过去了,在这两个月里并没有达到自己的要求完成自己安排的任务,仍然还是有些迷惘,时常在想为什么在工作的时候目标很明确应该学什么,但一旦在学校里就仿佛迷失方向,可能就是古人说的“不知庐山真面目,只缘身在此山中”。不管怎样,还是得好好规划一下未来的方向以及更长远的计划。这一两个星期主要是针对语音识别,特别学习了基于HMM模型和DTW算法的孤立数字语音识别,HMM模型过于复杂,这里只对DTW算法的语音识别作一下简单归纳。
DTW(动态时间弯折)算法原理:基于动态规划(DP)的思想,解决发音长短不一的模板匹配问题。相比HMM模型算法,DTW算法的训练几乎不需要额外的计算。所以在孤立词语音识别中,DTW算法仍得到广泛的应用。
在训练和识别阶段,首先采用端点检测算法确定语音的起点和终点。对于参考模板{R(1),R(2),…,R(m),…,R(M)},R(m)为第m帧的语音特征矢量。对于测试模板{T(1),T(2),…,T(n),…,T(N)},