ASR(Automatic Speech Recognition)
自动语音识别技术,通过对音频流进行算法计算,将语音转换成文字的技术。那么业内如何衡量识别的准确度呢?接下来就讲一下语音识别的几个关键指标的统计。
句错率(SER)
- 句错误率:Sentence Error Rate
- 解释:句子识别错误的的个数,除以总的句子个数即为SER
- 计算公式:(所有公式省了 * 100%)
SER = (错误句数 / 总句数)* 100%
句正确率(S.Corr / Sent)
- 句正确率:Sentence Correct
- 计算公式: S.Corr = 1 - SER = 正确句数 / 总句数
字错率(WER/CER)
- WER,Word error rate,词错率,但一般称为字错率,是语音识别领域的关键性评估指标,WER越低表示效果越好!
- CER,Character Error Rate,字符错误率,中文一般用CER来表示字错率。
-
计算公式(重要) WER = (S + D + I ) / N = (S + D + I ) / (S + D + H )
- S 为替换的字数,常用缩写WS
- D 为删除的字数,常用缩写WD
- I 为插入的字数,常用缩写WI
- H 为正确的字数,维基百科是C,这里统一改用H
- N 为总(S替换+ D删除+ H正确)的字数
字正确率(W.Corr)
- 字正确率,Word Correct,一般国内宣传用的多,识别率(识别正确率)达到多少多少。
- 计算公式: W.Corr = ( N - D - S ) / N = H / N
字准确率(W.Acc)
- 字准确率,Word Accuracy
- 计算公式: W.Acc = 1 - WER = ( N - D - S - I ) / N = (H - I) / N