ASR语音识别统计

字准、句准统计公式

Posted by AJie on February 24, 2025

ASR(Automatic Speech Recognition)

自动语音识别技术,通过对音频流进行算法计算,将语音转换成文字的技术。那么业内如何衡量识别的准确度呢?接下来就讲一下语音识别的几个关键指标的统计。

句错率(SER)

  • 句错误率:Sentence Error Rate
  • 解释:句子识别错误的的个数,除以总的句子个数即为SER
  • 计算公式:(所有公式省了 * 100%)

SER = (错误句数 / 总句数)* 100%

句正确率(S.Corr / Sent)

  • 句正确率:Sentence Correct
  • 计算公式: S.Corr = 1 - SER = 正确句数 / 总句数

字错率(WER/CER)

  • WER,Word error rate,词错率,但一般称为字错率,是语音识别领域的关键性评估指标,WER越低表示效果越好!
  • CER,Character Error Rate,字符错误率,中文一般用CER来表示字错率。
  • 计算公式(重要) WER = (S + D + I ) / N = (S + D + I ) / (S + D + H )

  • S 为替换的字数,常用缩写WS
  • D 为删除的字数,常用缩写WD
  • I 为插入的字数,常用缩写WI
  • H 为正确的字数,维基百科是C,这里统一改用H
  • N 为总(S替换+ D删除+ H正确)的字数

字正确率(W.Corr)

  • 字正确率,Word Correct,一般国内宣传用的多,识别率(识别正确率)达到多少多少。
  • 计算公式: W.Corr = ( N - D - S ) / N = H / N

字准确率(W.Acc)

  • 字准确率,Word Accuracy
  • 计算公式: W.Acc = 1 - WER = ( N - D - S - I ) / N = (H - I) / N