需要一个预定义的词表作为pinyin纠错的检测: 分词后,考虑每个词的可能性,因为分词是能识别新词的,拼写错误常常被包含在分出来的词汇中。 这些词是pinyin和目标单词一致。 1)设置一个大词表 包含常用词,从HanLP和jieba取得词表。