Skip to content

整理词表 #9

@hailiang-wang

Description

@hailiang-wang

需要一个预定义的词表作为pinyin纠错的检测:
分词后,考虑每个词的可能性,因为分词是能识别新词的,拼写错误常常被包含在分出来的词汇中。
这些词是pinyin和目标单词一致。

1)设置一个大词表
包含常用词,从HanLP和jieba取得词表。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions