We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
There was an error while loading. Please reload this page.
1 parent 68d4fdb commit 528658eCopy full SHA for 528658e
pythainlp/util/__init__.py
@@ -47,15 +47,17 @@ def trigram(token):
47
u"ำ"
48
] # เก็บพวกสระ วรรณยุกต์ที่ซ้ำกันแล้วมีปัญหา
49
rule2=[
50
- (u"เเ",u"แ"),
+ (u"เเ",u"แ"), # เ เ -> แ
51
(u"ํ(t)า",u"\\1ำ"),
52
(u"ํา(t)",u"\\1ำ"),
53
- (u"([่-๋])([ัิ-ื])",u"\\2\\1")]
+ (u"([่-๋])([ัิ-ื])",u"\\2\\1"),
54
+ (u"ำ([่-๋])", u"\\1ำ")]
55
rule2py2=[
56
(u"เเ",u"แ"),
57
(u"ํ(t)า",u"\1ำ"),
58
(u"ํา(t)",u"\1ำ"),
- (u"([่-๋])([ัิ-ื])",u"\2\1")
59
+ (u"([่-๋])([ัิ-ื])",u"\2\1"),
60
+ (u"ำ([่-๋])", u"\1ำ")
61
] # เก็บพวก พิมพ์ลำดับผิดหรือผิดแป้นแต่กลับแสดงผลถูกต้อง ให้ไปเป็นแป้นที่ถูกต้อง เช่น เ + เ ไปเป็น แ
62
def normalize(text):
63
"""
0 commit comments