@@ -9,13 +9,15 @@ Natural language processing หรือ การประมวลภาษา
99รองรับเฉพาะ Python 3 เท่านั้น (Python 2 กำลังพัฒนา)
1010
1111### Version
12- 0.0.3
12+ 0.0.4
1313
1414### มีอะไรใหม่
1515แก้ไข bug import ใน python บางรุ่น
16+ ใช้ PyICU ตัดคำเป็นค่าเริ่มต้น
1617
1718### ความสามารถ
1819 - ตัดคำภาษาไทย
20+ - Postaggers ภาษาไทย
1921 - อ่านตัวเลขเป็นข้อความภาษาไทย
2022 - เรียงจำนวนคำของประโยค
2123 - แก้ไขปัญหาการพิมพ์ลืมเปลี่ยนภาษา
@@ -40,11 +42,13 @@ from pythainlp.segment import segment
4042a = ' ฉันรักภาษาไทยเพราะฉันเป็นคนไทย'
4143b = segment(a)
4244print (b) # ['ฉัน', 'รัก', 'ภาษาไทย', 'เพราะ', 'ฉัน', 'เป็น', 'คนไทย']
45+ # Postaggers ภาษาไทย
46+ from pythainlp.postaggers import tag
47+ print (tag(' คุณกำลังประชุม' )) # ค ุณ/PPRS กำลัง/XVBM ประชุม/VACT
4348# หาคำที่มีจำนวนการใช้งานมากที่สุด
4449from pythainlp.rank import rank
45- aa = rank(a)
46- print (aa) # Counter({'น': 4, 'ั': 3, 'า': 3, 'ร': 2, 'ท': 2, 'ย': 2, 'เ': 2, 'ฉ': 2, 'ไ': 2,
47- # 'ก': 1, 'พ': 1, 'ป': 1, '็': 1, 'ะ': 1, 'ษ': 1, 'ภ': 1, 'ค': 1})
50+ aa = rank(b)
51+ print (aa) # Counter({'ฉัน': 2, 'ไทย': 2, 'เป็น': 1, 'รัก': 1, 'ภาษา': 1, 'เพราะ': 1, 'คน': 1})
4852# ทับศัพท์เสียงไทยในภาษาอังกฤษ (ยังไม่รองรับเสียงสระ)
4953from pythainlp.romanization import romanization
5054b= romanization(" ต้นกก" )
0 commit comments