Skip to content

PyThaiNLP 1.6 Beta 1

Pre-release
Pre-release

Choose a tag to compare

@wannaphong wannaphong released this 20 Feb 04:27
· 4436 commits to dev since this release

PyThaiNLP 1.6 Beta 1 รุ่นทดสอบสำหรับนักพัฒนาและบุคคลทั่วไป เป็นรุ่นที่ API นิ่งแล้ว

มีอะไรใหม่ใน PyThaiNLP 1.6

  • ตัวตัดคำ newmm ถูกเขียนขึ้นใหม่โดยใช้หลัก Maximum Matching algorithm และ TCC เพื่อแก้ไขข้อผิดพลาดจากการตัดคำที่ไม่มีในฐานข้อมูลโดยคุณ @korakot และตัดคำได้รวดเร็วยิ่งขึ้น
  • เพิ่ม cutkum (https://github.com/pucktada/cutkum) เข้ามาเป็นส่วนหนึ่งของระบบตัดคำ
  • เพิ่ม syllable_tokenize ระบบตัดพยางค์ภาษาไทยโดยใช้ dict ในการตัดพยางค์
  • เพิ่ม dict_word_tokenize สำหรับใช้เป็นฐานข้อมูลตัดคำได้ตามที่ต้องการ
  • pythainlp.romanization โดยใช้ royin ถูกเขียนขึ้นใหม่
  • pythainlp.sentiment ถูก Train ใหม่โดยใช้ตัวตัดคำ newmm ทำให้ได้ผลลัพธ์ที่แม่นยำขึ้นมากกว่าเดิม
  • เพิ่ม pythainlp.word_vector.thai2vec โดยสามารถนำ https://github.com/cstorm125/thai2vec ของคุณ @cstorm125 ไปใช้งานได้
  • เพิ่มระบบเก็บไฟล์ไว้ใน pythainlp-data สำหรับใช้เก็บข้อมูลต่าง ๆ ของ PyThaiNLP
  • ติดตั้งได้สะดวกยิ่งขึ้นด้วยการเขียนโค้ดทดแทน pyicu ทำให้ไม่จำเป็นต้องติดตั้ง pyicu อีกต่อไป

เอกสารการใช้งาน https://github.com/PyThaiNLP/pythainlp/blob/dev/docs/pythainlp-1-6-thai.md (กำลังปรับปรุง)

สามารถทดลองใช้งานได้ โดยลบ PyThaiNLP เวชั่นก่อนทิ้งด้วยคำสั่ง pip uninstall pythainlp

แล้วติดตั้งได้ด้วยคำสั่ง pip install https://github.com/PyThaiNLP/pythainlp/archive/1.6-beta-1.zip

หากท่านพบ Bug สามารถแจ้งได้ที่ https://www.facebook.com/pythainlp/ หรือหน้า https://github.com/PyThaiNLP/pythainlp/issues

ขอบคุณท่านที่ใช้ PyThaiNLP :)

ทีมนักพัฒนา PyThaiNLP