Pengecaman entiti nama bahasa Melayu menggunakan pendekatan berasaskan peraturan
Kajian mengenai pengecaman entiti nama (PEN) berdasarkan peraturan telah dijalankan secara meluas dan diguna melalui pelbagai bahasa terutama bahasa Inggeris. Namun, peraturan yang dihasilkan oleh bahasa Inggeris memiliki perbezaan dengan bahasa Melayu kerana perbezaan morfologi. Isu yang mencabar d...
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
Penerbit Universiti Kebangsaan Malaysia
2019
|
Online Access: | http://journalarticle.ukm.my/14150/ http://journalarticle.ukm.my/14150/ http://journalarticle.ukm.my/14150/1/30965-104286-1-PB.pdf |
Summary: | Kajian mengenai pengecaman entiti nama (PEN) berdasarkan peraturan telah dijalankan secara meluas dan diguna melalui pelbagai bahasa terutama bahasa Inggeris. Namun, peraturan yang dihasilkan oleh bahasa Inggeris memiliki perbezaan dengan bahasa Melayu kerana perbezaan morfologi. Isu yang mencabar dalam PEN bahasa Melayu adalah rujukan silang antara satu entiti nama dengan entiti nama lainnya, pencampuran entiti nama dan pengulangan entiti nama. Kertas ini mencadang peraturan baru bagi mengatasi isu dalam PEN bahasa Melayu. Kajian bermula dengan menyedia korpus fail teks berita dalam talian bahasa Melayu, pembangunan gazetir, pembangunan peraturan dan penilaian. Kajian ini memberi fokus kepada pengecaman entiti nama yang melibatkan sembilan entiti nama iaitu nama individu, lokasi, organisasi, jawatan, tarikh, masa, kewangan, ukuran dan peratusan. Secara keseluruhannya, pengujian ini memberikan hasil dengan nilai kejituan 90.23%, dapatan 92.13% dan ukuran-f 91.05%. Hasil daripada kajian ini diharap dapat membantu penyelidik dalam melaksanakan PEN bahasa Melayu dengan menghasilkan nilai ketepatan yang lebih tinggi. |
---|