Pengecaman entiti nama bahasa Melayu menggunakan pendekatan berasaskan peraturan

Kajian mengenai pengecaman entiti nama (PEN) berdasarkan peraturan telah dijalankan secara meluas dan diguna melalui pelbagai bahasa terutama bahasa Inggeris. Namun, peraturan yang dihasilkan oleh bahasa Inggeris memiliki perbezaan dengan bahasa Melayu kerana perbezaan morfologi. Isu yang mencabar d...

Full description

Bibliographic Details
Main Authors: Ulfa Nadia, Nazlia Omar
Format: Article
Language:English
Published: Penerbit Universiti Kebangsaan Malaysia 2019
Online Access:http://journalarticle.ukm.my/14150/
http://journalarticle.ukm.my/14150/
http://journalarticle.ukm.my/14150/1/30965-104286-1-PB.pdf
Description
Summary:Kajian mengenai pengecaman entiti nama (PEN) berdasarkan peraturan telah dijalankan secara meluas dan diguna melalui pelbagai bahasa terutama bahasa Inggeris. Namun, peraturan yang dihasilkan oleh bahasa Inggeris memiliki perbezaan dengan bahasa Melayu kerana perbezaan morfologi. Isu yang mencabar dalam PEN bahasa Melayu adalah rujukan silang antara satu entiti nama dengan entiti nama lainnya, pencampuran entiti nama dan pengulangan entiti nama. Kertas ini mencadang peraturan baru bagi mengatasi isu dalam PEN bahasa Melayu. Kajian bermula dengan menyedia korpus fail teks berita dalam talian bahasa Melayu, pembangunan gazetir, pembangunan peraturan dan penilaian. Kajian ini memberi fokus kepada pengecaman entiti nama yang melibatkan sembilan entiti nama iaitu nama individu, lokasi, organisasi, jawatan, tarikh, masa, kewangan, ukuran dan peratusan. Secara keseluruhannya, pengujian ini memberikan hasil dengan nilai kejituan 90.23%, dapatan 92.13% dan ukuran-f 91.05%. Hasil daripada kajian ini diharap dapat membantu penyelidik dalam melaksanakan PEN bahasa Melayu dengan menghasilkan nilai ketepatan yang lebih tinggi.