MALINDO 2012 : The 6th International Workshop on Malay and Indonesian Language Engineering

6/5/2012

 
Keynote Speaker: Nn. Lim Lian Tze
 
Judul: Kamus multibahasa Biaya Rendah untuk kekurangan sumber daya Bahasa 
 
abstrak: Kamus terjemahan bahasa sangat penting dalam aplikasi NLP, seperti mesin penerjemahan, serta menjadi alat bantu membaca berharga untuk pembaca manusia. Secara manual membangun leksikon multibahasa dari awal, bagaimanapun, adalah sangat padat karya.
 
Kami menjelaskan sebuah metode biaya rendah untuk membangun prototipe leksikon multibahasa menggunakan data masukan yang sangat sederhana, yaitu daftar pemetaan terjemahan dua bahasa.
 
Sumber bilingual seperti ini sering tersedia secara bebas dan mudah didapat dari Internet atau konvensional berbasis kertas kamus. Persyaratan rendah dari input data juga berarti metode kami sangat cocok untuk kekurangan sumber daya bahasa dan bahasa-pasang.
 
Selain itu, kerangka keseluruhan leksikon multibahasa kami menganggap tidak ada pengetahuan linguistik yang luas dari kontributor yang ingin membantu meningkatkan leksikon. Hal ini memungkinkan setiap pembicara dari bahasa yang kekurangan sumber daya untuk berkontribusi pada proyek, sehingga membuat pasangan bahasa yang lebih mungkin melalui leksikon multibahasa. Kami juga menunjukkan bagaimana leksikon multibahasa dapat digunakan sebagai bantuan "cerdas" membaca, menggunakan informasi kontekstual ditambang dari corpus bilingual untagged sebanding. Sekali lagi, ini akan membuat kekurangan sumber daya bahasa lebih mudah diakses oleh penutur bahasa lain.
 
21st Jun 2012
Universiti Malaysia Sarawak (UNIMAS), Kota Samarahan, Sarawak, Malaysia
http://www.malindo.org