Riset Jurnal Literatur : Penggunaan Metode Stemming Pada Bahasa Daerah Melayu-Ambon

DOI: https://doi.org/10.33650/jeecom.v6i1.8517

Authors (s)


(1) * Vinnesa Patricia Carolina   (Universitas AMIKOM Yogyakarta)  
        Indonesia
(2)  Ema Utami   (Universitas AMIKOM Yogyakarta)  
        Indonesia
(3)  Ainul Yaqin   (Universitas AMIKOM Yogyakarta)  
        Indonesia
(*) Corresponding Author

Abstract


Stemming dalam bahasa Ambon merupakan tantangan yang signifikan karena lexiconnya yang luas, mencakup sekitar 127.000 kata dasar seperti yang tercatat dalam Kamus Besar Bahasa Indonesia. Hal ini disebabkan oleh kompleksitas stemming yang timbul dari tugas untuk mengekstrak kata-kata dasar dari kata-kata yang memiliki imbuhan, yang memerlukan penghapusan berbagai imbuhan seperti awalan, sisipan, akhiran, dan kombinasinya. Proses ini memiliki pentingan yang besar karena sangat memengaruhi kualitas hasil analisis.

Untuk mengatasi kompleksitas linguistik ini, beberapa algoritma stemming telah dikembangkan. Algoritma-algoritma ini termasuk Nazief & Adriani, Enhanced Confix Stripping, Sastrawi, dan Tala, masing-masing menawarkan teknik unik untuk menangani kompleksitas stemming dalam bahasa Indonesia. Pemilihan algoritma yang tepat sangat penting untuk memastikan akurasi dan kehandalan proses stemming dalam kerangka analisis.

Dalam penelitian stemming yang telah dilakukan, terdapat variasi dalam metode-metode yang digunakan. Algoritma stemming yang paling sering digunakan adalah Nazief & Adriani, dengan 17 kasus tercatat. Kemudian, Enhanced Confix Stripping juga cukup populer dengan 12 kasus. Sastrawi, meskipun dengan frekuensi yang lebih rendah, tetap digunakan dalam 4 kasus. Sedangkan algoritma Tala, meskipun jarang digunakan, tetap muncul dalam 1 kasus. Hal ini mencerminkan diversitas dan pilihan yang tersedia dalam memilih metode stemming yang sesuai dengan kebutuhan penelitian. Meskipun demikian, hal ini mungkin terkait dengan faktor-faktor seperti proyek penelitian yang sedang berlangsung, ketersediaan dana, atau kondisi eksternal lainnya yang memengaruhi produksi penelitian pada periode tersebut. Dengan demikian, penelitian tentang stemming tetap menjadi topik yang menarik dan relevan, dengan potensi untuk terus berkembang dan memberikan kontribusi yang berarti dalam pemrosesan teks dan penelitian linguistik di masa mendatang.


Keywords

Stemming Ambon;Nazief & Adriani;Enhanced Confix Stripping;Sastrawi;Tala



Full Text: PDF



Article View

Abstract views : 84 times | PDF files viewed : 57 times

Dimensions, PlumX, and Google Scholar Metrics

10.33650/jeecom.v6i1.8517


Refbacks

  • There are currently no refbacks.


Copyright (c) 2024 Vinnesa Patricia Carolina, Ema Utami, Ainul Yaqin

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

Creative Commons License
 
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

Journal of Electrical Engineering and Computer (JEECOM)
Published by LP3M Nurul Jadid University, Indonesia, Probolinggo, East Java, Indonesia.