Emoji Bukan Sekadar Hiasan, Peneliti Temukan Simbol Bisa Bantu AI Mendeteksi Spam di Medsos

Baca 10 detik

Profesor Antonius Rachmat Chrismanto dari UKDW Yogyakarta meneliti pemanfaatan emoji untuk meningkatkan deteksi komentar spam di media sosial.
Peneliti menciptakan dataset SPAMID-PAIR dan model EiAP-BC guna menganalisis keterkaitan kontekstual antara unggahan asli serta komentar pengguna.
Model EiAP-BC terbukti mampu meningkatkan akurasi deteksi spam secara signifikan dan lebih efisien dibandingkan metode komputasi sebelumnya.

SuaraJogja.id - Maraknya komentar spam yang memenuhi media sosial (medsos) memunculkan tantangan baru bagi pengembang teknologi kecerdasan buatan (AI).

Di tengah semakin canggihnya pola penyebaran spam, sebuah temuan dari peneliti Indonesia menunjukkan emoji yang selama ini dianggap hanya sebagai pelengkap ekspresi justru dapat menjadi kunci penting untuk meningkatkan kemampuan sistem mendeteksi komentar yang tidak relevan.

Guru Besar bidang Deep Learning Fakultas Teknologi Informasi Universitas Kristen Duta Wacana (UKDW) Yogyakarta, Antonius Rachmat Chrismanto dalam pidato ilmiah pengukuhan guru besar di Yogyakarta, Rabu (17/6/2026) menyatakan, kehadiran emoji dan bahasa informal sering kali dianggap sebagai gangguan atau noise dalam pemrosesan teks. Padahal elemen-elemen tersebut justru menyimpan informasi penting mengenai emosi, maksud, hingga pola komunikasi pengguna medsos.

"Penggunaan emoji dari platform media sosial menjadi salah satu tantangan dalam pengolahan bahasa Indonesia yang perlu dimodelkan secara lebih baik," paparnya.

Anton menjelaskan ledakan data teks dari medsos, platform digital, hingga dunia pendidikan membuat analisis teks menjadi fondasi penting dalam pengambilan keputusan berbasis data. Namun bahasa Indonesia memiliki tantangan tersendiri sebagai bahasa dengan sumber data terbatas, mulai dari penggunaan bahasa campuran, singkatan, bahasa gaul, hingga emoji yang sangat beragam.

Perkembangan medsos itu membuat bentuk spam semakin kompleks. Jika dahulu spam dapat dikenali melalui kata-kata tertentu, kini pelaku kerap menyamarkan pesan mereka agar terlihat seperti komentar biasa.

Komentar spam bahkan sengaja dirancang untuk menarik perhatian pengguna melalui kalimat yang tampak relevan atau penggunaan simbol tertentu. Karena itu, metode deteksi sederhana yang hanya melihat isi komentar sudah tidak lagi memadai. Sistem perlu memahami konteks hubungan antara unggahan dan komentar yang muncul.

"Maksud tersembunyi biasanya tersamarkan dalam interaksi antara pasangan posting dan balasan pada media sosial," ungkapnya.

Berangkat dari persoalan tersebut, Anton bersama tim melakukan penelitian sejak 2017 dengan pendekatan yang berbeda. Mereka tidak hanya menganalisis komentar, tetapi juga memasangkan komentar dengan posting asalnya agar hubungan keduanya dapat dipahami secara kontekstual.

Salah satu hasil penelitian tersebut adalah lahirnya SPAMID-PAIR, dataset publik berbahasa Indonesia yang berisi puluhan ribu pasangan posting-komentar dengan label spam dan bukan spam. Dataset tersebut juga memuat informasi mengenai emoji dan sejumlah fitur tambahan lainnya.

Keberadaan dataset ini sekaligus menutup kekurangan data terbuka untuk penelitian bahasa Indonesia yang selama ini masih terbatas. Lebih dari itu, dataset tersebut mampu menangkap fenomena penggunaan emoji yang sangat lazim di media sosial.

"Emoji tidak hanya dipakai untuk menyampaikan emosi secara tersirat, tetapi juga bisa digunakan untuk memanipulasi perhatian pembaca," ungkapnya.

Penelitian berikutnya menemukan fakta menarik. Anton menyebjt penggunaan fitur emoji, baik dalam bentuk simbol maupun representasi teks, ternyata mampu meningkatkan performa model kecerdasan buatan dalam mendeteksi spam.

Selain itu, memasukkan pasangan posting dan komentar sebagai satu kesatuan input juga menghasilkan kemampuan generalisasi yang lebih baik dibandingkan model yang hanya memproses komentar saja.

Tim peneliti kemudian mengembangkan arsitektur deep learning bernama EiAP-BC (Emoji-Aware Inter-Attention Pair BiLSTM-CNN). Model tersebut memanfaatkan mekanisme inter-attention untuk membaca keterkaitan antara posting dan komentar, kemudian menggabungkannya dengan arsitektur Bi-LSTM dan CNN untuk mengekstraksi pola-pola sekuensial.

Berita Terkait

Pilihan

Terkini

Emoji Bukan Sekadar Hiasan, Peneliti Temukan Simbol Bisa Bantu AI Mendeteksi Spam di Medsos

Tag

Berita Terkait

Terpopuler

Pilihan

Terkini