- Profesor Antonius Rachmat Chrismanto dari UKDW Yogyakarta meneliti pemanfaatan emoji untuk meningkatkan deteksi komentar spam di media sosial.
- Peneliti menciptakan dataset SPAMID-PAIR dan model EiAP-BC guna menganalisis keterkaitan kontekstual antara unggahan asli serta komentar pengguna.
- Model EiAP-BC terbukti mampu meningkatkan akurasi deteksi spam secara signifikan dan lebih efisien dibandingkan metode komputasi sebelumnya.
SuaraJogja.id - Maraknya komentar spam yang memenuhi media sosial (medsos) memunculkan tantangan baru bagi pengembang teknologi kecerdasan buatan (AI).
Di tengah semakin canggihnya pola penyebaran spam, sebuah temuan dari peneliti Indonesia menunjukkan emoji yang selama ini dianggap hanya sebagai pelengkap ekspresi justru dapat menjadi kunci penting untuk meningkatkan kemampuan sistem mendeteksi komentar yang tidak relevan.
Guru Besar bidang Deep Learning Fakultas Teknologi Informasi Universitas Kristen Duta Wacana (UKDW) Yogyakarta, Antonius Rachmat Chrismanto dalam pidato ilmiah pengukuhan guru besar di Yogyakarta, Rabu (17/6/2026) menyatakan, kehadiran emoji dan bahasa informal sering kali dianggap sebagai gangguan atau noise dalam pemrosesan teks. Padahal elemen-elemen tersebut justru menyimpan informasi penting mengenai emosi, maksud, hingga pola komunikasi pengguna medsos.
"Penggunaan emoji dari platform media sosial menjadi salah satu tantangan dalam pengolahan bahasa Indonesia yang perlu dimodelkan secara lebih baik," paparnya.
Anton menjelaskan ledakan data teks dari medsos, platform digital, hingga dunia pendidikan membuat analisis teks menjadi fondasi penting dalam pengambilan keputusan berbasis data. Namun bahasa Indonesia memiliki tantangan tersendiri sebagai bahasa dengan sumber data terbatas, mulai dari penggunaan bahasa campuran, singkatan, bahasa gaul, hingga emoji yang sangat beragam.
Perkembangan medsos itu membuat bentuk spam semakin kompleks. Jika dahulu spam dapat dikenali melalui kata-kata tertentu, kini pelaku kerap menyamarkan pesan mereka agar terlihat seperti komentar biasa.
Komentar spam bahkan sengaja dirancang untuk menarik perhatian pengguna melalui kalimat yang tampak relevan atau penggunaan simbol tertentu. Karena itu, metode deteksi sederhana yang hanya melihat isi komentar sudah tidak lagi memadai. Sistem perlu memahami konteks hubungan antara unggahan dan komentar yang muncul.
"Maksud tersembunyi biasanya tersamarkan dalam interaksi antara pasangan posting dan balasan pada media sosial," ungkapnya.
Berangkat dari persoalan tersebut, Anton bersama tim melakukan penelitian sejak 2017 dengan pendekatan yang berbeda. Mereka tidak hanya menganalisis komentar, tetapi juga memasangkan komentar dengan posting asalnya agar hubungan keduanya dapat dipahami secara kontekstual.
Baca Juga: Komdigi Tegaskan Pembatasan Game Online Destruktif, Gandeng Kampus dan Industri Optimasi AI
Salah satu hasil penelitian tersebut adalah lahirnya SPAMID-PAIR, dataset publik berbahasa Indonesia yang berisi puluhan ribu pasangan posting-komentar dengan label spam dan bukan spam. Dataset tersebut juga memuat informasi mengenai emoji dan sejumlah fitur tambahan lainnya.
Keberadaan dataset ini sekaligus menutup kekurangan data terbuka untuk penelitian bahasa Indonesia yang selama ini masih terbatas. Lebih dari itu, dataset tersebut mampu menangkap fenomena penggunaan emoji yang sangat lazim di media sosial.
"Emoji tidak hanya dipakai untuk menyampaikan emosi secara tersirat, tetapi juga bisa digunakan untuk memanipulasi perhatian pembaca," ungkapnya.
Penelitian berikutnya menemukan fakta menarik. Anton menyebjt penggunaan fitur emoji, baik dalam bentuk simbol maupun representasi teks, ternyata mampu meningkatkan performa model kecerdasan buatan dalam mendeteksi spam.
Selain itu, memasukkan pasangan posting dan komentar sebagai satu kesatuan input juga menghasilkan kemampuan generalisasi yang lebih baik dibandingkan model yang hanya memproses komentar saja.
Tim peneliti kemudian mengembangkan arsitektur deep learning bernama EiAP-BC (Emoji-Aware Inter-Attention Pair BiLSTM-CNN). Model tersebut memanfaatkan mekanisme inter-attention untuk membaca keterkaitan antara posting dan komentar, kemudian menggabungkannya dengan arsitektur Bi-LSTM dan CNN untuk mengekstraksi pola-pola sekuensial.
Berita Terkait
Terpopuler
- Aliansi BEM Bersatu: Mobil Fortuner Tiyo Ardianto Tercatat Milik Adik Letjen Purn Setyo Sularso
- Milk Cleanser Viva untuk Umur Berapa? Ini Penjelasan dan 5 Pilihan Variannya
- 6 Sepatu Adidas Samba Lagi Diskon 50 Persen di Website Resmi, Kesempatan Langka Separuh Harga
- 4 Cushion Terbaik untuk Usia 40 Tahun ke Atas, Anti Crack Samarkan Garis Halus Seharian
- Struktur Kuno Muncul Kembali di Sendang Kamulyan Trenggalek
Pilihan
-
'Sempurna Hanya Milik Allah!' Massa Gelar Aksi Damai Minta MBG Lanjut dan Sikat Koruptornya!
-
Link Live Streaming Portugal vs Kongo: Panggung Sesungguhnya CR7?
-
Demo Pakai Daster ke Istana, Aliansi Perempuan Tuntut Prabowo Turunkan Harga BBM dan Setop MBG
-
BREAKING NEWS: Kantor Dinas Pendidikan Sulsel Digeledah Kejati
-
Prediksi Argentina vs Aljazair: Head to Head, Susunan Pemain dan Fakta Menarik
Terkini
-
Serahkan Persoalan Tiyo ke Ranah Pribadi, Mahasiswa UGM Tegaskan Aksi Protes akan Terus Berlanjut
-
Usai Ricuh Forum GIK, Mahasiswa UGM Sebut Demokrasi Indonesia Telah Mati
-
Emoji Bukan Sekadar Hiasan, Peneliti Temukan Simbol Bisa Bantu AI Mendeteksi Spam di Medsos
-
Gerah Kasus Korupsi Mandala Krida Tak Tuntas, Suporter PSIM Gelar Topo Bisu pada Malam 1 Suro
-
APBD DIY Dihantam Krisis, 67 Persen Bergantung Dana Transfer, Pemda Terpaksa Pangkas Anggaran