TEMPO Interaktif, Jakarta- Sebentar lagi, tak ada gunanya Anda membuat profil dan tweet yang anonim di situs microblogging Twitter.
Sekelompok peneliti telah menemukan algoritma yang mampu menduga jenis
kelamin pengguna Twitter hanya dari 140 karakter tweet-nya.
Kemampuan ini akan membantu
pengguna Twitter dari jebakan pengguna lain yang menampilkan profil
palsu. Misalnya, lelaki tua yang berpura-pura menjadi perempuan lesbian,
seperti kasus di Damaskus, ketika seorang pria paruh baya dari Georgia
membuat akun palsu bernama “Gay Girl”.
Penelitian ini berangkat dari ide
bahwa perempuan bisa memakai bahasa yang berbeda dengan pria. Misalnya,
perempuan biasanya suka memakai smiley dan mengulang-ulang huruf.
Penelitian itu dilakukan oleh
sekelompok peneliti dari perusahaan riset teknologi Mitre Corporation di
Washington, Amerika Serikat. Algoritma itu secara akurat menebak jenis
kelamin pengguna Twitter dengan cara mengisolasi beberapa kata spesifik
dalam setiap tweet.
Twitter tidak menampilkan jenis
kelamin penggunanya. Ini menjadi ujian sempurna bagi metode ilmiah
dengan algoritma khusus tersebut.
Tim peneliti mula-mula mengumpulkan
lokasi, deskripsi, nama profil, dan nama asli semua pengguna Twitter
dalam sampel mereka. Hampir semua sampel mengirim posting satu kali saja.
Tes pembukaan dilakukan untuk
melihat bilamana algoritma itu bisa mendeteksi jenis kelamin seseorang
dari nama dan komputer mampu menduga secara benar 89 persen.
Dengan menganalisis hanya konten dari sebuah tweet tunggal, algoritma itu mampu menduga gender secara benar hampir 66 persen. Dengan menganalisis semua tweet, akurasinya meningkat sampai lebih dari 75 persen.
Hasil lainnya adalah 71 persen
akurat pada bagian deskripsi saja dan 77 persen akurat pada nama di
layar. Ketika mengkombinasikan keempat unsur dalam tweet itu, tingkat akurasi komputer menjadi 92 persen.
Tanda-tanda baca yang muncul sering menjadi indikasi jenis kelamin. Penggunaan smiley atau kata seru secara tipikal mengindikasikan pemilik akun Twitter adalah perempuan.
Kaum perempuan kelihatannya suka menggunakan kata-kata seperti love, cute, happy, mommy, sleep, school, baby, bed, chocolate, dan hate. Termasuk pula singkatan yang umum, seperti “LOL” dan “OMG”.
Sedangkan lelaki hanya memiliki sedikit frasa yang menjadi atributnya, di antaranya “http” dan “google”.
Penelitian itu juga menunjukkan bahwa jenis kelamin kelihatan pada “bigram posesif”, yaitu frasa yang diawali dengan kata my atau our. Frasa yang menjadi atribut kaum pria adalah my wife, my gf, dan my beer. Adapun perempuan biasanya menggunakan my yogurt dan my husband.
Algoritma ini akan berguna bagi siapa saja yang bermaksud mencapai audiens spesifik di situs microblogging itu,
seperti pemilik merek dan bisnis yang ingin memasarkan produknya kepada
pengguna Twitter. Tapi pasti berguna juga bagi Anda yang tak ingin
terjebak penipu.
DEDDY SINAGA | BERBAGAI SUMBER
Ferry Arbania , Sahabat Indonesia