Mengintip Agregasi Berita Lewat Semantik

Buat yang sering ngeblog atau nulis berita/artikel di internet, salah satu atribut wajib yang harus disertakan pastinya adalah tag dan kategori tulisan. Kegunaannya apalagi kalau bukan supaya tulisan yang dibuat dapat dicari dan dikelompokkan, baik oleh engine blog itu sendiri, maupun agregator web di luaran sana.

Kebutuhan penggunaan tag dan kategori ini tidak lain adalah karena engine-engine blog sederhana maupun agregator tidak bisa melakukan fungsi otak manusia yang dapat mencerna isi tulisan dan mengambil inti, subyek, atau topik dari tulisan tersebut.

Nah, ada dua entitas lokal, Gresnews dan Bataviase, yang mencoba bermain-main dengan puluhan sumber berita di internet dan membangun sebuah sistem yang dapat membaca, memahami, memberi konteks, menceritakan ulang, dan memberi rujukan ke sumber berita lainnya yang terkait.

Membaca halaman About dan Technology milik Gresnews bagai membaca abtraksi dan pendahuluan sebuah tulisan ilmiah, yang mungkin tidak jauh dari kenyataannya mengingat sang pembuatnya, Ismail Fahmi, adalah seorang doktor di bidang semantik web.

Secara garisbesarnya, Gresnews melakukan pendekatan semantik dengan mengekstrak subyek dan topik dari tiap-tiap berita, kemudian menyajikan tautan ke berita-berita terkait dengan subyek dan topik yang sama. Lebih jauhnya lagi, Gresnews juga menyediakan timeline dari subyek atau topik tersebut, menyajikan grafik trend topik tersebut, dan kutipan-kutipan tentang topik atau subyek tersebut.

Sedangkan Bataviase melakukan kegiatan yang lebih sederhana tapi tidak kalah menarik, yaitu merangkum kata-kata dan frase-frase kunci dari artikel, lalu menyajikan ringkasan artikel yang di-generate oleh sistem secara otomatis, dan memberi tautan ke artikel-artikel yang terkait. Hasil ringkasan otomatis oleh sistem ini cukup impresif dan malah belum tentu bisa dibuat setepat itu oleh manusia.

Berbeda dengan Gresnews yang hanya memberi kutipan tiap artikel, Bataviase menghadirkan lengkap artikel yang diolahnya. Melihat segambreng logo sumber berita yang dirujuk oleh Bataviase, sepertinya memang mereka secara resmi menjalin kerjasama dengan sumber-sumber beritanya.

Mengingat rumitnya pemahaman bahasa, dan apalagi membuat mesin menjadi mengerti, tentu saja masih dapat ditemui kekurangan di keduanya. Contohnya di Bataviase, pada artikel tentang Mega(wati Soekarnoputri) terdapat tautan ke artikel terkait yang juga membahas tentang Bank Mega.

Terus penting ngga sih sebenarnya? Jelas dong. Sebagai negara keempat paling banyak penduduknya di dunia, seharusnya sih makin banyak pihak yang memerlukan pemahaman bahasa kita. Contohnya Twitter, sebagaimana yang kita tau sendiri sering menyodorkan Trending Topics ajaib seperti “Yang Mau Di” atau “Yang Anak Indonesia”, akibat dari ketidakmampuan mereka mengerti konteks kalimat dalam Bahasa Indonesia.

Selain itu seiring dengan semakin banyaknya user-generated contents seperti blog dan tweet, yang tidak selalu disertai dengan tagging yang sesuai, sebuah aggregator yang “pintar” pasti akan sangat berguna.

Versi ngayal lebih jauhnya, kayaknya tinggal menunggu waktu aja kita bisa nanya atau ngobrol dengan komputer dan dapet jawaban seperti layaknya ngobrol dengan orang beneran 😀

4 thoughts on “Mengintip Agregasi Berita Lewat Semantik

  1. Plugin model auto posting di wordpress berarti menggunakan cara mirip seperti ini ya mungkin lebih sederhana

Leave a Reply

Your email address will not be published.