Tag Archives: MultiPathNet

Facebook Kembangkan AI yang Bisa Menganalisis Foto

Pada pembukaan konferensi F8 di bulan April, Mark Zuckerberg membahas visi Facebook untuk membuat dunia yang semakin terhubung. Salah satu cara mencapainya ialah melalui artificial intelligence, dan di sana sang CEO turut memperkenalkan Facebook Messenger Platform, memungkinkan developer menciptakan bot buat berinteraksi ‘secara otomatis’ dengan konsumen.

Ternyata, membantu interaksi bukanlah satu-satunya fokus pengembangan AI. Facebook juga bermaksud agar sistem mereka mampu menganalisis foto dan mengidentifikasi objek. Di waktu ke depan, tim Facebook AI Research berharap kreasi barunya itu dapat memberikan saran bagi konsumen saat berbelanja, serta memberi manfaat di bidang kesehatan – misalnya merekomendasikan makanan bernutrisi hingga mengetahui kebugaran tubuh lewat foto yang Anda unggah.

Kapabilitas tersebut didasari pada teknik deep learning, memanfaatkan tiga algoritma khusus untuk memproses elemen-elemen tertentu pada gambar-gambar yang di-input. Algoritma tersebut mempunyai fokus berbeda, yaitu deteksi, segmentasi dan indentifikasi; terdiri dari DeepMask, SharpMask dan MultiPathNet. Saat ini FAIR sedang menggarap kodenya, dan mereka membuka aksesnya buat semua orang – karena lebih banyak bantuan artinya pengembangan bisa berjalan lebih cepat.

Tujuan akhir Facebook adalah agar AI mereka bisa melihat objek layaknya manusia. Ketika manusia dapat segera mengenal apa yang mereka lihat, komputer melihat pixel sebagai rentetan angka yang merupakan basis dari perbedaan warna. Dan lewat trio algoritma di atas, sistem jadi mampu mengklasifikasi benda, contohnya membedakan orang, kucing atau binatang lain. Selanjutnya, mesin bisa memisahkan objek utama dari elemen-elemen lain di gambar.

Prosesnya memang cukup rumit. Pertama-tama, DeepMask bertugas menciptakan ‘mask‘ atau layer tambahan. Teknik ini digunakan Facebook untuk menandai benda berdasarkan pola-pola unik, dan selanjutnya teknologi tersebut mencoba mencari tahu apakah pixel di sana merupakan bagian dari objek utama – semuanya diputuskan lewat deep learning.

Kemudian SharpMask akan menyempurnakan lapisan-lapisan mask tersebut dan fokus pada batas objek. Setelah itu, MultiPathNet baru dapat mengerjakan fungsinya, yakni mengenali benda berdasarkan masing-masing mask.

Menurut Facebook, teknologi AI mereka bisa membantu banyak bidang. Dengan kemampuan deskripsi, komputer dapat menjelaskan konten dari sebuah foto, misalnya berlatar belakang pantai, ada pohon, dan tiga orang yang sedang tersenyum. Buat sekarang, tim berisi 60 apakar AI itu masih terus menyempurnakan kinerjanya, sehingga bisa diterapkan ke ranah komersial hingga kesehatan.

Dan kita baru berbicara foto, dapat teknologi ini diimplementasikan ke video?

Via Daily Mail. Sumber: Facebook AI Research.