Tag Archives: object recognition

Tanpa Bantuan Caption, AI Facebook Dapat Mencari Gambar Berdasarkan Objek di Dalamnya

Berkat perkembangan pesat teknologi kecerdasan buatan alias AI, April tahun kemarin Facebook berhasil meluncurkan fitur yang dapat membantu kaum tuna netra memahami isi Facebook, khususnya jutaan foto yang diunggah ke jejaring sosial tersebut. Kini, Facebook malah telah sukses memodifikasi platform AI yang sama untuk mempermudah pencarian gambar.

Apa yang Facebook lakukan sederhananya adalah melatih AI buatannya mengenali objek dalam gambar dengan memperlihatkan jutaan foto beserta caption-nya masing-masing. Pada akhirnya, AI yang dijuluki Lumos tersebut sanggup mengenali beragam objek dalam gambar tanpa harus ada caption maupun tag yang menyertai.

Semua ini kemudian diterjemahkan ke algoritma pencarian gambar di Facebook. Jadi semisal Anda mencari dengan kata kunci “Yosemite National Park”, Facebook pun sanggup menampilkan beberapa gambar yang relevan meski tidak ada caption-nya sama sekali.

Facebook juga memastikan kalau hasil pencarian gambarnya akan bervariasi dan bukan gambar yang sama tapi diambil dari sudut yang berbeda begitu saja. Singkat cerita, hasil pencarian gambar di Facebook akan lebih relevan sekaligus memuaskan dibanding sebelumnya.

Tujuan akhir yang ingin dicapai Facebook adalah mengaplikasikan teknologi serupa ke segudang video yang penggunanya unggah. Saat sudah tiba di titik itu, kita pada dasarnya dapat menemukan momen yang tepat dari suatu video hanya dengan bermodalkan kata kunci saja. Namun untuk sekarang, fitur pencarian gambar yang lebih istimewa ini baru tersedia untuk pengguna di AS saja.

Sumber: TechCrunch dan Facebook. Gambar header: Pixabay.

Google Tunjukkan Kebolehan AI dalam Mendeskripsikan Foto dengan Akurasi 94 Persen

Layanan macam Google Photos populer berkat integrasi AI dengan kemampuan mengenali objek dalam foto, yang kemudian diterjemahkan menjadi fitur tagging otomatis. Ini baru satu manfaat yang bisa diambil dari teknologi image recognition, masih ada kegunaan lain seperti misalnya memberikan deskripsi lisan untuk kaum tuna netra.

Seberapa akurat sebenarnya AI bisa mengenali objek dalam gambar? Berdasarkan pengakuan tim Google Research, akurasinya kini sudah mencapai angka 93,9 persen. Menariknya, semua ini bisa dinikmati oleh semua pihak developer, bukan cuma Google saja.

Yup, Google terus menyempurnakan teknologi di balik mesin pembelajaran open-source-nya, TensorFlow, kali ini dengan algoritma “Show and Tell” yang memungkinkan developer untuk melatih AI dalam mengenali dan mengidentifikasi beragam objek dalam gambar.

Setelah dilatih, sistem dapat mengidentifikasi dan mendeskripsikan objek dalam foto yang belum pernah dilihat sebelumnya / Google Research
Setelah dilatih, sistem dapat mengidentifikasi dan mendeskripsikan objek dalam foto yang belum pernah dilihat sebelumnya / Google Research

Setelah dilatih dengan tiga foto anjing yang berbeda dan deskripsinya masing-masing misalnya, sistem ternyata sanggup mengidentifikasi dan mendeskripsikan foto yang belum pernah dilihatnya secara akurat. Hal ini sekaligus menjadi bukti bahwa sistem yang baru dapat memahami objek sekaligus konteks secara lebih mendalam.

Baru dua tahun yang lalu, AI Google hanya bisa mengidentifikasi objek dengan akurasi 89,6 persen. Sekarang, tidak cuma akurasinya yang bertambah, tetapi juga kemampuannya mengembangkan informasi yang sudah didapat – hasil latihannya bersama manusia – untuk mendeskripsikan foto yang benar-benar baru, lalu mengekspresikannya secara lisan dengan cara yang lebih alami.

Sumber: Engadget dan Google Research.

Facebook Kembangkan Teknologi untuk Mendeskripsikan Gambar Secara Otomatis pada Kaum Tuna Netra

Salah satu wujud pengembangan teknologi kecerdasan buatan (AI) adalah kemampuan untuk mengenali berbagai objek dari sebuah gambar. Facebook sebagai salah satu perusahaan yang percaya akan pentingnya AI dalam kemajuan teknologi baru-baru ini memperkenalkan sebuah fitur anyar yang berfungsi untuk membantu kaum tuna netra memahami gambar-gambar yang diunggah ke jejaring sosial terbesar itu.

Fitur bernama Automatic Alternative Text ini pada dasarnya dapat mendeskripsikan sebuah foto yang diunggah menggunakan teknologi pengenal gambar. Dengan begitu, pengguna yang memiliki gangguan penglihatan bisa mendengar deskripsi objek apa saja yang terdapat dalam gambar.

Sebelum ini, fitur screen reader yang tersedia hanya akan membacakan siapa nama orang yang membagikan foto tersebut. Namun berkat Automatic Alternative Text, kini pengguna bisa mendengarkan deskripsi yang lebih lengkap, seperti misalnya “gambar mungkin mencakup tiga orang, tersenyum, di luar ruangan”.

Teknologi pengenal gambar yang diciptakan Facebook ini diklaim telah dilatih menggunakan jutaan contoh gambar guna memberikan deskripsi seakurat mungkin. Dengan adanya fitur ini, harapannya kaum tuna netra bisa mendapat pengalaman yang setara saat tengah mengakses Facebook.

Baru minggu kemarin, Twitter sempat meluncurkan fitur serupa. Namun dalam kasus Twitter, mereka tidak memanfaatkan kecerdasan buatan maupun teknologi pengenal gambar. Sang pengunggah foto-lah yang diminta untuk memberikan deskripsi teks pada gambar, agar kemudian pengguna dengan gangguan penglihatan bisa mendengarkan deskripsi lengkapnya.

Dalam waktu dekat, fitur Automatic Alternative Text ini akan dirilis untuk iOS dan dalam bahasa Inggris. Namun Facebook sudah berencana menghadirkan fitur yang sama untuk bahasa maupun platform lain ke depannya.

Sumber: Facebook.

Poligami ala Augmented Reality

Guest post ini ditulis oleh Batista Harahap, seorang pencinta dunia IT sejak program “Hello World” pertamanya saat generasi 486DX, sangat antusias meng-“Hello World”-kan Indonesia dengan teknologi! Di Guest post ini Batista akan mengulas mengenai persilangan antara teknologi Augemented Reality dengan teknologi lain, pengaplikasiannya di dunia nyata hampir tidak terbatas. Enjoy!

Akhir-akhir ini saya yakin sudah sering mendengar istilah Augmented Reality (Realitas Tertambah). Jika ditelusuri perkembangannya, aplikasi AR sudah ada jauh sejak generasi HP dengan kamera terintegrasi.

Continue reading Poligami ala Augmented Reality