Di Antara Data Resmi Statistik dan Teknologi Big Data

Kepopuleran teknologi big data telah menanjak beriringan dengan volume data yang terus meningkat karena layanan berbasis online juga terus bermunculan. Kemudahan yang ditawakran dalam mengumpulkan data yang sangat besar, meski belum terstruktur, dan bisa diolah untuk membantu pengambilan keputusan bisnis juga berperan dalam meningkatkan popularitasnya. Namun, bagaimana dengan metode pengumpulan data tradisional yang diadopsi oleh badan resmi statistik seperti BPS. Apakah teknologi big data dapat menggantikannya?

Pertanyaan tersebutlah yang coba dijawab oleh Associate Professor (Lektor Kepala) STIS BPS Setia Pramana dalam gelaran Konferensi Big Data Indonesia yang digelar idBigData selama dua hari (7-8 Desember 2016) di Auditorium BPPT,  Jakarta.

“Mungkin tidak, kita mengganti official statistics dengan big data? Data-data [big data] itu kan sudah besar sekali, mungkin tidak untuk mendapatkan informasi-informasi yang dibutuhkan untuk pemerintah untuk mengambil kebijakan? Tidak perlu ada official statistics lagi, tidak perlu ada sensus , karena itu mahal dan menggunakan APBN,” ujar Setia.

Sebelum membahas lebih jauh, Setia memberikan penjabaran perbedaan antara official statistics dan big data dalam proses pengumpulan data seperti dalam table berikut:

Official Statistics Big Data
Structural and Planned Product Largely unstructured / unfiltered data “Data exhaust”, i.e., by product of digital products (transactions, web, social media, sensors)
Methodological and clear concept Poor analytics
Regulated Unregulated
Macro-level, but typically based on high volume primary data Micro-level, huge volume with high velocity (or frequency) and variety
High cost Generally little or no-cost
Centralized; point in time Distributed; real-time

Setia mengatakan, “Melihat kedua perbandingan tersebut, ada beberapa pendekatan yang memungkinkan bahwa official statistics tersebut tidak tergantikan [oleh big data] karena ada standarnya,  tetapi informasi dari official statistic bisa disandingkan atau dikawankan dengan informasi dari big data. Jadi, big data itu bisa menjadi complement dari official statistics.”

Dalam hal perannya sebagai pelengkap, dijelaskan oleh Setia lebih jauh, big data bisa memberikan variabel untuk membantu BPS mengelompokkan yang lebih baik untuk survei sampel. Selain itu juga bisa mambatu meningkatkan perkiraan survei, membantu untuk mengimbangi data non responses seperti data perusahaan, membantu mengecek perkiraan BPS, membantu mempercepat hasil analisis sehingga bisa mempercepat perilisan data, dan membantu untuk meningkatkan dan memberikan perkiraan data yang lebih kecil.

Perbandingan data BPS dan Twitter untuk pola pergerakan pengguna commuter line / DailySocial
Perbandingan data BPS dan Twitter untuk pola pergerakan pengguna commuter line / DailySocial

Sebagi upaya untuk pembuktian konsep ini, BPS sendiri telah melakukan perbandingan data survei mereka dengan data yang diperoleh dari layanan online. Contohnya, data pergerakan pengguna commuter line yang disurvei BPS dengan data yang diperoleh dari Twitter. Hasilnya, memang terlihat ada kemiripan pola dan juga tren.

“Memang ada kemiripan pola dan tren yang terlihat. […] Namun, big data ini bukan pengganti, tetapi sifatnya lebih ke complementing [dari official statistics] dan mengecek juga melengkapi bila ada kekurangan. […] Ada beberapa yang memang bisa di – replace, tetapi itu masih harus didiskusikan. [Untuk saat ini] Masih banyak juga hal-hal yang perlu di eksplorasi  mana yang bisa menggunakan big data, mana yang tidak. Kemudian, informasi tersebut harus ada kontribusi dari para stakeholders terkait,” tandasnya.


Disclosure: DailySocial adalah media partner Konferensi Big Data Indonesia 2016