Big Data dan Prospeknya Terhadap Privasi

What is privacy?

Pada Oktober 2014, Neil M. Richards (Professor of Law, Washington University) dan Joathan H. King menulis paper berjudul “Big Data and the Future For Privacy” [link]. Saya akan coba merangkum isi paper yang penuh dengan petunjuk dan saran ini, namun saya sarankan untuk membaca langsung secara lengkap paper tersebut untuk mendapatkan informasi yang lebih detil dan akurat.

Selama ini, “privasi” diartikan sebagai tindakan untuk mengamankan rahasia individu. Tapi realitanya, privasi merupakan satu kondisi di antara “sama sekali rahasia” dan “terbuka untuk semua”. Karena itu, privasi lebih tepat diartikan sebagai aturan perlakuan atau tata-kelola informasi yang menentukan keberadaan informasi individu di antara dua kondisi tersebut. Dengan kata lain, privasi dapat dilihat sebagai aturan tata-kelola informasi individu – information governance. Dengan mengubah cara melihat seperti ini, kita bisa lebih memiliki ketegasan tentang keberadaan aturan yang mengantisipasi penggunaan sekunder dari big-data.

Privacy is not merely about keeping secrets, but about the rules we use to regulate information, which is and always has been in intermediate states between totally secret and known to all.

Untuk mempertimbangkan keberadaan aturan yang mengatur pengelolaan informasi individu, kita perlu menurunkan arahnya dari nilainya dalam masyarakat. Misanya tentang “kebebasan berbicara”, tujuannya bukan untuk membebaskan setiap orang untuk berbicara, namun untuk menegakkan “demokrasi” dan “kebenaran”. Sama halnya dengan privasi, tujuannya bukan untuk melindungi privasi itu sendiri, namun untuk menjaga 4 hal yaitu: (1) identitas (identity), (2) keadilan (equality), (3) keamanan (security), dan (4) kepercayaan (trust). Mari kita lihat satu per satu.

Menjaga identitas – Dalam konteks pemberian rekomendasi berdasarkan analisis perilaku di masa lalu atau kesukaan, perlu dicegah jangan sampai rekomendasi yang diberikan kemudian membatasi ruang gerak maupun pencarian pengetahuan dan informasi.

Menjaga keadilan – Dengan dilakukannya analisis terhadap big-data, perlu dicegah jangan sampai pengguna menjadi terbatas ruang geraknya. Dengan algoritma yang digunakan untuk mengelompokkan individu berdasarkan karakteristik yang dimilikinya, ada kemungkinan seseorang akan menerima perlakukan diskriminasi atau tidak bisa menerima informasi karena dianggap tidak cocok. Dengan kata lain, perlu dibedakan antara pengelompokan (sorting) dengan diksriminasi (discrimination).

Menjaga keamanan – Dengan kemudahan berpindahnya data dari satu tangan ke tangan yang lain, perlu dicegah terjadinya rekayasa data dan perlu terjaganya kualitas data. Untuk itu perlu adanya suatu mekanisme untuk menjaga integritas data dan mencegah terjadinya rekayasa informasi individu. Karena itu, aturan tata-kelola informasi individu tidak dilepaskan dari permasalahan keamanan informasi.

Kepercayaan – Privasi akan mendorong lahirnya kepercayaan. Antara pemberi informasi dengan pengelola dan pemanfaat informasi: makin besar keinginan pihak pertama untuk menjaga privasi maka makin besar cost yang akan dikeluarkan (atau makin berkurang manfaat yang akan diperoleh) oleh pihak kedua – atau yang disebut dengan hubungan cost vs. privacy. Namun jika individu bisa memperoleh kepercayaan dari pengelola informasi bahwa informasi yang diberikan tidak akan disalahgunakan, maka akan lebih banyak dan lebih akurat data yang akan diterima oleh pengelola informasi sehingga dapat menjadikannya lebih bermanfaat. Kemudian hal ini akan mendorong lahirnya kepercayaan pada tingkat yang lebih tinggi.

Jadi, bagaimana aturan tata-kelola privasi seperti ini bisa direalisasikan? Penulis menyampaikan, sambil mencari pendekatan teknologi berbasis information governance, perlunya diutamakan etika dalam penggunaan big-data. Apa pun bentuknya, pengumpulan data, pengolahan data, ataupun keputusan yang diambil berdasarkan output pengolahan, yang dapat memberi ancaman terhadap identitas, keadilan, keamanan, integritas data, dan kepercayaan, harus diatur (regulated) atau kalau perlu dilarang (forbidden). Namun perlu diakui bahwa regulasi formal yang berlebihan dapat memberi dampak pada terbatasnya inovasi yang bisa dilakukan. Untuk mengantisipasi hal itu, bentuk lain dari regulasi formal yang lebih “lembut” (soft) bisa diterapan untuk menutup celah pada regulasi formal. Salah satu contohnya adalah aturan-aturan terkait privasi yang dikaji dan disusun oleh vendor besar seperti Microsoft, Apple, Google, bahkan Facebook.

We have argued that particularly in an age of big data, privacy should not be understood as a matter of keeping secrets, but rather a system of rules governing the ethical collection use, and disclosure of personal information.

Sejalan dengan berkembangnya trend big-data, sesaat, seakan-akan membuat privasi tidak lagi memiliki tempat atau menjadi hal yang menjadi hambatan – namun itu salah persepsi. Dengan kita memahami bahwa privasi adalah aturan yang mengendalikan (govern) alur informasi berdasarkan nilai dan norma kita, dengan sistem aturan privasi yang beretika akan memberikan manfaat pada kita, sebagai komponen yang penting di masa yang akan datang.

From the movie of Back To The Future


Disadur dan dirangkum dari paper berjudul “Big Data and the Future For Privacy” oleh Neil M. Richards dan Jonathan H. King [link]. Sumber inspirasi: [link]. Sumber gambar: [link] dan [link].

Mengapa ilmuwan data disebut profesi paling seksi?

Thomas H. Davenport dan D.J. Patil dalam salah satu artikelnya di HBR (Harvard Business Review) menyebut data scientist (ilmuwan data) sebagai profesi paling seksi pada abad ke-21. Kalau “seksi” diartikan sebagai kurang atau sulit ditemukannya orang yang berkualitas, kenyataannya banyak ahli matematika, ahli statistik, ahli komputer, tapi mengapa masih disebut seksi?

Steer
The sensing unit that technician Jeff Thomas is attaching records motion and other data so scientists can determine how much time this steer spends grazing each day.

Davenport mendefinisikan ilmuwan data sebagai super star yang memiliki kemampuan untuk mempelajari atau melatih diri atau berfikir secara matematis yang tinggi, memiliki pengalaman menulis program, serta memiliki rasa ketertarikan pada suatu bidang khusus dalam pekerjaannya. Kalau dilihat dari definisi ini, memang banyak ahli matematik, banyak juga ahli komputer, dan tidak sedikit juga ahli matematik yang juga ahli memanfaatkan komputer dalam perhitungan matematikanya. Namun bagaimana dengan keahlian mereka di bidang yang lain, seperti ekonomi, kependudukan, biologi, atau astronomi? Atau sebaliknya. Misalnya mereka yang ahli di bidang ekonomi, sedikit yang juga ahli matematika dan bisa menulis program. Mereka yang ahli di bidang kependudukan, biologi, astronomi, dan sebagainya, mereka belum bisa secara maksimal menjelaskan fenomena yang ada tanpa bantuan ilmu matematik atau bantuan komputer.

There simply aren’t a lot of people with their combination of scientific background and computational and analytical skills. – Thomas H. Davenport & D.J. Patil

Davenport juga menjelaskan bahwa yang dituntut dari seorang ilmuwan data adalah tidak hanya dapat memberikan nasehat (advice) saja pada para pengambil keputusan (decision maker) tetapi juga harus bisa memberikan solusi dari hasil analisis yang telah dilakukan.

Profesor Hiroshi Maruyama dari Institute of Statistical Mathematics, dalam salah satu presentasinya yang bertema “Big Data: The Light and Shadow” (in Japanese: ビッグデータ:光と影) menyampaikan bahwa, di Jepang, seorang ilmuwan data pada umumnya bekerja dalam suatu bentuk layanan (service). Yang dimaksud layanan di sini, bisa dari pihak luar (outsourcing), bisa juga dari dalam dari salah satu unit dalam suatu organisasi yang sama. Berbeda dengan Jepang, Amerika, khususnya di Silicon Valley, seorang ilmuwan data adalah juga pengembang (developer) produk data (baca: produk dari hasil analisis data).

Kaoru Kawamoto dari Osaka Gas, peraih Data Scientist of The Year 2013 yang diberikan oleh Nikkei IT Pro, dalam buku yang ditulisnya berjudul “Strength of Analysis which Change the Company” (in Japanese: 会社を変える分析の力) menyampaikan bahwa yang dibutuhkan oleh seorang ilmuwan data tidak hanya kemampuan untuk menganalisis saja tetapi juga kemampuan untuk mengidentifikasi masalah serta kemampuan untuk menerapkan hasil analisis dalam bidangnya. Untuk itu, perlu betul-betul memahami bisnis (bidangnya) dan memiliki kemampuan berkomunikasi.

Terakhir pesan dari Kaoru Yamamoto yang ditulis dalam suatu dialog (in Japanese).

Pada masa di mana big data banyak dibicarakan sekarang ini, banyak orang tertarik untuk mempelajari atau mendalami analisis data. Namun akibatnya, timbul kecenderungan yang menganggap analisis data adalah segalanya. Kalau hanya sekedar relasi angka, bisa dengan mudah dilakukan dengan bantuan program atau software. Namun yang penting adalah, bagaimana penerapannya dalam bisnis atau bidangnya masing-masing. Tidak hanya konsep, tapi secara konkrit bisa memberikan solusi atau arahan agar bisnisnya bisa lebih baik atau bisa memberikan solusi pada suatu permasalahan.