Apa Tepatnya 'Data Besar'?

Dan Mengapa Ini Kesepakatan Besar?

'Big data' adalah ilmu baru untuk memahami dan memprediksi perilaku manusia dengan mempelajari volume besar data yang tidak terstruktur. Data besar juga dikenal sebagai 'analisis prediktif'.

Menganalisis posting Twitter, feed Facebook, pencarian eBay, pelacak GPS, dan mesin ATM adalah beberapa contoh data besar. Mempelajari video keamanan, data lalu lintas, pola cuaca, kedatangan penerbangan, menara telepon seluler, dan pelacak laju jantung adalah bentuk lain. Data besar adalah sains baru yang berantakan yang berubah setiap minggu, dan hanya beberapa ahli yang memahaminya.

Apa sajakah Contoh Data Besar dalam Kehidupan Reguler?

screenshot http://project.wnyc.org/transit-time

Sementara sebagian besar proyek data besar sangat tidak jelas, ada contoh sukses dari big data yang mempengaruhi kehidupan sehari-hari individu, perusahaan, dan pemerintah:

Memprediksi wabah virus: dengan mempelajari data sosio-politik, data cuaca dan iklim, dan data rumah sakit / klinis, para ilmuwan ini sekarang memprediksi wabah demam dengue dengan pemberitahuan 4 minggu sebelumnya.

Homicide Watch: ini proyek data besar profil korban pembunuhan, tersangka, dan penjahat di Washington, DC. Keduanya sebagai cara untuk menghormati almarhum dan sebagai sumber kesadaran bagi orang-orang, proyek data besar ini sangat menarik.

Perencanaan Perjalanan Transit, NYC: programmer radio WNYC Steve Melendez menggabungkan jadwal kereta bawah tanah online dengan perangkat lunak perjalanan. Karyanya memungkinkan New York mengklik lokasi mereka di peta, dan prediksi waktu perjalanan untuk kereta api dan kereta bawah tanah akan muncul.

Xerox mengurangi kehilangan tenaga kerja mereka: pekerjaan call center melelahkan secara emosional. Xerox telah mempelajari rim data dengan bantuan analis profesional, dan sekarang mereka dapat memprediksi karyawan pusat panggilan mana yang cenderung tetap bersama perusahaan terlama.

Mendukung kontra-terorisme: dengan mempelajari media sosial, catatan keuangan, reservasi penerbangan, dan data keamanan, penegak hukum dapat memprediksi dan menemukan para tersangka teroris sebelum mereka melakukan perbuatan jahat mereka.

Menyesuaikan pemasaran merek berdasarkan ulasan media sosial : orang-orang secara blak-blakan dan cepat berbagi pemikiran online mereka di pub, restoran, atau klub kebugaran. Adalah mungkin untuk mempelajari jutaan posting media sosial ini dan memberikan umpan balik kepada perusahaan tentang apa yang orang pikirkan tentang layanan mereka.

Siapa yang Menggunakan Data Besar? Apa yang Mereka Lakukan Dengan Ini?

Banyak perusahaan monolitik menggunakan data besar untuk menyesuaikan penawaran dan harga mereka untuk memaksimalkan kepuasan pelanggan.

Mengapa Data Besar Begitu Besar?

4 hal membuat data besar menjadi signifikan:

1. Data sangat besar. Ini tidak akan muat pada satu hard drive , apalagi USB stick . Volume data jauh melebihi apa yang dapat dipahami oleh pikiran manusia (pikirkan satu miliar miliar megabyte, dan kemudian dikalikan dengan lebih banyak miliar).

2. Datanya berantakan dan tidak terstruktur. 50% hingga 80% dari pekerjaan data besar adalah mengubah dan membersihkan informasi sehingga dapat dicari dan diurutkan. Hanya beberapa ribu ahli di planet kita yang sepenuhnya tahu bagaimana melakukan pembersihan data ini. Para ahli ini juga membutuhkan alat yang sangat khusus, seperti HPE dan Hadoop, untuk melakukan kerajinan mereka. Mungkin dalam 10 tahun, ahli data besar akan menjadi sepeser pun selusin, tetapi untuk sekarang, mereka adalah spesies analis yang sangat langka dan pekerjaan mereka masih sangat tidak jelas dan membosankan.

3. Data telah menjadi komoditas ** yang dapat dijual dan dibeli. Pasar data ada di mana perusahaan dan individu dapat membeli terabyte media sosial dan data lainnya. Sebagian besar datanya berbasis cloud, karena terlalu besar untuk dimasukkan ke dalam satu hard disk. Membeli data biasanya melibatkan biaya berlangganan tempat Anda menyambungkan ke tambak server cloud.

** Para pemimpin alat dan ide data besar adalah Amazon, Google, Facebook, dan Yahoo. Karena perusahaan-perusahaan ini melayani begitu banyak jutaan orang dengan layanan online mereka, masuk akal bahwa mereka akan menjadi titik pengumpulan dan para visioner di balik analitik data besar.

4. Kemungkinan data besar tidak terbatas. Mungkin dokter suatu hari akan memprediksi serangan jantung dan stroke selama beberapa minggu sebelum terjadi. Kecelakaan pesawat dan mobil dapat dikurangi dengan analisis prediksi data mekanis dan lalu lintas dan pola cuaca. Kencan online dapat ditingkatkan dengan memiliki prediktor data besar tentang kepribadian yang kompatibel untuk Anda. Musisi mungkin mendapatkan wawasan tentang komposisi musik apa yang paling menyenangkan untuk mengubah selera audiens target. Ahli gizi mungkin dapat memprediksi kombinasi makanan yang dibeli di toko yang akan memperparah atau membantu kondisi medis seseorang. Permukaannya hanya tergores, dan penemuan dalam data besar terjadi setiap minggu.

Data Besar Itu Berantakan

Monty Rakusen / Getty

Data besar adalah analisis prediktif: konversi data tak terstruktur besar menjadi sesuatu yang dapat ditelusuri dan diurutkan. Ini adalah ruang yang berantakan dan kacau yang membutuhkan jenis pengetahuan dan kesabaran khusus.

Ambil contoh layanan pengiriman UPS monolitik. Programer pada data studi UPS dari GPS dan smartphone pengemudi mereka untuk menganalisis cara yang paling efisien untuk beradaptasi dengan kemacetan lalu lintas. Data GPS dan smartphone ini sangat besar, dan tidak secara otomatis siap untuk analisis. Data ini mengalir dari berbagai GPS dan database peta, melalui perangkat perangkat keras smartphone yang berbeda. Analis UPS telah menghabiskan waktu berbulan-bulan untuk mengkonversi semua data ke dalam format yang dapat dengan mudah dicari dan diurutkan. Namun, upaya itu sangat berharga. Hari ini, UPS telah menyimpan lebih dari 8 juta galon bahan bakar sejak mereka mulai menggunakan analitik data besar ini.

Karena data besar itu berantakan dan membutuhkan begitu banyak upaya untuk membersihkan dan mempersiapkan penggunaan, para ilmuwan data telah dijuluki 'petugas kebersihan data' untuk semua pekerjaan yang membosankan yang mereka lakukan.

Namun, ilmu data besar dan analisis prediktif meningkat setiap minggu. Harapkan data besar menjadi mudah diakses oleh semua orang pada tahun 2025.

Bukankah Big Data merupakan Ancaman Intrusif terhadap Privasi?

Feingersh / Getty

Ya, jika undang-undang dan pertahanan privasi individu kami tidak dikelola dengan hati-hati, maka data besar mengganggu privasi pribadi. Seperti berdiri, Google dan YouTube dan Facebook sudah melacak kebiasaan online harian Anda . Ponsel cerdas dan kehidupan komputasi Anda meninggalkan jejak digital setiap hari, dan perusahaan-perusahaan canggih mempelajari jejak kaki tersebut.

Hukum di sekitar data besar sedang berkembang. Privasi adalah keadaan bahwa Anda sekarang harus mengambil tanggung jawab pribadi, karena Anda tidak lagi dapat mengharapkannya sebagai hak default.

Apa yang dapat Anda lakukan untuk melindungi privasi Anda:

Langkah tunggal terbesar yang dapat Anda ambil adalah untuk menyelundupkan kebiasaan harian Anda menggunakan koneksi jaringan VPN . Layanan VPN akan mengacak sinyal Anda sehingga identitas dan lokasi Anda setidaknya sebagian disamarkan dari pelacak. Ini tidak akan membuat Anda 100% anonim, tetapi VPN secara substansial akan mengurangi seberapa banyak dunia dapat mengamati kebiasaan online Anda.

Di mana saya dapat mempelajari lebih lanjut tentang Big Data?

Monty Raskusen / Getty

Data besar adalah hal yang menarik bagi orang dengan pikiran analitik dan kecintaan pada teknologi. Jika itu Anda, maka pasti kunjungi halaman ini proyek data besar yang menarik.