Apa itu Big Data? Big data adalah istilah khusus yang digunakan untuk data yang melebihi kapasitas pemrosesan database konvensional karena berjumlah terlalu besar, bergerak terlalu cepat, dan tidak sesuai dengan kemampuan struktural dari arsitektur database tradisional. Sehingga dilakukan suatu proses dengan sistem terintegrasi yang mampu menangani Big data yang disebut big data analytics.
A. Karakteristik Big Data
Big data mempunyai 4 karakteristik yang menyebabkan database konvensional tidak mampu menangani data tersebut. 4 karakteristik ini disebut dengan "four Vs".
-
Volume | Ukuran Data
Berbeda dengan data biasa yang berukuran kilobyte (1kb = 1.000byte) hingga gigabyte (1gb = 1.000.000kb), big data berukuran terabyte (1tb = 1.000gb) hingga (1pt = 1.000tb) bahkan lebih.
-
Velocity | Kecepatan Data
Big data mempunyai pertumbuhan data (data velocity) yang sangat cepat. Data velocity adalah pertumbuhan ukuran data tiap detiknya. Big data mempunyai kecepatan data berkisaran antara 30kb hingga 30gb tiap detiknya. Dengan kecepatan data yang tinggi, teknologi yang digunakan harus mempunyai kecepatan hardware dengan algoritma yang optimal untuk membuat keputusan secara real time.
-
Variety | Keanekaragaman Struktur Data
Big data mempunyai berbagai struktur data yaitu structured data, semi-structured data, dan unstructured data.
- Structured data adalah data yang dibuat, diproses, dan dimanipulasi dengan menggunakan database konvensional (traditional relational database management system). Misalnya data jumlah pengunjung suatu website setiap detiknya.
- Semi-structured data adalah data yang tidak sesuai dengan arsitektur database management system data terstruktur, namun tetap memiliki tag-tag yang dapat digunakan untuk menentukan karakteristik dari variabel-variabel data tersebut. Misalnya file log, file XML, atau JSON.
- Unstructured data adalah data yang benar-benar tidak terstruktur, yang umumnya datang dari aktivitas manusia sebagai pengguna sistem. Misalnya data dokumen word dan email.
-
Value | Nilai Data
Big data mempunyai nilai data yang rendah terhadap kuantitasnya. Data engineering akan melakukan penataan data mentah sehingga data tersebut lebih bernilai. Kemudian data yang sudah ditata, dapat dilakukan analisis oleh data scientist.
B. Manfaat Teknologi Big Data
Teknologi big data dimanfaatkan diberbagai sektor industri. Teknologi big data adalah keseluruhan teknologi yang dapat menangani Big Data. Berikut penggunaan big data berdasarkan sumber lalulintas big data terbanyak,
-
Sosial Media
Data pengguna sosial media seperti Facebook dan Twitter mempunyai pertumbuhan data yang paling cepat. Teknologi big data merupakan hal yang sangat penting bagi perkembangan sosial media.
-
Transaksi Finansial
Perkembangan e-commerce yang sangat pesat menyebabkan data transaksi finansial antar bank semakin besar. Selain itu pertumbuhan data transaksi finansial memerlukan resource yang lebih besar dari pertumbuhan data sosial media karena harus menggunakan sistem enkripsi berlapis-lapis.
-
Data Publik
Walaupun pertumbuhannya lebih lambat dari data transaksi finansial, data publik mempunyai ukuran dan keanekaragaman yang sangat besar.
-
Data Sensor
Data sensor adalah data yang diolah oleh suatu perangkat berupa input dan output. Data sensor banyak digunakan di bidang robotika dan astronomi.
-
Data Perusahaan
Banyak perusahaan mempunyai data intern yang berjumlah besar, misalnya data pelanggan, data lisensi, data penjualan, dan lain-lain
C. Big Data Analytics
Big data analytics adalah keseluruhan proses dari mengumpulkan, merapikan, menganalisis big data sehingga diperoleh informasi yang bernilai guna untuk membantu penentuan keputusan atau keberlangsungan suatu sistem. Hal ini dilakukan dengan menggunakan teknologi big data seperti Pig, Hadoop dan Hive.
Baca juga tutorial lainnya: Daftar Isi Data Science
Sekian artikel mengenai Apa itu Big Data dan Big Data Analytics. Terima kasih…