Senin, 20 Februari 2017

Tidak gudang gudang Data Anda belum




Bagaimana perusahaan-perusahaan keuangan menggabungkan ekosistem Hadoop ke analytics data besar mereka proyek tergantung pada arsitektur, menggunakan kasus dan ekonomi. Dengan gudang data didirikan dan vendor baru menggabungkan antarmuka struktur Query Language (SQL) untuk menjembatani perusahaan untuk Hadoop, tidak gudang gudang data Anda belum.

Hadoop adalah sumber terbuka platform untuk mengembangkan dan menggunakan didistribusikan, data-intensif aplikasi yang dapat menampung semakin meningkat volume, kecepatan dan berbagai data yang sering disebut sebagai data besar. Platform pengembangan dikelola oleh Apache Software Foundation dan didistribusikan di bawah lisensi open source  lagu terbaru.

Hadoop berharga untuk tiga tujuan utama: skala sistem, biaya efisiensi dan fleksibilitas. Pada intinya adalah Hadoop didistribusikan sistem File, yang berfungsi sebagai lapisan penyimpanan, dan MapReduce perangkat lunak dalam kerangka lapisan menghitung. Banyak proyek-proyek aplikasi lainnya telah dikembangkan untuk memperluas fungsi dan membuat Hadoop lebih mudah untuk bekerja dengan perusahaan. Kita akan mengambil melihat lebih mendalam Hadoop dalam posting mendatang.

Perbedaan terbesar antara gudang data perusahaan (EDW) dan Hadoop adalah bahwa yang terakhir beroperasi tanpa skema. Ini berarti daripada tidak seperti EDWs yang memerlukan data yang akan diformat setelah konsumsi, data dapat ditambahkan pada Hadoop dalam bentuk mentah dan ingat cepat untuk analisis.

Pindah ke arsitektur yang terdistribusi

Karena sebagian untuk evolusi Hadoop, Toko data terpusat EDW tradisional secara bertahap memberikan cara untuk arsitektur yang lebih didistribusikan. Hal ini leverage skala, efisiensi biaya dan fleksibilitas penanganan data terstruktur yang disediakan oleh Hadoop. Infrastruktur ekonomi Hadoop menarik: diukur berdasarkan biaya per terabyte, beban kerja yang sebanding dapat digunakan pada sebuah cluster server komoditi di Hadoop di sekitar sepersepuluh biaya penyimpanan bermerek. Minimum ini membuat Hadoop ideal untuk pengarsipan dengan memungkinkan perusahaan untuk offload jarang menggunakan data dari tingkat pertama mahal penyimpanan untuk tingkatan sekunder dan tersier.

Evolusi ini didistribusikan, modular arsitektur mewakili sebuah pengalihan strategis yang telah dipaksa pada EDW vendor. Gudang data tidak dibangun untuk menangani kompleksitas besar data beban kerja. Kelincahan yang menggabungkan Hadoop menyediakan memungkinkan perusahaan IT untuk memindahkan fokus dari beban mengelola beban kerja untuk membantu pengguna bisnis memperoleh nilai lebih dari data mereka.

Vendor utama EDW, termasuk Teradata, Oracle, dan IBM telah memperkenalkan peralatan untuk menghubungkan mereka database dan analisis perangkat lunak ke data yang tersimpan dalam Hadoop. Mereka juga bermitra dengan distributor Hadoop terkemuka Cloudera dan Hortonworks untuk memfasilitasi penyebaran aplikasi.

Tidak ada komentar:

Posting Komentar