Sunday, June 12, 2016

Kemunculan 3 Alat Analisis Data Open Source

Kemunculan 3 Alat Analisis Data di Open Source
Analisis data sangatlah di butuhkan ketika terdapat sekumpulan data, yaitu dengan mengolah data menjadi informasi sehingga karakteristik data bisa difahami dan bermanfaat untuk mengatasi permasalahan khususnya ketika dilakukanya penelitian yang akan melibatkan data. Sementara Internet of Things atau yang biasa di kenal dengan singkatan IoT merupakan konsep dengan tujuan untuk memperluas manfaat dari internet yang digunakan sebagai alat untuk berbagi data dan lain sebagainya. Termasuk menyambungkan benda hidup ke jaringan dengan mengunakan sensor.

Di dunia analisis, internet bisa di gunakan untuk streaming analisis data yang di perlukan untuk meningkatkan penemuan obat, dan data menyediakan data mentah yang bisa di gunakan ketika ada penelitian yang membutuhkan data.
Sementara Apache Spark menerima banyak berita utama dalam soal analisis data, diberi miliaran dolar dari IBM dan perusahaan lain,  untuk pembangunan proyek open source. Selain itu proyek open source yang tanpa imbalan juga meningkat. Berikut tiga alat analisis data yang muncul:

Grappa
Grappa merupakan organisasi besar dan kecil yang bekerja untuk menyisihkan wawasan yang bermanfaat atau berarti dari data streaming dan banyak dari mereka bekerja dengan data yang telah di olah pada sistem berkas (Cluster) dan increasly, pada oerangkat hardware komoditas. yang menempatkan penggunaan premium pada pendekatan data-centric yang dapat meningkatkan kinerja dan fungsi dari alat - alat seperti MapReduce dan even Spark. Grappa termasuk dalam proyek open source, yang sekala aplikasi data-intensif pada kelompok komoditas dan menawarkan jenis baru abtraki yang bisa mengalahkan distribusi memori bersama (DSM) sistem secara klasik.
Untuk dapat tau lebih lanjut tentang source code dari Grappa bisa di lihat di sini.

Apache Drill

Apache Drill mempunyai beberapa perbedaan dalam penggunaan  ruang Big Data dimana perusahaan seperti MapR pernah menggunakanya di dalam pendistribusian Hadoop. Itu merupakan level terbaik dalam projek pengembangan apache dan sedang memanfaatkan bersama dengan Apache Spark di banyak skenario streaming data. Misalnya saja pada pertemuaan New York Apache Drill pada januari tahun ini, MapR seorang insinyur sistem menunjukan bagaimana Apache Spark dan Drill dapat digunakan bersama - sama dalam kasuk penggunaan yang melibatkan capture paket san mendekati real-tile query dan penelusuran.

Drill sangatlah penting dalam aplikasi streaming data, karena dia mendistribusikan schema-free SQL engine. DevOps dan IT staff bisa menggunakan Drill secara interaktif mengeksplorasi data dalam hasdoop dan database NoSQL lainya, sperti HBase dan MongoDB.  TIdak perlu otomatis untuk dapat memanfaatkan struktur yang tertanam dalam data. Hal ini dapat meminimalkan penggunaan disk kecuali dibutuhkan untuk menyelesaikan query.

Apache Kafka

Apache Kafka datang dengan kelebihan yang berbeda. Proyek ini memiliki keunggulan untuk melacak data dengan waktu real-time dan juga menyediakan unified, high-throughput, low-latency processing untuk rel-time data. Confluen dan organisasi lainya juga telah menghasilkan alat khusus untuk menggunakan Kafka dengan data stream.

Awalnya, Apache Kafka dikembangkan oleh LinkedIn, dan kemudian di buat open source pada tahun 2011. Para engginer yang menciptakan Kafka di LinkedIn juga mencipktakan Confluen, yang berfokus pada Kafla. Universitas Confluen juga menawarkan kursus pelatihan untuk para pengembang Kafka, dan untuk operator / administrator untuk kedua progam tersebut.





  

Load disqus comments

0 komentar