Apache Hadoop adalah kerangka framework perangkat lunak open-source yang dirancang untuk memanfaatkan jaringan komputer berbasis komoditas dalam menangani permasalahan yang melibatkan jumlah data dan komputasi dalam skala besar. Terinspirasi oleh konsep MapReduce dan Google File System (GFS) dari Google, Hadoop menyediakan kerangka kerja perangkat lunak untuk penyimpanan dan pemrosesan data terdistribusi menggunakan model pemrograman MapReduce.[1]

Seperti pendekatan yang digunakan di Google, Hadoop dirancang untuk berjalan pada klaster komputer dengan perangkat keras standar (commodity hardware), meskipun juga dapat digunakan pada klaster berperforma tinggi. Setiap modul dalam Hadoop dikembangkan dengan asumsi dasar bahwa kegagalan perangkat keras adalah kejadian yang umum terjadi dan harus dapat ditangani secara otomatis oleh framework ini.

Referensi

sunting
  1. ^ Sakr, Sherif; Zomaya, Albert Y., ed. (2019). Encyclopedia of Big Data Technologies (dalam bahasa Inggris). Cham: Springer International Publishing. doi:10.1007/978-3-319-77525-8. ISBN 978-3-319-77524-1.

📚 Artikel Terkait di Wikipedia

Apache Flink

terbuka (open-source) di bawah lisensi perangkat lunak Apache. Pada tahun yang sama, proyek Apache Hadoop (dari sebuah implementasi aplikasi terbuka (open-source)

Apache Mesos

menggunakan Mesos untuk menjalankan sistem pemrosesan data seperti Apache Hadoop dan Apache Spark. Situs Website eBay menyatakan pada bulan April 2014 bahwa

Apache SystemDS

Apache SystemDS (sebelumnya dikenal sebagai Apache SystemML) adalah sistem pemelajaran mesin (ML) sumber terbuka yang dirancang untuk mendukung seluruh

Komputasi awan

menyediakan kapasitas data yang besar. Kapasitas ini didukung oleh Apache Hadoop. Aplikasi Mobile Microsoft Azure memberikan kemudahan dalam pembuatan

Graph database

platform Apache Hama Diarsipkan 2012-06-18 di Wayback Machine. - a pure BSP(Bulk Synchronous Parallel) computing framework on top of HDFS (Hadoop Distributed

Google Cloud Platform

berbasis Apache Beam untuk pemrosesan data stream dan batch. Cloud Dataproc - Platform data besar untuk menjalankan pekerjaanApache Hadoop dan Apache Spark

Uzi (disambiguasi)

Iran Uzi, istilah Burma untuk pawang gajah Uziel Uzi terbang, parasitoid ulat Apache Oozie, alur kerja sistem penjadwalan untuk mengelola Hadoop lowongan

Python dalam sains data dan kecerdasan buatan

dokumen, dan chatbot. Analitik Big Data: Integrasi Python dengan Apache Spark dan Hadoop memungkinkan pengolahan data dalam skala besar. Pengolahan Citra