Apache Pig ile Hadoop Üzerinde Veri Analizi

pig-on-elephant

Apache Pig, Hadoop üzerindeki verileri işlemek için Yahoo firması tarafından geliştirilmiş, “Pig Latin” olarak adlandırılan kolay bir dile sahip, açık kaynaklı bir projedir. MapReduce ile yapmak istediğimiz analizleri Pig ile daha kısa ve daha kolay şekilde yapabiliyoruz. Pig Latin ile farklı formatta verileri yükleyip, bu veriler üzerinde filtreleme, sıralama, grouplama, aritmetik işlemler ve en önemlisi join’ler yapabiliyorsunuz.
Okumaya devam…