Buenos días, estoy buscando algo de información sobre BIG DATA pero es un poco lioso todo lo que encuentro y abro este post con la esperanza de ver algo mas de luz en el asunto.
Lo primero he estado investigando ya mucho y he visto que existen varias herramientas para todo esto que yo he organizado en 3 ecosistemas.
1) Ecosistema HADOOP: Hive, HDFS, Flume, Pig, Storm
2) Ecosistema ELK: Logstash, elasticsearch y kibana
3) Ecosistema SILK: SolrWriter for logstash, Solr y Banana
Pero donde me encuentro con los problemas es que veo que ELK puede utilizar HADOOP y me imagino que lo mismo con SILK. Aparte por todo lo que he leido no es que unas herramientas tengan muchas mas caracteristicas que otras... Mi duda es saber si es necesario/conveniente instalar por ejemplo Hive, HDFS, Flume, Pig , Storm , Elasticsearch y Kibana (una instalacion mixta entre hadoop y Elasticsearch) o simplemente con Elasticsearch vale. Y otra duda que me entra es porque si SILK es de apache y hadoop tambien no centralizan sus productos en una solución única para todo?
Muchas gracias