Sustina je: Razmisli da ti ti vrsi posao Elastic. Nisam ga koristio, ali moram da priznam da deluje impresivno - i on ima Hadoop backend i to bi trebalo da radi sjajno, sve dok si unutar parametara koje on moze da obradi. Za apache logove, deluje kao kljuc-u-ruke resenje, tako da je verovatno sasvim dovoljan.
Ono sto sam ti ja spominjao CDH (Hadoop + HBase + Hive/Impala + sitnice ) -> TokuDB -> Reporting je genericko resenje, koje ima smisla ako ti treba full OLAP, sa nekim custom podacima. Ako ono sto logujes nije samo clickstream, vec i detaljni user data, ako hoces vise od analiza posete - npr. detaljne analize ponasanja posetilaca, neki e-commerce recomendation engine ili tako nesto, onda ovo sto sam ti ja predlozio ima smisla. Ako si siguran da ti treba samo apache log analisys - pa, ja bi, iskreno, ulozio vreme u Elastic.
Blasphemy? How can I blaspheme? I'm a god!'