要分析比较着三者的性能,我准备搭个集群做测试,请问可以从哪几个方面入手评测?谢谢
hadoop 分布式
最近也在关注这个问题。 不过还没有着手实际去测试。
理论上来讲shark的性能要好于hive,因为shark很多操作是基于内存的 会一定程度上避免hive磁盘IO产生的瓶颈 这个也有一些第三方的测试数据来说明。
另外impala的性能据说会比hive要高很多的,宣称就是如此。
hadoop与memcache的区别
国内云计算厂商中有没有提供分布式计算的服务?
hadoop MultipleInputs 多文件输入input 出现错误
Hadoop 处理二进制文件问题
MapReduce中如何处理SequenceFile的输入文件
分布式项目工程之间的依赖