最近准备开始接触hadoop,刚从百度上看了一点hadoop的概念,感觉了memcache有那么点神似,有人能简单阐述下两者的区别么?
hadoop 分布式
两者的应用场景不一样的,hadoop主要解决分布式数据存储和分布式数据计算的,主要用于海量数据处理,而memcache是做数据缓存用的,提高系统访问速度和性能的。
要测试比较Hive, impala和shark/spark的性能,可以从哪几个方面入手?
国内云计算厂商中有没有提供分布式计算的服务?
hadoop MultipleInputs 多文件输入input 出现错误
Hadoop 处理二进制文件问题
MapReduce中如何处理SequenceFile的输入文件
分布式项目工程之间的依赖