MapReduce的shuffle过程

发表于 2017-06-27 | 分类于 bigdata ， hadoop |

前言

JobTracker和TaskTracker

发表于 2017-06-26 | 分类于 bigdata ， hadoop |

前言

(转载)JobTracker和TaskTracker详解
Hadoop MapReduce采用Master/Slave结构。
Master: 整个集群的唯一的全局管理者，功能包括：作业管理、状态监控和任务调度等，即MapReduce中的JobTracker。
Slave: 负责任务的执行和任务状态的回报，即MapReduce中的TaskTracker。

阅读全文 »

kafka配置及实践

发表于 2017-06-11 | 分类于 bigdata ， kafka |

概述

Apache Kafka™ is a distributed streaming platform.
我使用的是 kafka 0.9+。
参考官方文档，本文包括kafka的集群架构和工作原理，配置文件解析，常用脚本命令和java API操作。

阅读全文 »

zookeeper快速上手

发表于 2017-05-24 | 分类于 bigdata ， hadoop |

创建组加入组列出组成员删除组

阅读全文 »

SQL用法示例

发表于 2017-04-29 | 分类于应用，数据库 |

前言

一些上课学的,没有题目,只有答案.

阅读全文 »

单例模式

发表于 2017-04-28 | 分类于编程， java |

单例模式(singleton)

这个设计模式主要目的的想在整个系统中只能出现一个类的实例.参考深入浅出单实例SINGLETON设计模式

阅读全文 »

算法题通读

发表于 2017-04-04 | 分类于编程，算法 |

前言

用非常意识流的语言简述每题的思路,可能只有我读得懂.

阅读全文 »

MapReduce应用开发

发表于 2017-03-22 | 分类于 bigdata ， hadoop |

前言

MapReduce编程遵循一个特定的流程。首先写map 函数和reduce函数,最好使用单元测试来确保函数的运行符合预期。然后,写一个驱动程序来运行作业,看这个驱动程序是否可以正确运行,可以先从本地IDE中用一个小的數掘集采送行它。如果驱动程序不能正确运行,就用本地 IDE 調試器来找出问题根源。根据这些调试信息,可以通过扩展单元测试来覆盖这一测试用例,从而改进mapper或reducer,使其能正确处理类似输入。

阅读全文 »