Wyatt's blog


  • 首页

  • 分类

  • 归档

  • 标签

  • 搜索

MapReduce的shuffle过程

发表于 2017-06-27 | 分类于 bigdata , hadoop |

前言

(转载)MapReduce:详解Shuffle过程
我画了更加直观的解释图。

阅读全文 »

JobTracker和TaskTracker

发表于 2017-06-26 | 分类于 bigdata , hadoop |

前言

(转载)JobTracker和TaskTracker详解
Hadoop MapReduce采用Master/Slave结构。
Master: 整个集群的唯一的全局管理者,功能包括:作业管理、状态监控和任务调度等,即MapReduce中的JobTracker。
Slave: 负责任务的执行和任务状态的回报,即MapReduce中的TaskTracker。

阅读全文 »

kafka配置及实践

发表于 2017-06-11 | 分类于 bigdata , kafka |

概述

Apache Kafka™ is a distributed streaming platform.
我使用的是 kafka 0.9+。
参考官方文档,本文包括kafka的集群架构和工作原理,配置文件解析,常用脚本命令和java API操作。

阅读全文 »

zookeeper快速上手

发表于 2017-05-24 | 分类于 bigdata , hadoop |

创建组 加入组 列出组成员 删除组

阅读全文 »

SQL用法示例

发表于 2017-04-29 | 分类于 应用 , 数据库 |

前言

一些上课学的,没有题目,只有答案.

阅读全文 »

单例模式

发表于 2017-04-28 | 分类于 编程 , java |

单例模式(singleton)

这个设计模式主要目的的想在整个系统中只能出现一个类的实例.参考深入浅出单实例SINGLETON设计模式

阅读全文 »

算法题通读

发表于 2017-04-04 | 分类于 编程 , 算法 |

前言

用非常意识流的语言简述每题的思路,可能只有我读得懂.

阅读全文 »

MapReduce应用开发

发表于 2017-03-22 | 分类于 bigdata , hadoop |

前言

MapReduce编程遵循一个特定的流程。首先写map 函数和reduce函数,最好使用单元测试来确保函数的运行符合预期。然后,写一个驱动程序来运行作业,看这个驱动程序是否可以正确运行,可以先从本地IDE中用一个小的數掘集采送行它。如果驱动程序不能正确运行,就用本地 IDE 調試器来找出问题根源。根据这些调试信息,可以通过扩展单元测试来覆盖这一测试用例,从而改进mapper或reducer,使其能正确处理类似输入。

阅读全文 »

HDFS

发表于 2017-03-20 | 分类于 bigdata , hadoop |

前言

Hdfs基本知识

阅读全文 »

HadoopIO

发表于 2017-03-20 | 分类于 bigdata , hadoop |

前言

Hadoop I/O 操作

阅读全文 »
123
黄文启

黄文启

有花堪折直须折 莫待无花空折枝

26 日志
11 分类
17 标签
GitHub Facebook
© 2017 黄文启
由 Hexo 强力驱动
主题 - NexT.Pisces