当前位置: 首页 > news >正文

网站怎么做伪静态页面/网络推广 网站制作

网站怎么做伪静态页面,网络推广 网站制作,免费简历模板制作网站,政府网站建设多少钱MapReduce作业(job)是客户端执行的单位:它包括输入数据、MapReduce程序和配置信息。Hadoop通过把作业分成若干个小任务(task)来工作,其包括两种类型的任务:map任务和reduce任务。 有两种类型的节…

MapReduce作业(job)是客户端执行的单位:它包括输入数据、MapReduce程序和配置信息。Hadoop通过把作业分成若干个小任务(task)来工作,其包括两种类型的任务:map任务和reduce任务。

 

有两种类型的节点控制着作业执行过程:jobtracker和多个tasktracker。Jobtracker通过调度任务在tasktracker上运行,来协调所有运行在系统上的作业。Tasktracker运行任务的同时,把进度报告传送给jobtracker,jobtracker则记录着每项任务的整体进展情况。如果其中一个任务失败,jobtracker可以重新调度任务到另外一个tasktracker。Hadoop把输入数据划分为等长的小数据发送给mapreduce,称为输入分片。Hadoop为每个分片创建一个map任务,由它来运行用户自定义的map函数来分析每个分片的记录。

 

Map任务的执行节点和输入数据的存储节点在同一个节点,Hadoop的性能达到最佳。Reduce任务并不具备数据本地读取的优势,一个单一的reduce任务的输入往往来自于所有mapper的输出。


一个简单的MapReduce程序

import java.io.IOException;  
import java.util.StringTokenizer;  import org.apache.hadoop.conf.Configuration;  
import org.apache.hadoop.fs.Path;  
import org.apache.hadoop.io.IntWritable;  
import org.apache.hadoop.io.LongWritable;  
import org.apache.hadoop.io.Text;  
import org.apache.hadoop.mapreduce.Job;  
import org.apache.hadoop.mapreduce.Mapper;  
import org.apache.hadoop.mapreduce.Reducer;  
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;  
import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;  
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;  
import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;  public class WordCount {  public static class WordCountMap extends  Mapper<LongWritable, Text, Text, IntWritable> {  private final IntWritable one = new IntWritable(1);  private Text word = new Text();  public void map(LongWritable key, Text value, Context context)  throws IOException, InterruptedException {  String line = value.toString();  StringTokenizer token = new StringTokenizer(line);  while (token.hasMoreTokens()) {  word.set(token.nextToken());  context.write(word, one);  }  }  }  public static class WordCountReduce extends  Reducer<Text, IntWritable, Text, IntWritable> {  public void reduce(Text key, Iterable<IntWritable> values,  Context context) throws IOException, InterruptedException {  int sum = 0;  for (IntWritable val : values) {  sum += val.get();  }  context.write(key, new IntWritable(sum));  }  }  public static void main(String[] args) throws Exception {  Configuration conf = new Configuration();  Job job = new Job(conf);  job.setJarByClass(WordCount.class);  job.setJobName("wordcount");  job.setOutputKeyClass(Text.class);  job.setOutputValueClass(IntWritable.class);  job.setMapperClass(WordCountMap.class);  job.setReducerClass(WordCountReduce.class);  job.setInputFormatClass(TextInputFormat.class);  job.setOutputFormatClass(TextOutputFormat.class);  FileInputFormat.addInputPath(job, new Path(args[0]));  FileOutputFormat.setOutputPath(job, new Path(args[1]));  job.waitForCompletion(true);  }  
} 



小结:

  1. 客户端(client):编写mapreduce程序,配置作业,提交作业。
  2. JobTracker:初始化作业,分配作业,与TaskTracker通信,协调整个作业的执行;
  3. TaskTracker:保持与JobTracker的通信,在分配的数据片段上执行Map或Reduce任务,TaskTracker和JobTracker的不同有个很重要的方面,就是在执行任务时候TaskTracker可以有n多个,JobTracker则只会有一个
  4. Hdfs:保存作业的数据、配置信息等等,最后的结果也是保存在hdfs上面

http://www.jmfq.cn/news/5082103.html

相关文章:

  • 西安网站建设运维/广州seo关键词优化外包
  • 优质的南昌网站设计/郑州seo优化外包
  • 网站专题页面/客户管理软件哪个好用
  • 飞虎队网站建设/百度竞价推广怎么做
  • 那些语言可以做动态网站/seo chinaz
  • 彩票网站开发 彩票软件开发/seo策略工具
  • 南京移动网站建设效果好/四川seo快速排名
  • 网站效果展示/google学术搜索
  • unity网站后台怎么做/头条搜索
  • 网站后台的东西都是要上传到在虚拟主机上面吗/seo一般包括哪些内容
  • 深圳经营性网站备案/网站top排行榜
  • 上海网站推/下载百度地图2022最新版官方
  • 福州专业网站建设价格/无锡百度快速优化排名
  • 网站系统架构图/百度推广登录页面
  • 网站开发和网站建设/电脑优化大师下载安装
  • 电脑网站制作教程/宁波正规seo推广
  • 宁波网站建设哪家好/搜索引擎优化方法总结
  • 企业门户网站在信息系统架构中属于哪个层次/2023网络营销成功案例
  • 网站建设 开发/推广引流吸引人的标题
  • php 获取网站根域名/软文宣传
  • 类似一起做网店的网站/外贸网站制作公司
  • 淘宝天猫做网站咨询/b站推广app大全
  • 中国建设银行公积金网缴网站/免费的短视频app大全
  • 网站首页图片轮播/互联网创业项目
  • wordpress门户网站主题/东莞seo建站排名
  • 网络管理系统有哪几部分组成/衡阳seo优化首选
  • 建网页用什么软件/杭州seo百度关键词排名推广
  • 做甜品网站栏目/上海sem
  • 有视频做的很好的网站吗/站长网站查询
  • 服务器网站建设教程/搜索引擎优化seo是什么