优酷面试题

2023-11-24 01:18:04

mapred找共同朋友，数据格式如下
A B C D E F
B A C D E
C A B E
D A B E
E A B C D
F A

第一字母表示本人，其他是他的朋友，找出有共同朋友的人，和共同朋友是谁

运行结果
AB E:C:D
AC E:B
AD B:E
AE C:B:D
BC A:E
BD A:E
BE C:D:A
BF A
CD E:A:B
CE A:B
CF A
DE B:A
DF A
EF A

思路：对于每一行，两两进行组合作为一个新key，把每一行的第一个人作为value，map输出。

reduce函数进行聚合合并相同的key(即在map阶段的两两组合的新key)，具有相同key的 "每行第一个人列表" 就是key的共同朋友。

代码：

package 优酷面试题;import java.io.IOException;
import java.util.Set;
import java.util.StringTokenizer;
import java.util.TreeSet;import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;public class FindFriend {public static class ChangeMapper extends Mapper{                      @Overridepublic void map(Object key, Text value, Context context) throws IOException, InterruptedException {StringTokenizer itr = new StringTokenizer(value.toString());Text owner = new Text();Set set = new TreeSet();owner.set(itr.nextToken());while (itr.hasMoreTokens()) {set.add(itr.nextToken());}             String[] friends = new String[set.size()];friends = set.toArray(friends);for(int i=0;i {                          public void reduce(Text key, Iterable values, Context context) throws IOException, InterruptedException {String  commonfriends =""; for (Text val : values) {if(commonfriends == ""){commonfriends = val.toString();}else{commonfriends = commonfriends+":"+val.toString();}}context.write(key, new Text(commonfriends));                                }                          }@SuppressWarnings("deprecation")public static void main(String[] args) throws IOException,InterruptedException, ClassNotFoundException {Configuration conf = new Configuration();String[] otherArgs = new GenericOptionsParser(conf, args).getRemainingArgs();/*比如运行命令为：bin/hadoop dfs -fs master:8020 -ls /dataGenericOptionsParser把  -fs master:8020配置到配置conf中而getRemainingArgs()方法则得到剩余的参数，就是 -ls /data。供下面使用输入输出参数*/if (otherArgs.length < 2) {System.err.println("args error");System.exit(2);}Job job = new Job(conf, "word count");job.setJarByClass(FindFriend.class);job.setMapperClass(ChangeMapper.class);job.setCombinerClass(FindReducer.class);job.setReducerClass(FindReducer.class);job.setOutputKeyClass(Text.class);job.setOutputValueClass(Text.class);for (int i = 0; i < otherArgs.length - 1; ++i) {FileInputFormat.addInputPath(job, new Path(otherArgs[i]));}FileOutputFormat.setOutputPath(job,new Path(otherArgs[otherArgs.length - 1]));System.exit(job.waitForCompletion(true) ? 0 : 1);}/*GenericOptionsParser 命令行解析器是hadoop框架中解析命令行参数的基本类。它能够辨别一些标准的命令行参数，能够使应用程序轻易地指定namenode，jobtracker，以及其他额外的配置资源*/
}

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > Markdown 语法解析
下一篇 > java解析ajax的数据_ajax返回数据解析总结

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

优酷面试题

相关文章