这是阿里校招的一道面试题,一直困扰了我很久,求大神解答,拜托了。有两组数据,每组数据有5亿条url,但是 只有4G的内存,怎么找出这两组数据中的相同的两个url?
面试- 阿里-. 大数据题目- 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?
有道类似的题目,采用的是分治的思想。
大概猜一下,先排序然后分块?
这种题目每年都弄出好几十个来,大公司就是不一样,啧啧啧
2 回答846 阅读
5 回答8.2k 阅读
1 回答6.9k 阅读
3 回答5.2k 阅读
2.9k 阅读
2 回答4.3k 阅读
面试- 阿里-. 大数据题目- 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?
有道类似的题目,采用的是分治的思想。