大数据之sarpk、sparkSQL、sparkStreaming、Hbase、Kudu、Alluxio

2023-11-18
阅读 2 分钟
420
spark1.spark 和 mr 执行类似,逻辑处理数据的单元为 RDD,和 mr一样 也有transform(map)和action(reduce)算子;2.spark 会将原始数据分片 partition,每个分片分给一个RDD来处理,RDD执行一个算子之后交给下一个RDD继续处理;1.kudu 代替 HBase

大数据之flink、clickHouse篇

2023-11-18
阅读 6 分钟
793
1 为什么使用flink? {代码...} 2.flink如何接入一个数据流? {代码...} 3.flink接入数据流后,如何处理的? {代码...} 4.flink处理完数据后,怎么存储数据? {代码...} 5.flink算子在处理数据时,如果需要接入第三方数据协助处理,怎么做? {代码...} 6.flink算子再做聚合操作时,例如单词计数,它如何处理每次的计算后...

大数据之大数据入门篇

2023-11-18
阅读 11 分钟
382
1.大数据首先要解决的问题是,海量数据怎么存储? {代码...} 2.hdfs怎么执行客户端写或读请求指令的? {代码...} 3.hdfs具体怎么保证数据不会丢失? {代码...} 4.只有一个NameNode工作,是否压力太大? {代码...} 5.hdfs api 编程从哪里入口? {代码...} 6.hdfs写数据是怎么写的? {代码...} 7.hdfs读数据是怎么操作的?...

ThreadLocal内存泄漏问题

2022-12-08
阅读 2 分钟
485
根据注释, 类Entry 是继承了WeakReference 弱引用类,用ThreadLocal 对象作为key,并且这个key 是弱引用的入参,当此key 对象不在被外部引用时,就会被垃圾回收,但是value 并不会被回收,它并不是若引用,只有 调用set remove rehash 方法时,判断key 为null 时,删除value。

TreadLocal重要方法解析

2022-12-08
阅读 5 分钟
569
ThreadLocal中有四个常用方法:initalValuesetgetremoveinitalValue先看initalValue,这个方法有两个调用方式覆写initalValue {代码...} 注释说明,该方法在第一次调用 get 时触发。withInitial {代码...} 调用withInitial 需要传入 实现 Supplier<? extends S> 对象,实际上就是需要一个get方法返回需要持有的对...

TreadLocal的原理解析

2022-12-08
阅读 2 分钟
484
注释写的很清楚,它是一个 hash map 的数据结构,用来持有本地线程变量 maintaining thread local values。也就是说,一个线程有本地一个 hashMap 对象,hashMap对象持有多个本地线程对象thread local values

ThreadLocal的使用

2022-12-08
阅读 1 分钟
496
线程运行时会遇到两种场景:各个线程需要一个独享的对象线程内需要一个全局对象保存参数,在不同的方法之间传递。场景1中,使用ThreadLocal持有对象,这个对象只对当前的线程可见,其他线程不可见,故而线程安全。 {代码...} 如上所示,在新建ThreadLocal对象时覆写initialValue方法,持有MessageHolder 对象,该对象就...