聊聊flink的NetworkEnvironmentConfiguration

2019-02-24
阅读 24 分钟
2.9k
flink-1.7.2/flink-runtime/src/main/java/org/apache/flink/runtime/taskmanager/NetworkEnvironmentConfiguration.java

聊聊flink taskmanager的jvm-exit-on-oom配置

2019-02-23
阅读 19 分钟
2.8k
flink-1.7.2/flink-core/src/main/java/org/apache/flink/configuration/TaskManagerOptions.java

聊聊flink的MemorySegment

2019-02-22
阅读 31 分钟
2.6k
flink-release-1.7.2/flink-core/src/main/java/org/apache/flink/core/memory/MemorySegment.java

聊聊flink的MemoryPool

2019-02-21
阅读 6 分钟
2.2k
flink-runtime_2.11-1.7.2-sources.jar!/org/apache/flink/runtime/memory/MemoryManager.java

聊聊flink TaskManager的managed memory

2019-02-20
阅读 16 分钟
3k
flink-core-1.7.2-sources.jar!/org/apache/flink/configuration/TaskManagerOptions.java

聊聊flink TaskManager的memory大小设置

2019-02-19
阅读 17 分钟
5.1k
flink-conf.yaml提供了taskmanager.heap.size来设置taskmanager的memory(heap及offHeap)大小

聊聊flink JobManager的heap大小设置

2019-02-18
阅读 20 分钟
5.4k
flink-core-1.7.1-sources.jar!/org/apache/flink/configuration/JobManagerOptions.java

聊聊flink的AbstractNonHaServices

2019-02-17
阅读 15 分钟
2.1k
flink-runtime_2.11-1.7.1-sources.jar!/org/apache/flink/runtime/highavailability/HighAvailabilityServices.java

聊聊flink JobManager的High Availability

2019-02-16
阅读 32 分钟
3.8k
high-availability的可选值为NONE或者zookeeper;high-availability.zookeeper.quorum用于指定zookeeper的peers;high-availability.zookeeper.path.root用于指定在zookeeper的root node路径;high-availability.cluster-id用于指定当前cluster的node名称,该cluster node位于root node下面;high-availability.storageD...

聊聊flink的ParameterTool

2019-02-15
阅读 14 分钟
10.3k
使用ParameterTool.fromArgs从命令行创建ParameterTool(比如--input hdfs:///mydata --elements 42)

聊聊flink的logback配置

2019-02-14
阅读 13 分钟
6.2k
添加logback-core、logback-classic及log4j-over-slf4j依赖,之后对flink-java、flink-streaming-java_2.11、flink-clients_2.11等配置log4j及slf4j-log4j12的exclusions;最后通过mvn dependency:tree查看是否还有log4j12,以确认下是否都全部排除了

聊聊flink的Execution Plan Visualization

2019-02-13
阅读 5 分钟
4.3k
flink-streaming-java_2.11-1.7.1-sources.jar!/org/apache/flink/streaming/api/environment/StreamExecutionEnvironment.java

聊聊flink的Parallel Execution

2019-02-12
阅读 16 分钟
3.1k
operators、data sources、data sinks都可以调用setParallelism()方法来设置parallelism

聊聊flink的RestartStrategies

2019-02-11
阅读 19 分钟
2.9k
flink-core-1.7.1-sources.jar!/org/apache/flink/api/common/restartstrategy/RestartStrategies.java

聊聊flink Table的ScalarFunction

2019-02-10
阅读 10 分钟
3.1k
flink-table_2.11-1.7.1-sources.jar!/org/apache/flink/table/functions/ScalarFunction.scala

聊聊flink Table的AggregateFunction

2019-02-09
阅读 13 分钟
4.3k
WeightedAvg继承了AggregateFunction,实现了getValue、accumulate、retract、merge、resetAccumulator方法

聊聊flink的TableFunction

2019-02-08
阅读 9 分钟
6.1k
本实例自定义了Split function,并通过TableEnvironment.registerFunction注册,最后在Table的api或者TableEnvironment.sqlQuery中使用;这里的Split定义了public的eval方法,用于发射数据

聊聊flink的TableFactory

2019-02-07
阅读 16 分钟
3.2k
本实例定义了MySystemTableSourceFactory,它的requiredContext为update-mode=append及connector.type=my-system,它的supportedProperties为connector.debug,它的createStreamTableSource方法创建的是MySystemAppendTableSource;MySystemConnector继承了ConnectorDescriptor,它定义了connector.type值为my-system,c...

聊聊flink的CsvTableSink

2019-02-06
阅读 7 分钟
2.8k
flink-table_2.11-1.7.1-sources.jar!/org/apache/flink/table/sinks/TableSink.scala

聊聊flink的CsvTableSource

2019-02-05
阅读 6 分钟
3.3k
flink-table_2.11-1.7.1-sources.jar!/org/apache/flink/table/sources/TableSource.scala

聊聊flink的Table Formats

2019-02-04
阅读 9 分钟
6.5k
序 本文主要研究一下flink的Table Formats 实例 CSV Format {代码...} flink内置支持csv format,无需添加额外依赖 JSON Format {代码...} 可以使用schema或者jsonSchema或者deriveSchema来定义json format,需要额外添加flink-json依赖 Apache Avro Format {代码...} 可以使用recordClass或者avroSchema来定义Avro sche...

聊聊flink Table Schema的定义

2019-02-03
阅读 10 分钟
4.8k
通过timestampsFromField、timestampsFromSource、timestampsFromExtractor定义rowtime

聊聊flink的JDBCAppendTableSink

2019-02-02
阅读 8 分钟
3.2k
这里使用tableEnv.registerTableSink注册JDBCAppendTableSink,之后利用table.insertInto往该sink写数据

聊聊flink Table的Time Attributes

2019-02-01
阅读 7 分钟
3.3k
通过TableSource创建Table的话,可以通过实现DefinedProctimeAttribute接口来定义Processing time

聊聊flink Table的OrderBy及Limit

2019-01-31
阅读 5 分钟
3.8k
flink-table_2.11-1.7.0-sources.jar!/org/apache/flink/table/api/table.scala

聊聊flink Table的Set Operations

2019-01-30
阅读 8 分钟
2.5k
序 本文主要研究一下flink Table的Set Operations 实例 Union {代码...} union方法类似sql的union UnionAll {代码...} unionAll方法类似sql的union all Intersect {代码...} intersect方法类似sql的intersect IntersectAll {代码...} intersectAll方法类似sql的intersect all Minus {代码...} minus方法类似sql的except ...

聊聊flink Table的Joins

2019-01-29
阅读 10 分钟
2.8k
time-windowed join需要至少一个等值条件,然后还需要一个与两边时间相关的条件(可以使用<, <=, >=, >)

聊聊flink Table的Distinct Aggregation

2019-01-28
阅读 7 分钟
3.7k
Distinct Aggregation可以用于内置的及自定义的aggregation function;内置的aggregation function诸如GroupBy Aggregation、GroupBy Window Aggregation、Over Window Aggregation

聊聊flink Table的Over Windows

2019-01-27
阅读 9 分钟
4.6k
Over Windows类似SQL的over子句,它可以基于event-time、processing-time或者row-count;具体可以通过Over类来构造,其中必须设置orderBy、preceding及as方法;它有Unbounded及Bounded两大类

聊聊flink Table的Group Windows

2019-01-26
阅读 6 分钟
3.5k
window操作可以对Window进行别名,然后可以在groupBy及select中引用,window有start、end、rowtime属性可以用,其中start及rowtime是inclusive的,而end为exclusive