问题描述
比如我8点往表中写数据,中途电脑出问题down了,重新写入时,如何跳过之前已经写入的那些数据
问题出现的环境背景及自己尝试过哪些方法
从tushare按交易日拉日历史行情数据,拉下来一次就写入一次,server端在单机本机,状态正常,实际是在python中拉数据出了问题,因此中断运行,分区方式是RANGE,一年分一个区
相关代码
粘贴代码文本(请勿用截图)
你期待的结果是什么?实际看到的错误信息又是什么?
不要重复数据
比如我8点往表中写数据,中途电脑出问题down了,重新写入时,如何跳过之前已经写入的那些数据
从tushare按交易日拉日历史行情数据,拉下来一次就写入一次,server端在单机本机,状态正常,实际是在python中拉数据出了问题,因此中断运行,分区方式是RANGE,一年分一个区
粘贴代码文本(请勿用截图)
不要重复数据
6 回答3.3k 阅读✓ 已解决
4 回答2k 阅读
2 回答2.5k 阅读
1 回答1k 阅读✓ 已解决
2 回答1.5k 阅读
2 回答1.8k 阅读
1 回答1k 阅读✓ 已解决
dolphindb中的subscribeTable函数提供了persistOffset=true用于保留订阅中断时的位置,可以通过设置offset=-2自动获取断掉时候的位置再订阅。
所以上面的场景可以这样设计:创建键值流数据表keyedStreamTable,该表的主键不允许包含重复值。先把数据写入keyedStreamTable,然后订阅入库。订阅的时候设置offset=-2,persistOffset=true。