数据去重时out of memory

在DolphinDB database中,dailybar_stock表已经加载到内存,想再做个去重,这个表是八千多万条记录,占1.4GB内存.运行下列语句时OOM(用的server节点是8G内存限制)。

dailybar_stock=select * from dailybar_stock where isDuplicated([symbol,date],FIRST)=false

请教一下,是否还有别的占用较少内存的办法可以去重?

阅读 2.2k
1 个回答

可改用下列sql试试:

select top 1 * from t context by date,sym

hashmap比较耗内存。这个context by使用排序算法,节约内存。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进