每个测点每隔5秒一条，如何为每100个测点每个测点35万条记录产生一批模拟数据

Question

每个测点每隔5秒一条，如何为每100个测点每个测点35万条记录产生一批模拟数据

发布于
2020-07-07

在DolphinDB database中分布式数据库按时间和测点两个维度进行组合分区，时间维度是按天值分区，测点维度是每100个测点范围分区。现在想插入3500亿条数据（100万个测点，每个测点5秒一条共35万条数据），要求每批产生100个测点的所有记录并插入数据库，产生每批数据的代码如下：

id_int=800000;
id=array(int,0);
j=100;
M=350000;
N_max=1799999;
time=array(DATETIME, 0);
ts=2019.03.22 15:43:13;
h=M;
id_par=array(int,0);
do{time.append!(ts);ts+=5;h-=1}while(ts<=2019.04.11 22:07:58 and h>=1)
tt=take(time,M*j);
b=id_int;
do{id.append!(take(id_int,M));id_int+=1;}while(id_int-b<j)
tmp=table(id as id,tt as time,take(1.0, M*j) as v,take(2.0, M*j) as q)
//todo:insert tmp into dfsTable

do { 
    b=id_int;
    id2=array(int,0);
    do{id2.append!(take(id_int,M));id_int+=1;}while(id_int-b<j)
    tmp=table(id2 as id,tt as time,take(1.0, M*j) as v,take(2.0, M*j) as q)
    //todo:insert tmp into dfsTable
}while(id_int<=N_max)

感觉代码的效率比较低，请问有什么优化的办法？

dolphindb 大数据数据库

阅读 1.9k

1 个回答

得票最新

wale

3.4k1621

发布于
2020-07-08

✓ 已被采纳

下面的代码中，prepareData函数可为每批100个测点产生所有记录，writeData把数据批量写入分布式表，loopWrite是把100万个测点用cut函数分割后用loop循环执行。

def prepareData(idVec, startTime,n){
    idSize=size(idVec)
    records= n * idSize
    id = array(INT, records)
    for(i in 0:idSize) id[(i*n) : ((i+1)*n)] = idVec[i]
    return table(id,  take(startTime+(0..(n-1))*5,records) as time, rand(100.0, records) as value,take(2.0,records) as quality)
}

def writeData(idVec,startTime,n){
    pt=loadTable("dfs://VALUE3","pt")
    pt.append!(prepareData(idVec,startTime,n))
}
def loopWrite(idVec,startTime,n){
    ids=idVec.cut(100)
    loop(writeData{,startTime,n},ids)
}
login("admin","123456")
idVec=800000..1799999
startTime=2019.03.22 15:43:13;
n=350000
submitJob("submit_write", "write data", loopWrite{idVec, startTime, n})

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

每个测点每隔5秒一条，如何为每100个测点每个测点35万条记录产生一批模拟数据

你尚未登录，登录后可以

请问是否有什么方案实现不同用户之间本地数据库的同步呢？

lowdb可以在前端进行存储吗？

realm进行数据存储，还可以同步到云端吗？

dolphindb 批量数据写入去重复？

在Go语言中，是否每次数据库查询都需要进行错误判断？

MySQL8.0版本发现一个bug??

请问一下，reacti-native一般使用什么存储数据库呢？