我正在尝试将数据框写入 SQL Server 表。我的代码:
conn = pymssql.connect(host="Dev02", database="DEVDb")
cur = conn.cursor()
query = "INSERT INTO dbo.SCORE_TABLE VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s)"
cur.executemany(query, df_sql)
conn.commit()
cur.close()
conn.close()
df_sql
的维度是 (5860, 20)
即数据框中的列数与SQL Server 表中的列数相同。我仍然收到以下错误:
ValueError:sql 中的占位符多于可用的参数
更新如下
根据其中一条评论,我尝试使用 turbodbc
如下:
conn = turbodbc.connect(driver="{SQL Server}", server="Dev02", Database="DEVDb")
conn.use_async_io = True
cur = conn.cursor()
query = "INSERT INTO dbo.STG_CONTACTABILITY_SCORE VALUES (?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?)"
cur.executemany(query, df_sql.values)
cur.commit()
cur.close()
conn.close()
我收到以下错误:
ValueError:具有多个元素的数组的真值不明确。使用 a.any() 或 a.all()
我不明白。这里有什么问题。我看到 df_sql.values
我没有发现任何错误。
ndarray 的第一行如下:
[nan 'DUSTIN HOPKINS' 'SOUTHEAST MISSOURI STATE UNIVERSITY' 13.0
'5736512217' None None 'Monday' '8:00AM' '9:00AM' 'Summer' None None None
None '2017-12-22 10:39:30.626331' 'Completed' None '1-11KUFFZ'
'Central Time Zone']
原文由 Krishnang K Dalal 发布,翻译遵循 CC BY-SA 4.0 许可协议
我认为你只需要指定每个列名并且不要忘记表必须有 id 字段来收取数据帧索引:
好的,我一直在使用 pandas,并将最后一个数据帧导出到 csv,例如:
然后我只使用了
pyobdc
和BULK INSERT
Transact-SQL,例如:将 15314 行记入 SQL Server 是一秒钟。我希望这能给你一个想法。