使用 df.to_sql 将 pandas 数据帧写入 sqlite 数据库表时如何设置主键

Question

新手上路，请多包涵

我已经使用 pandas df.to_sql 创建了一个 sqlite 数据库，但是访问它似乎比仅读取 500mb csv 文件要慢得多。

我需要：

使用 df.to_sql 方法为每个表设置主键
告诉 sqlite 数据库我的 3.dataframe 中每一列的数据类型是什么？ - 我可以传递一个像 [整数,整数,文本,文本] 这样的列表吗

代码….（格式代码按钮不起作用）

 if ext == ".csv":
df = pd.read_csv("/Users/data/" +filename)
columns = df.columns columns = [i.replace(' ', '_') for i in columns]

df.columns = columns
df.to_sql(name,con,flavor='sqlite',schema=None,if_exists='replace',index=True,index_label=None, chunksize=None, dtype=None)

原文由 yoshiserry 发布，翻译遵循 CC BY-SA 4.0 许可协议

python sqlite pandas primary-key

阅读 1.2k

1 个回答

得票最新

社区维基

1

发布于
2023-01-10

不幸的是，目前无法在 pandas df.to_sql() 方法中设置主键。此外，为了让事情变得更加痛苦，在创建表后无法在 sqlite 中的列上设置主键。

但是，目前的解决方法是使用 pandas df.to_sql() 方法在 sqlite 中创建表。然后你可以创建一个复制表并设置你的主键，然后复制你的数据。然后放下旧桌子进行清理。

这将是类似的事情。

 import pandas as pd
import sqlite3

df = pd.read_csv("/Users/data/" +filename)
columns = df.columns columns = [i.replace(' ', '_') for i in columns]

#write the pandas dataframe to a sqlite table
df.columns = columns
df.to_sql(name,con,flavor='sqlite',schema=None,if_exists='replace',index=True,index_label=None, chunksize=None, dtype=None)

#connect to the database
conn = sqlite3.connect('database')
c = conn.curser()

c.executescript('''
    PRAGMA foreign_keys=off;

    BEGIN TRANSACTION;
    ALTER TABLE table RENAME TO old_table;

    /*create a new table with the same column names and types while
    defining a primary key for the desired column*/
    CREATE TABLE new_table (col_1 TEXT PRIMARY KEY NOT NULL,
                            col_2 TEXT);

    INSERT INTO new_table SELECT * FROM old_table;

    DROP TABLE old_table;
    COMMIT TRANSACTION;

    PRAGMA foreign_keys=on;''')

#close out the connection
c.close()
conn.close()

过去，我遇到过这个问题时就这样做过。只是将整个东西包装成一个函数，以使其更方便……

在我使用 sqlite 的有限经验中，我发现在创建表后无法添加主键，无法执行更新插入或 UPSERTS，以及更新连接导致了很多挫折和一些非常规的解决方法。

最后，在 pandas df.to_sql() 方法中有一个 dtype 关键字参数，它可以采用列名字典：类型。即：dtype = {col_1: TEXT}

原文由 Fury 发布，翻译遵循 CC BY-SA 3.0 许可协议

查看全部 1 个回答

推荐问题

Stack Overflow 翻译

子站问答

访问

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题

使用 df.to_sql 将 pandas 数据帧写入 sqlite 数据库表时如何设置主键

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？

Stack Overflow 翻译