ORM: SQLAlchemy 初识

ORM: Object Relational Mapper.

目前Python有很多ORM工具可以将数据库映像为Python的Objects对象。
其中比较知名的有Django的ORM，SQLAlchemy, PostgreSQL等。
SQLAlchemy有更多的人维护，功能也比较齐全。所以一般是我们的首选项。

对于SQLAlchemy的使用者来说，只要你一开始连接上数据库，不管是Sqlite，MySQL还是什么，后面的处理方式完全一样。这种便利性也是它受欢迎的原因。

抛弃了传统的自己编织SQL语句、制作模型、连接数据库方式，SQLAlchemy直接把这些东西全包在黑盒里面，让我们完全不需要去管。连SQL-Injection注入这种东西也被它帮忙防范了。这样一来，可以说在连接数据库方面，帮我们节省了最少一半以上的代码。

甚至连数据查询，SQLAlchemy也代替了SQL语句，而使用了专门的类似MongoDB的Object.query.filter_by(name='Jason').all()这种方法。

安装：

# 安装sqlalchemy
$ pip install sqlalchemy

安装Drivers：

# Sqlite
# 不需要，Python自带

# MySQL
$ pip install pymysql

# Postgresql
$ pip install psycopg2

SQLAlchemy自身不带数据库driver，需要我们自己安装，并在连接时候指定。
而这些driver，实际上就是我们曾经手动连接数据库所用的包。而SQLAlchemy只是代替我们使用这些同样的包。

连接数据库

创建一个sqlite的ORM引擎：

from sqlalchemy import create_engine

# 连接格式为：sqlite://<Hostname>/<path>
engine  = create_engine('sqlite:///foo.db', echo=True)

创建一个MySQL的ORM引擎：

from sqlalchemy import create_engine

# 连接格式为：dialect+driver://username:password@host:port/database
engine  = create_engine('mysql+pymysql://root:password123@localhost/db_test_01', echo=True)

数据库的位置（三斜杠为相对路径，四斜杠为绝对路径）：

# 使用绝对路径的数据库文件(////)，如/tmp/mydatabase.db
engine  = create_engine('sqlite:////tmp/mydatabase.db')

# 使用当前「执行位置」数据库文件(///或///./)
engine  = create_engine('sqlite:///mydatabase.db')

# 使用当前「执行位置」父级目录(///../)的数据库文件
engine  = create_engine('sqlite:///../mydatabase.db')

# 使用当前「脚本位置」的数据库文件
import os
cwd = os.path.split(os.path.realpath(__file__))[0]
engine  = create_engine('sqlite:///{}/mydatabase.db'.format(cwd))

Create Tables 创建表

注意：不同于SQL语句，SQLAlchemy中的表名是完全区分大小写的！

创建一个Schema表（指单纯表，不包含ORM对象）：

from sqlalchemy import create_engine, MetaData
from sqlalchemy import Table, Column
from sqlalchemy import Integer, String, ForeignKey

engine  = create_engine('mysql+pymysql://root:password123@localhost/db_test_01', echo=True)
metadata = MetaData(engine)

# 创建一个表
user_table = Table( 'tb_user', metadata,
        Column('id', Integer, primary_key=True),
        Column('name', String(50)),
        Column('fullname', String(100))
)

# 让改动生效
metadata.create_all()

创建一个ORM对象（包括表）：

# 导入表格创建引擎
from sqlalchemy import create_engine
# 导入列格式
from sqlalchemy import Column, Integer, String, ForeignKey
# 导入创建ORM模型相关
from sqlalchemy.ext.declarative import declarative_base

Base  = declarative_base()

class User(Base):
    __tablename__ = 'tb_Person'

    id = Column('id', Integer, primary_key=True)
    username = Column('username', String, unique=True)

engine = create_engine('sqlite:///test.sqlite', echo=True)
Base.metadata.create_all(bind=engine)

用普通表Table和ORM对象创建的表有什么不同？
他们在数据库中创建的，是完全相同的表！唯一区别是，Table创建的不包含ORM对象，也就是不提供让你直接操作Python对象的功能。
这么做的好处是，有很多只是关联作用的表，没有必要生成ORM对象。

删除数据库中的表

# engine = ...
# Base = ...

# 逐个ORM对象删除对应的表，如User类
User.__table__.drop(engine)

# 删除全部表
Base.metadata.drop_all(engine)

设计或调试过程中，我们经常要频繁改动表格，所以有必要在创建表格前把测试数据库中的表都清除掉，再创建新的定义。

Insertion 插入数据

将数据添加到数据库：

# ...
# 导入session相关(用于添加数据)
from sqlalchemy.orm import sessionmaker, relationship

user = User()
user.id = 1
user.username = 'Jason'

Session = sessionmaker(bind=engine)
session = Session()
session.add(user)
session.commit()
session.close()

注意：这里的session和网站上的session概念有点不一样。这里是用来commit提交数据库变动的工具。

批量添加数据（向add_all()传入列表）：

session.add_all( [user1, user2, user3] )

添加每条数据的时候自动flush():

session = sessionmaker(bind=engine, autoflush=True)

autoflush是在每次session.add()自动执行session.flush()，即在插入数据库之前就在内存中生成所有对象的动态数据（如主键ID等）。一般默认是选false，因为会影响效率。最好是需要的时候，才手动执行session.flush()

具体缘由，看下一节“数据生效”。

Take effect 数据生效

SQLAlchemy中的create_all()和session.commit()都是直接让python文件中定义的对象在数据库中生效的语句。在此之前，无论怎么定义，数据都是在内存中，而没有在数据库中的。

注意区分：

create_all只是让创建表格结构生效，无关insert的数据条目
session.commit()只是让添加的数据生效，而不负责任何表格结构。

这两个的顺序，当然是先创建表格，再插入数据。

只是，如果我们知道了这个原理，在编码中才能比较运用自由。比如，连create_engine()创建引擎，我们都可以在后面定义，而没必要非得写在文件头，即所有的ORM定义之前。
create_engine只要定义在所有ORM类和Schema表之后即可。

此后，我们再开始进行数据插入工作，也就利用到了session。

session过程中呢，我们也会遇到互相引用主键外键ID的情况。但是注意，这时候因为还没有使用最终的session.commit()真正提交数据到数据库中，这些ID是没有值的。
解决办法就是利用内置的方法session.flush()，将session中已添加的所有对象填充好数据，但是这时候还没有提交到数据库，只是我们内部可以正常访问各种ID了。

更新／删除数据

更新：

# Get a row of data
me = session.query(User).filter_by(username='Jason').first()

# Method 1:
me.age += 1
session.commit()

# Method 2:
session.query().filter(
    User.username == 'Jason'
).update(
    {"age": (User.age +1)}
)
session.commit()

# Method 3:
setattr(user, 'age', user.age+1)
session.commit()

Get Primary Key Value 获取主键值

#sqlalchemy can't get primary key , #sqlalchemy 如何获得主键的值

这个问题花了我很多时间探索查询，不得其解，才明白原来是很显然的事。

参考思否：SQLAlchemy中返回新插入数据的id？

虽然在没有用session或engine插入数据之前，我们可以直接浏览从ORM创建的对象中的属性值。
但是这个时候无论如何都获取不到primar_key主键列的值。

因为这时候主键还没有插入数据库，作为动态的值，在数据库没生效之前也就为None。

为什么需要获取value of primary_key？考虑如下这些场景：

子表中的foreign key外键需要引用主表的id
??

那么该怎么获取主键ID呢？

再参考Stackoverflow：sqlalchemy flush() and get inserted id?
再参考：sqlalchemy获取插入的id
再参考：Sqlalchemy;将主键设置为预先存在的数据库表（不使用sqlite）

如果要想在插入数据之前就获取主键等动态列的值，那么有这几种方法：

直接利用SQLAlchemy建立类直接的内部关联，而不直接使用ID
主表插入数据，另session生效后，再用query获取相应对象，来得到它的ID。
(*) 主表先用session.add(..)，再session.flush()，然后就可以获取ID，最后再session.commit()
不使用primary key主键，自己手动创建ID，这样来随便获取。

推荐做法如下：

即每次新创建对象后，立刻session.add(..)，然后立刻session.flush()，全部都添加好的文末，再session.commit().

Query 查询

注意：query是通过session进行的，也就是必须在session.commit()之后才能进行查询，否则会报错。

这里将的query查询，指的都是在插入到数据库生效之后。理解这个很重要，因为在对象未插入到数据库之前，很多主键、外键等内容都是不存在的，也就无法查询到。

参考：pythonsheets - Object Relational basic query

查询数据：

session.commit()
# ...

users = session.query(User).all()
# 返回的是多个User类的对象：>>> [ <User 1>, <User 2>, .... ]

for u in users:
    print(u.id, u.username)

常用查询方法：

# 获取某ORM中数据 .query(ORM类名)
>>> session.query( User ).all()     # All rows of data
>>> session.query( User ).first()    # First row of data as an object

# 查询结果排序 .order_by(类名.列名)
>>> session.query(User).order_by( User.birth ).all()

# 筛选结果 .filter( True/False 表达式 )
>>> session.query(User).filter( User.name != 'Jason' ).all()
>>> session.query(User).filter( User.name.like('%ed%') ).all()    # Fuzzy search
>>> session.query(User).filter( User.id in [1, 2, 3] ).all()    # IN
>>> session.query(User).filter( ~ User.id in [4, 5, 6] ).all()   # NOT IN
>>> session.query(User).filter( User.school == 'MIT', User.age < 24 ).first()   # AND
>>> session.query(User).filter( _or(User.school == 'MIT', User.age < 24) ).first()   # OR

ORM: SQLAlchemy 初识

连接数据库

Create Tables 创建表

删除数据库中的表

Insertion 插入数据

Take effect 数据生效

更新／删除数据

Get Primary Key Value 获取主键值

Query 查询

SolomonXie

引用和评论

Mac上的gdb之：从入门到放弃

一个优雅的 mysql ORM ，无须做模型映射

一个优雅的 PostgreSQL ORM ，无须做模型映射