Python数据库ORM工具sqlalchemy的学习笔记

SQLAlchemy是数据python的一个数据库ORM工具,提供了强大的工具对象模型间的转换,可以满足绝大多数数据库操作的习笔需求,并且支持多种数据库引擎(sqlite,数据mysql,工具postgres,习笔 mongodb等),在这里记录基本用法和学习笔记。数据

一、工具安装

通过pip安装

$ pip install SQLAlchemy 

二、习笔使用

首先是数据连接到数据库,SQLALchemy支持多个数据库引擎,工具不同的习笔数据库引擎连接字符串不一样,常用的数据有

mysql://username:password@hostname/database postgresql://username:password@hostname/database sqlite:////absolute/path/to/database sqlite:///c:/absolute/path/to/database 

 更多连接字符串的介绍参见这里

下面是连接和使用sqlite数据库的例子

1. connection

使用传统的connection的方式连接和操作数据库

from sqlalchemy import create_engine # 数据库连接字符串 DB_CONNECT_STRING = sqlite:///:memory: # 创建数据库引擎,echo为True,会打印所有的sql语句 engine = create_engine(DB_CONNECT_STRING, echo=True) # 创建一个connection,这里的工具使用方式与python自带的sqlite的使用方式类似 with engine.connect() as con:     # 执行sql语句,如果是习笔增删改,则直接生效,云服务器提供商不需要commit     rs = con.execute(SELECT 5)     data = rs.fetchone()[0]     print "Data: %s" % data 

 与python自带的sqlite不同,这里不需要Cursor光标,执行sql语句不需要commit

2. connection事务

使用事务可以进行批量提交和回滚 

from sqlalchemy import create_engine # 数据库连接字符串 DB_CONNECT_STRING = sqlite:////Users/zhengxiankai/Desktop/Document/db.sqlite engine = create_engine(DB_CONNECT_STRING, echo=True) with engine.connect() as connection:     trans = connection.begin()     try:         r1 = connection.execute("select * from User")         r2 = connection.execute("insert into User(name, age) values(?, ?)", bomo, 24)         trans.commit()     except:         trans.rollback()         raise  

3. session

connection是一般使用数据库的方式,sqlalchemy还提供了另一种操作数据库的方式,通过session对象,session可以记录和跟踪数据的改变,在适当的时候提交,并且支持强大的ORM的功能,下面是基本使用 

from sqlalchemy import create_engine from sqlalchemy.orm import sessionmaker # 数据库连接字符串 DB_CONNECT_STRING = sqlite:////Users/zhengxiankai/Desktop/Document/db.sqlite # 创建数据库引擎,echo为True,会打印所有的sql语句 engine = create_engine(DB_CONNECT_STRING, echo=True) # 创建会话类 DB_Session = sessionmaker(bind=engine) # 创建会话对象 session = DB_Session() # dosomething with session # 用完记得关闭,也可以用with session.close()  

上面创建了一个session对象,接下来可以操作数据库了,session也支持通过sql语句操作数据库 

session.execute(select * from User) session.execute("insert into User(name, age) values(bomo, 13)") session.execute("insert into User(name, age) values(:name, :age)", { name: bomo, age:12}) # 如果是增删改,需要commit session.commit()  

注意参数使用dict,并在sql语句中使用:key占位

4. ORM

上面简单介绍了sql的简单用法,既然是ORM框架,我们先定义两个模型类User和Role,sqlalchemy的模型类继承自一个由declarative_base()方法生成的类,我们先定义一个模块Models.py生成Base类 

from sqlalchemy.ext.declarative import declarative_base Base = declarative_base()  

User.py 

from sqlalchemy import Column, Integer, String from Models import Base class User(Base):     __tablename__ = User     id = Column(id, Integer, primary_key=True, autoincrement=True)     name = Column(name, String(50))     age = Column(age, Integer)  

Role.py 

from sqlalchemy import Column, Integer, String from Models import Base class Role(Base):     __tablename__ = Role     id = Column(id, Integer, primary_key=True, autoincrement=True)     name = Column(name, String(50))  

从上面很容易看出来,亿华云计算这里的模型对应数据库中的表,模型支持的类型有Integer, String, Boolean, Date, DateTime, Float,更多类型包括类型对应的Python的类型参见:这里

Column构造函数相关设置

name:名称 type_:列类型 autoincrement:自增 default:默认值 index:索引 nullable:可空 primary_key:外键

更多介绍参见这里

接下来通过session进行增删改查 

from sqlalchemy import create_engine from sqlalchemy.orm import sessionmaker from User import User from Role import Role from Models import Base DB_CONNECT_STRING = sqlite:////Users/zhengxiankai/Desktop/Document/db.sqlite engine = create_engine(DB_CONNECT_STRING, echo=True) DB_Session = sessionmaker(bind=engine) session = DB_Session() # 1. 创建表(如果表已经存在,则不会创建) Base.metadata.create_all(engine) # 2. 插入数据 u = User(name = tobi, age = 200) r = Role(name = user) # 2.1 使用add,如果已经存在,会报错 session.add(u) session.add(r) session.commit() print r.id # 3 修改数据 # 3.1 使用merge方法,如果存在则修改,如果不存在则插入 r.name = admin session.merge(r) # 3.2 也可以通过这种方式修改 session.query(Role).filter(Role.id == 1).update({ name: admin}) # 4. 删除数据 session.query(Role).filter(Role.id == 1).delete() # 5. 查询数据 # 5.1 返回结果集的第二项 user = session.query(User).get(2) # 5.2 返回结果集中的第2-3项 users = session.query(User)[1:3] # 5.3 查询条件 user = session.query(User).filter(User.id < 6).first() # 5.4 排序 users = session.query(User).order_by(User.name) # 5.5 降序(需要导入desc方法) from sqlalchemy import desc users = session.query(User).order_by(desc(User.name)) # 5.6 只查询部分属性 users = session.query(User.name).order_by(desc(User.name)) for user in users:     print user.name # 5.7 给结果集的列取别名 users = session.query(User.name.label(user_name)).all() for user in users:     print user.user_name # 5.8 去重查询(需要导入distinct方法) from sqlalchemy import distinct users = session.query(distinct(User.name).label(name)).all() # 5.9 统计查询 user_count = session.query(User.name).order_by(User.name).count() age_avg = session.query(func.avg(User.age)).first() age_sum = session.query(func.sum(User.age)).first() # 5.10 分组查询 users = session.query(func.count(User.name).label(count), User.age).group_by(User.age) for user in users:     print age:{ 0}, count:{ 1}.format(user.age, user.count) session.close() 

 5. 多表关系

上面的所有操作都是基于单个表的操作,下面是多表以及关系的使用,我们修改上面两个表,添加外键关联(一对多和多对一)

User模型 

from sqlalchemy import Column, Integer, String from sqlalchemy import ForeignKey from sqlalchemy.orm import relationship from Models import Base class User(Base):     __tablename__ = users     id = Column(id, Integer, primary_key=True, autoincrement=True)     name = Column(name, String(50))     age = Column(age, Integer)     # 添加角色id外键(关联到Role表的id属性)     role_id = Column(role_id, Integer, ForeignKey(roles.id))     # 添加同表外键     second_role_id = Column(second_role_id, Integer, ForeignKey(roles.id))     # 添加关系属性,关联到role_id外键上     role = relationship(Role, foreign_keys=User.role_id, backref=User_role_id)     # 添加关系属性,关联到second_role_id外键上     second_role = relationship(Role, foreign_keys=User.second_role_id, backref=User_second_role_id) 

 Role模型 

from sqlalchemy import Column, Integer, String from sqlalchemy.orm import relationship from Models import Base class Role(Base):     __tablename__ = roles     id = Column(id, Integer, primary_key=True, autoincrement=True)     name = Column(name, String(50))     # 添加关系属性,关联到User.role_id属性上     users = relationship("User", foreign_keys=User.role_id, backref="Role_users")     # 添加关系属性,关联到User.second_role_id属性上     second_users = relationship("User", foreign_keys=User.second_role_id, backref="Role_second_users") 

 这里有一点需要注意的是,设置外键的时候ForeignKey(roles.id)这里面使用的站群服务器是表名和表列,在设置关联属性的时候relationship(Role, foreign_keys=User.role_id, backref=User_role_id),这里的foreign_keys使用的时候类名和属性名

接下来就可以使用了 

u = User(name=tobi, age=200) r1 = Role(name=admin) r2 = Role(name=user) u.role = r1 u.second_role = r2 session.add(u) session.commit() # 查询(对于外键关联的关系属性可以直接访问,在需要用到的时候session会到数据库查询) roles = session.query(Role).all() for role in roles:     print role:{ 0} users     for user in role.users:         print \t{ 0}.format(user.name)     print role:{ 0} second_users     for user in role.second_users:         print \t{ 0}.format(user.name) 

 上面表示的是一对多(多对一)的关系,还有一对一,多对多,如果要表示一对一的关系,在定义relationship的时候设置uselist为False(默认为True),如在Role中 

class Role(Base):     ...     user = relationship("User", uselist=False, foreign_keys=User.role_id, backref="Role_user")  

6. 多表查询

多表查询通常使用join进行表连接,***个参数为表名,第二个参数为条件,例如 

users = db.session.query(User).join(Role, Role.id == User.role_id) for u in users:     print u.name  

join为内连接,还有左连接outerjoin,用法与join类似,右连接和全外链接在1.0版本上不支持,通常来说有这两个结合查询的方法基本够用了,1.1版本貌似添加了右连接和全外连接的支持,但是目前只是预览版

还可以直接查询多个表,如下 

result = db.session.query(User, Role).filter(User.role_id = Role.id) # 这里选择的是两个表,使用元组获取数据 for u, r in result:       print u.name  

三、数据库迁移

sqlalchemy的数据库迁移/升级有两个库支持alembic和sqlalchemy-migrate

由于sqlalchemy-migrate在2011年发布了0.7.2版本后,就已经停止更新了,并且已经不维护了,也积累了很多bug,而alembic是较后来才出现,而且是sqlalchemy的作者开发的,有良好的社区支持,所以在这里只学习alembic这个库

alembic实现了类似git/svn的版本管理的控制,我们可以通过alembic维护每次升级数据库的版本

1. 安装

通过pip安装,pip会自动安装相关的依赖

$ pip install alembic 

2. 初始化

安装完成后再项目根目录运行 

yourproject/     alembic.ini     YOUR_ALEMBIC_DIR/         env.py         README         script.py.mako         versions/             3512b954651e_add_account.py             2b1ae634e5cd_add_order_id.py             3adcc9a56557_rename_username_field.py  

其中

alembic.ini 提供了一些基本的配置 env.py 每次执行Alembic都会加载这个模块,主要提供项目Sqlalchemy Model 的连接 script.py.mako 迁移脚本生成模版 versions 存放生成的迁移脚本目录

默认情况下创建的是基于单个数据库的,如果需要支持多个数据库或其他,可以通过alembic list_templates查看支持的模板 

$ alembic list_templates Available templates: generic - Generic single-database configuration. multidb - Rudimentary multi-database configuration. pylons - Configuration that reads from a Pylons project environment. Templates are used via the init command, e.g.:   alembic init --template generic ./scripts  

3. 配置

使用之前,需要配置一下链接字符串,打开alembic.ini文件,设置sqlalchemy.url连接字符串,例如 

sqlalchemy.url = sqlite:////Users/zhengxiankai/Desktop/database.db 

其他参数可以参见官网说明:http://alembic.zzzcomputing.com/en/latest/tutorial.html

4. 创建数据库版本

接下来我们创建一个数据库版本,并新建两个表 

$ alembic revision -m create table 

创建一个版本(会在yourproject/YOUR_ALEMBIC_DIR/versions/文件夹中创建一个python文件1a8a0d799b33_create_table.py)

该python模块包含upgrade和downgrade两个方法,在这里添加一些新增表的逻辑 

"""create table Revision ID: 4fd533a56b34 Revises: Create Date: 2016-09-18 17:20:27.667100 """ from alembic import op import sqlalchemy as sa # revision identifiers, used by Alembic. revision = 4fd533a56b34 down_revision = None branch_labels = None depends_on = None def upgrade():     # 添加表     op.create_table(         account,         sa.Column(id, sa.Integer, primary_key=True),         sa.Column(name, sa.String(50), nullable=False),         sa.Column(description, sa.Unicode(200)),     )     # 添加列     # op.add_column(account, sa.Column(last_transaction_date, sa.DateTime)) def downgrade():     # 删除表     op.drop_table(account)     # 删除列     # op.drop_column(account, last_transaction_date)  

这里使用到了了op对象,关于op对象的更多API使用,参见这里

5. 升级数据库

刚刚实现了升级和降级的方法,通过下面命令升级数据库到***版本 

$ alembic upgrade head 

这时候可以看到数据库多了两个表alembic_version和account,alembic_version存放数据库版本

关于升级和降级的其他命令还有下面这些 

# 升到***版本 $ alembic upgrade head # 降到最初版本 $ alembic downgrade base # 升两级 $ alembic upgrade +2 # 降一级 $ alembic downgrade -1 # 升级到制定版本 $ alembic upgrade e93b8d488143 # 查看当前版本 $ alembic current # 查看历史版本详情 $ alembic history --verbose # 查看历史版本(-r参数)类似切片 $ alembic history -r1975ea:ae1027 $ alembic history -r-3:current $ alembic history -r1975ea:  

6. 通过元数据升级数据库

上面我们是通过API升级和降级,我们也可以直接通过元数据更新数据库,也就是自动生成升级代码,先定义两个Model(User,Role),这里我定义成三个文件 

yourproject/     YOUR_ALEMBIC_DIR/     tutorial/Db         Models.py         User.py         Role.py 

 代码就放在一起了 

from sqlalchemy.ext.declarative import declarative_base from sqlalchemy import Column, Integer, String Base = declarative_base() class User(Base):     __tablename__ = users     id = Column(id, Integer, primary_key=True, autoincrement=True)     name = Column(name, String) class Role(Base):     __tablename__ = roles     id = Column(id, Integer, primary_key=True, autoincrement=True)     name = Column(name, String) 

 在YOUR_ALEMBIC_DIR/env.py配置元数据 

target_metadata = None 

改为 

import os import sys # 这里需要添加相对路径到sys.path,否则会引用失败,尝试过使用相对路径,但各种不好使,还是使用这种方法靠谱些 sys.path.append(os.path.abspath(os.path.join(os.getcwd(), "../yourproject/tutorial/Db"))) from User import User from Role import Role from Models import Base target_metadata = Base.metadata  

os.path.join(os.getcwd()这个获取到的地址不是env.py的路径,而是根目录

在创建数据库版本的时候添加--autogenerate参数,就会从Base.metadata元数据中生成脚本 

$ alembic revision --autogenerate -m "add user table" 

这时候会在生成升级代码 

"""add user table Revision ID: 97de1533584a Revises: 8678ab6d48c1 Create Date: 2016-09-19 21:58:00.758410 """ from alembic import op import sqlalchemy as sa # revision identifiers, used by Alembic. revision = 97de1533584a down_revision = 8678ab6d48c1 branch_labels = None depends_on = None def upgrade():     ### commands auto generated by Alembic - please adjust! ###     op.create_table(roles,     sa.Column(id, sa.Integer(), nullable=False),     sa.Column(name, sa.String(), nullable=True),     sa.PrimaryKeyConstraint(id)     )     op.create_table(users,     sa.Column(id, sa.Integer(), nullable=False),     sa.Column(name, sa.String(), nullable=True),     sa.PrimaryKeyConstraint(id)     )     op.drop_table(account)     ### end Alembic commands ### def downgrade():     ### commands auto generated by Alembic - please adjust! ###     op.create_table(account,     sa.Column(id, sa.INTEGER(), nullable=False),     sa.Column(name, sa.VARCHAR(length=50), nullable=False),     sa.Column(description, sa.VARCHAR(length=200), nullable=True),     sa.Column(last_transaction_date, sa.DATETIME(), nullable=True),     sa.PrimaryKeyConstraint(id)     )     op.drop_table(users)     op.drop_table(roles)     ### end Alembic commands ###  

由于我没有定义account模型,会被识别为删除,如果删除了model的列的声明,则会被识别为删除列,自动生成的版本我们也可以自己修改,然后执行升级命令即可升级alembic upgrade head

需要注意的是

Base.metadata声明的类必须以数据库中的一一对应,如果数据库中有的表,而在元数据中没有,会识别成删除表 revision创建版本之前执行之前需要升级到***版本 配置Base之前,需要保证所有的Model都已经执行(即导入)过一次了,否则无法读取到,也就是需要把所有Model都import进来

数据库升级有风险,升级前***先检查一遍upgrade函数,可以的话做好备份哈

四、常见问题

1. String长度问题

如果使用mysql数据库,String类型对应的是VARCHAR类型,需要指定长度,否则会报下面错误,而在sqlite不会出现 

(in table user, column name): VARCHAR requires a length on dialect mysql 

TODO:如有其他问题欢迎留言

五、参考链接

Auto Generating Migrations tutorial

***安利一下自己的博客:http://blog.bomobox.org

滇ICP备2023000592号-31