Python数据库ORM工具sqlalchemy的学习笔记
SQLAlchemy是数据python的一个数据库ORM工具,提供了强大的工具对象模型间的转换,可以满足绝大多数数据库操作的习笔需求,并且支持多种数据库引擎(sqlite,数据mysql,工具postgres,习笔 mongodb等),在这里记录基本用法和学习笔记。数据
一、工具安装
通过pip安装
$ pip install SQLAlchemy二、习笔使用
首先是数据连接到数据库,SQLALchemy支持多个数据库引擎,工具不同的习笔数据库引擎连接字符串不一样,常用的数据有
mysql://username:password@hostname/database postgresql://username:password@hostname/database sqlite:////absolute/path/to/database sqlite:///c:/absolute/path/to/database更多连接字符串的介绍参见这里
下面是连接和使用sqlite数据库的例子
1. connection
使用传统的connection的方式连接和操作数据库
from sqlalchemy import create_engine # 数据库连接字符串 DB_CONNECT_STRING = sqlite:///:memory: # 创建数据库引擎,echo为True,会打印所有的sql语句 engine = create_engine(DB_CONNECT_STRING, echo=True) # 创建一个connection,这里的工具使用方式与python自带的sqlite的使用方式类似 with engine.connect() as con: # 执行sql语句,如果是习笔增删改,则直接生效,云服务器提供商不需要commit rs = con.execute(SELECT 5) data = rs.fetchone()[0] print "Data: %s" % data与python自带的sqlite不同,这里不需要Cursor光标,执行sql语句不需要commit
2. connection事务
使用事务可以进行批量提交和回滚
from sqlalchemy import create_engine # 数据库连接字符串 DB_CONNECT_STRING = sqlite:////Users/zhengxiankai/Desktop/Document/db.sqlite engine = create_engine(DB_CONNECT_STRING, echo=True) with engine.connect() as connection: trans = connection.begin() try: r1 = connection.execute("select * from User") r2 = connection.execute("insert into User(name, age) values(?, ?)", bomo, 24) trans.commit() except: trans.rollback() raise3. session
connection是一般使用数据库的方式,sqlalchemy还提供了另一种操作数据库的方式,通过session对象,session可以记录和跟踪数据的改变,在适当的时候提交,并且支持强大的ORM的功能,下面是基本使用
from sqlalchemy import create_engine from sqlalchemy.orm import sessionmaker # 数据库连接字符串 DB_CONNECT_STRING = sqlite:////Users/zhengxiankai/Desktop/Document/db.sqlite # 创建数据库引擎,echo为True,会打印所有的sql语句 engine = create_engine(DB_CONNECT_STRING, echo=True) # 创建会话类 DB_Session = sessionmaker(bind=engine) # 创建会话对象 session = DB_Session() # dosomething with session # 用完记得关闭,也可以用with session.close()上面创建了一个session对象,接下来可以操作数据库了,session也支持通过sql语句操作数据库
session.execute(select * from User) session.execute("insert into User(name, age) values(bomo, 13)") session.execute("insert into User(name, age) values(:name, :age)", { name: bomo, age:12}) # 如果是增删改,需要commit session.commit()注意参数使用dict,并在sql语句中使用:key占位
4. ORM
上面简单介绍了sql的简单用法,既然是ORM框架,我们先定义两个模型类User和Role,sqlalchemy的模型类继承自一个由declarative_base()方法生成的类,我们先定义一个模块Models.py生成Base类
from sqlalchemy.ext.declarative import declarative_base Base = declarative_base()User.py
from sqlalchemy import Column, Integer, String from Models import Base class User(Base): __tablename__ = User id = Column(id, Integer, primary_key=True, autoincrement=True) name = Column(name, String(50)) age = Column(age, Integer)Role.py
from sqlalchemy import Column, Integer, String from Models import Base class Role(Base): __tablename__ = Role id = Column(id, Integer, primary_key=True, autoincrement=True) name = Column(name, String(50))从上面很容易看出来,亿华云计算这里的模型对应数据库中的表,模型支持的类型有Integer, String, Boolean, Date, DateTime, Float,更多类型包括类型对应的Python的类型参见:这里
Column构造函数相关设置
name:名称 type_:列类型 autoincrement:自增 default:默认值 index:索引 nullable:可空 primary_key:外键更多介绍参见这里
接下来通过session进行增删改查
from sqlalchemy import create_engine from sqlalchemy.orm import sessionmaker from User import User from Role import Role from Models import Base DB_CONNECT_STRING = sqlite:////Users/zhengxiankai/Desktop/Document/db.sqlite engine = create_engine(DB_CONNECT_STRING, echo=True) DB_Session = sessionmaker(bind=engine) session = DB_Session() # 1. 创建表(如果表已经存在,则不会创建) Base.metadata.create_all(engine) # 2. 插入数据 u = User(name = tobi, age = 200) r = Role(name = user) # 2.1 使用add,如果已经存在,会报错 session.add(u) session.add(r) session.commit() print r.id # 3 修改数据 # 3.1 使用merge方法,如果存在则修改,如果不存在则插入 r.name = admin session.merge(r) # 3.2 也可以通过这种方式修改 session.query(Role).filter(Role.id == 1).update({ name: admin}) # 4. 删除数据 session.query(Role).filter(Role.id == 1).delete() # 5. 查询数据 # 5.1 返回结果集的第二项 user = session.query(User).get(2) # 5.2 返回结果集中的第2-3项 users = session.query(User)[1:3] # 5.3 查询条件 user = session.query(User).filter(User.id < 6).first() # 5.4 排序 users = session.query(User).order_by(User.name) # 5.5 降序(需要导入desc方法) from sqlalchemy import desc users = session.query(User).order_by(desc(User.name)) # 5.6 只查询部分属性 users = session.query(User.name).order_by(desc(User.name)) for user in users: print user.name # 5.7 给结果集的列取别名 users = session.query(User.name.label(user_name)).all() for user in users: print user.user_name # 5.8 去重查询(需要导入distinct方法) from sqlalchemy import distinct users = session.query(distinct(User.name).label(name)).all() # 5.9 统计查询 user_count = session.query(User.name).order_by(User.name).count() age_avg = session.query(func.avg(User.age)).first() age_sum = session.query(func.sum(User.age)).first() # 5.10 分组查询 users = session.query(func.count(User.name).label(count), User.age).group_by(User.age) for user in users: print age:{ 0}, count:{ 1}.format(user.age, user.count) session.close()5. 多表关系
上面的所有操作都是基于单个表的操作,下面是多表以及关系的使用,我们修改上面两个表,添加外键关联(一对多和多对一)
User模型
from sqlalchemy import Column, Integer, String from sqlalchemy import ForeignKey from sqlalchemy.orm import relationship from Models import Base class User(Base): __tablename__ = users id = Column(id, Integer, primary_key=True, autoincrement=True) name = Column(name, String(50)) age = Column(age, Integer) # 添加角色id外键(关联到Role表的id属性) role_id = Column(role_id, Integer, ForeignKey(roles.id)) # 添加同表外键 second_role_id = Column(second_role_id, Integer, ForeignKey(roles.id)) # 添加关系属性,关联到role_id外键上 role = relationship(Role, foreign_keys=User.role_id, backref=User_role_id) # 添加关系属性,关联到second_role_id外键上 second_role = relationship(Role, foreign_keys=User.second_role_id, backref=User_second_role_id)Role模型
from sqlalchemy import Column, Integer, String from sqlalchemy.orm import relationship from Models import Base class Role(Base): __tablename__ = roles id = Column(id, Integer, primary_key=True, autoincrement=True) name = Column(name, String(50)) # 添加关系属性,关联到User.role_id属性上 users = relationship("User", foreign_keys=User.role_id, backref="Role_users") # 添加关系属性,关联到User.second_role_id属性上 second_users = relationship("User", foreign_keys=User.second_role_id, backref="Role_second_users")这里有一点需要注意的是,设置外键的时候ForeignKey(roles.id)这里面使用的站群服务器是表名和表列,在设置关联属性的时候relationship(Role, foreign_keys=User.role_id, backref=User_role_id),这里的foreign_keys使用的时候类名和属性名
接下来就可以使用了
u = User(name=tobi, age=200) r1 = Role(name=admin) r2 = Role(name=user) u.role = r1 u.second_role = r2 session.add(u) session.commit() # 查询(对于外键关联的关系属性可以直接访问,在需要用到的时候session会到数据库查询) roles = session.query(Role).all() for role in roles: print role:{ 0} users for user in role.users: print \t{ 0}.format(user.name) print role:{ 0} second_users for user in role.second_users: print \t{ 0}.format(user.name)上面表示的是一对多(多对一)的关系,还有一对一,多对多,如果要表示一对一的关系,在定义relationship的时候设置uselist为False(默认为True),如在Role中
class Role(Base): ... user = relationship("User", uselist=False, foreign_keys=User.role_id, backref="Role_user")6. 多表查询
多表查询通常使用join进行表连接,***个参数为表名,第二个参数为条件,例如
users = db.session.query(User).join(Role, Role.id == User.role_id) for u in users: print u.namejoin为内连接,还有左连接outerjoin,用法与join类似,右连接和全外链接在1.0版本上不支持,通常来说有这两个结合查询的方法基本够用了,1.1版本貌似添加了右连接和全外连接的支持,但是目前只是预览版
还可以直接查询多个表,如下
result = db.session.query(User, Role).filter(User.role_id = Role.id) # 这里选择的是两个表,使用元组获取数据 for u, r in result: print u.name三、数据库迁移
sqlalchemy的数据库迁移/升级有两个库支持alembic和sqlalchemy-migrate
由于sqlalchemy-migrate在2011年发布了0.7.2版本后,就已经停止更新了,并且已经不维护了,也积累了很多bug,而alembic是较后来才出现,而且是sqlalchemy的作者开发的,有良好的社区支持,所以在这里只学习alembic这个库
alembic实现了类似git/svn的版本管理的控制,我们可以通过alembic维护每次升级数据库的版本
1. 安装
通过pip安装,pip会自动安装相关的依赖
$ pip install alembic2. 初始化
安装完成后再项目根目录运行
yourproject/ alembic.ini YOUR_ALEMBIC_DIR/ env.py README script.py.mako versions/ 3512b954651e_add_account.py 2b1ae634e5cd_add_order_id.py 3adcc9a56557_rename_username_field.py其中
alembic.ini 提供了一些基本的配置 env.py 每次执行Alembic都会加载这个模块,主要提供项目Sqlalchemy Model 的连接 script.py.mako 迁移脚本生成模版 versions 存放生成的迁移脚本目录默认情况下创建的是基于单个数据库的,如果需要支持多个数据库或其他,可以通过alembic list_templates查看支持的模板
$ alembic list_templates Available templates: generic - Generic single-database configuration. multidb - Rudimentary multi-database configuration. pylons - Configuration that reads from a Pylons project environment. Templates are used via the init command, e.g.: alembic init --template generic ./scripts3. 配置
使用之前,需要配置一下链接字符串,打开alembic.ini文件,设置sqlalchemy.url连接字符串,例如
sqlalchemy.url = sqlite:////Users/zhengxiankai/Desktop/database.db其他参数可以参见官网说明:http://alembic.zzzcomputing.com/en/latest/tutorial.html
4. 创建数据库版本
接下来我们创建一个数据库版本,并新建两个表
$ alembic revision -m create table创建一个版本(会在yourproject/YOUR_ALEMBIC_DIR/versions/文件夹中创建一个python文件1a8a0d799b33_create_table.py)
该python模块包含upgrade和downgrade两个方法,在这里添加一些新增表的逻辑
"""create table Revision ID: 4fd533a56b34 Revises: Create Date: 2016-09-18 17:20:27.667100 """ from alembic import op import sqlalchemy as sa # revision identifiers, used by Alembic. revision = 4fd533a56b34 down_revision = None branch_labels = None depends_on = None def upgrade(): # 添加表 op.create_table( account, sa.Column(id, sa.Integer, primary_key=True), sa.Column(name, sa.String(50), nullable=False), sa.Column(description, sa.Unicode(200)), ) # 添加列 # op.add_column(account, sa.Column(last_transaction_date, sa.DateTime)) def downgrade(): # 删除表 op.drop_table(account) # 删除列 # op.drop_column(account, last_transaction_date)这里使用到了了op对象,关于op对象的更多API使用,参见这里
5. 升级数据库
刚刚实现了升级和降级的方法,通过下面命令升级数据库到***版本
$ alembic upgrade head这时候可以看到数据库多了两个表alembic_version和account,alembic_version存放数据库版本
关于升级和降级的其他命令还有下面这些
# 升到***版本 $ alembic upgrade head # 降到最初版本 $ alembic downgrade base # 升两级 $ alembic upgrade +2 # 降一级 $ alembic downgrade -1 # 升级到制定版本 $ alembic upgrade e93b8d488143 # 查看当前版本 $ alembic current # 查看历史版本详情 $ alembic history --verbose # 查看历史版本(-r参数)类似切片 $ alembic history -r1975ea:ae1027 $ alembic history -r-3:current $ alembic history -r1975ea:6. 通过元数据升级数据库
上面我们是通过API升级和降级,我们也可以直接通过元数据更新数据库,也就是自动生成升级代码,先定义两个Model(User,Role),这里我定义成三个文件
yourproject/ YOUR_ALEMBIC_DIR/ tutorial/Db Models.py User.py Role.py代码就放在一起了
from sqlalchemy.ext.declarative import declarative_base from sqlalchemy import Column, Integer, String Base = declarative_base() class User(Base): __tablename__ = users id = Column(id, Integer, primary_key=True, autoincrement=True) name = Column(name, String) class Role(Base): __tablename__ = roles id = Column(id, Integer, primary_key=True, autoincrement=True) name = Column(name, String)在YOUR_ALEMBIC_DIR/env.py配置元数据
target_metadata = None改为
import os import sys # 这里需要添加相对路径到sys.path,否则会引用失败,尝试过使用相对路径,但各种不好使,还是使用这种方法靠谱些 sys.path.append(os.path.abspath(os.path.join(os.getcwd(), "../yourproject/tutorial/Db"))) from User import User from Role import Role from Models import Base target_metadata = Base.metadataos.path.join(os.getcwd()这个获取到的地址不是env.py的路径,而是根目录
在创建数据库版本的时候添加--autogenerate参数,就会从Base.metadata元数据中生成脚本
$ alembic revision --autogenerate -m "add user table"这时候会在生成升级代码
"""add user table Revision ID: 97de1533584a Revises: 8678ab6d48c1 Create Date: 2016-09-19 21:58:00.758410 """ from alembic import op import sqlalchemy as sa # revision identifiers, used by Alembic. revision = 97de1533584a down_revision = 8678ab6d48c1 branch_labels = None depends_on = None def upgrade(): ### commands auto generated by Alembic - please adjust! ### op.create_table(roles, sa.Column(id, sa.Integer(), nullable=False), sa.Column(name, sa.String(), nullable=True), sa.PrimaryKeyConstraint(id) ) op.create_table(users, sa.Column(id, sa.Integer(), nullable=False), sa.Column(name, sa.String(), nullable=True), sa.PrimaryKeyConstraint(id) ) op.drop_table(account) ### end Alembic commands ### def downgrade(): ### commands auto generated by Alembic - please adjust! ### op.create_table(account, sa.Column(id, sa.INTEGER(), nullable=False), sa.Column(name, sa.VARCHAR(length=50), nullable=False), sa.Column(description, sa.VARCHAR(length=200), nullable=True), sa.Column(last_transaction_date, sa.DATETIME(), nullable=True), sa.PrimaryKeyConstraint(id) ) op.drop_table(users) op.drop_table(roles) ### end Alembic commands ###由于我没有定义account模型,会被识别为删除,如果删除了model的列的声明,则会被识别为删除列,自动生成的版本我们也可以自己修改,然后执行升级命令即可升级alembic upgrade head
需要注意的是
Base.metadata声明的类必须以数据库中的一一对应,如果数据库中有的表,而在元数据中没有,会识别成删除表 revision创建版本之前执行之前需要升级到***版本 配置Base之前,需要保证所有的Model都已经执行(即导入)过一次了,否则无法读取到,也就是需要把所有Model都import进来数据库升级有风险,升级前***先检查一遍upgrade函数,可以的话做好备份哈
四、常见问题
1. String长度问题
如果使用mysql数据库,String类型对应的是VARCHAR类型,需要指定长度,否则会报下面错误,而在sqlite不会出现
(in table user, column name): VARCHAR requires a length on dialect mysqlTODO:如有其他问题欢迎留言
五、参考链接
Auto Generating Migrations tutorial***安利一下自己的博客:http://blog.bomobox.org