Django ORM之QuerySet

本文轉載自查看原文 2014-03-17 00:44 36160 Django/ QuerySet/ Python

Django ORM用到三個類：Manager、QuerySet、Model。Manager定義表級方法（表級方法就是影響一條或多條記錄的方法），我們可以以models.Manager為父類，定義自己的manager，增加表級方法；QuerySet：Manager類的一些方法會返回QuerySet實例，QuerySet是一個可遍歷結構，包含一個或多個元素，每個元素都是一個Model 實例，它里面的方法也是表級方法，前面說了，Django給我們提供了增加表級方法的途徑，那就是自定義manager類，而不是自定義QuerySet類，一般的我們沒有自定義QuerySet類的必要；django.db.models模塊中的Model類，我們定義表的model時，就是繼承它，它的功能很強大，通過自定義model的instance可以獲取外鍵實體等，它的方法都是記錄級方法（都是實例方法，貌似無類方法），不要在里面定義類方法，比如計算記錄的總數，查看所有記錄，這些應該放在自定義的manager類中。以Django1.6為基礎。

1.QuerySet

1.1 簡介

每個Model都有一個默認的manager實例，名為objects，QuerySet有兩種來源：通過manager的方法得到、通過QuerySet的方法得到。mananger的方法和QuerySet的方法大部分同名，同意思，如filter(),update()等，但也有些不同，如manager有create()、get_or_create()，而QuerySet有delete()等，看源碼就可以很容易的清楚Manager類與Queryset類的關系，Manager類的絕大部分方法是基於Queryset的。一個QuerySet包含一個或多個model instance。QuerySet類似於Python中的list，list的一些方法QuerySet也有，比如切片，遍歷。

>>> from userex.models import UserEx

>>> type(UserEx.objects)

>>> a = UserEx.objects.all()

>>> type(a)

QuerySet是延遲獲取的，只有當用到這個QuerySet時，才會查詢數據庫求值。另外，查詢到的QuerySet又是緩存的，當再次使用同一個QuerySet時，並不會再查詢數據庫，而是直接從緩存獲取（不過，有一些特殊情況）。一般而言，當對一個沒有求值的QuerySet進行的運算，返回的是QuerySet、ValuesQuerySet、ValuesListQuerySet、Model實例時，一般不會立即查詢數據庫；反之，當返回的不是這些類型時，會查詢數據庫。下面介紹幾種（並非全部）對QuerySet求值的場景。

class Blog(models.Model):

name = models.CharField(max_length=100)

tagline = models.TextField()

def __unicode__(self):

return self.name

class Author(models.Model):

name = models.CharField(max_length=50)

email = models.EmailField()

def __unicode__(self):

return self.name

class Entry(models.Model):

blog = models.ForeignKey(Blog)

headline = models.CharField(max_length=255)

body_text = models.TextField()

pub_date = models.DateField()

mod_date = models.DateField()

authors = models.ManyToManyField(Author)

n_comments = models.IntegerField()

n_pingbacks = models.IntegerField()

rating = models.IntegerField()

def __unicode__(self):

return self.headline

我們以上面的models為例。

I遍歷

a = Entry.objects.all()

for e in a:

print (e.headline)

當遍歷一開始時，先從數據庫執行查詢select * from Entry得到a，然后再遍歷a。注意：這里只是查詢Entry表，返回的a的每條記錄只包含Entry表的字段值，不管Entry的model中是否有onetoone、onetomany、manytomany字段，都不會關聯查詢。這遵循的是數據庫最少讀寫原則。我們修改一下代碼，如下，遍歷一開始也是先執行查詢得到a，但當執行print (e.blog.name)時，還需要再次查詢數據庫獲取blog實體。

from django.db import connection

l = connection.queries #l是一個列表，記錄SQL語句

a = Entry.objects.all()

for e in a:

print (e.blog.name)

len(l)

遍歷時，每次都要查詢數據庫，l長度每次增1，Django提供了方法可以在查詢時返回關聯表實體，如果是onetoone或onetomany，那用select_related，不過對於onetomany，只能在主表（定義onetomany關系的那個表）的manager中使用select_related方法，即通過select_related獲取的關聯對象是model instance，而不能是QuerySet，如下，e.blog就是model instance。對於onetomany的反向和manytomany，要用prefetch_related，它返回的是多條關聯記錄，是QuerySet。

a = Entry.objects.select_related('blog')

for e in a:

print (e.blog.name)

len(l)

可以看到從開始到結束，l的長度只增加1。另外，通過查詢connection.queries[-1]可以看到Sql語句用了join。

II切片

切片不會立即執行，除非顯示指定了步長，如a= Entry.objects.all()[0:10:2]，步長為2。

III序列化，即Pickling

序列化QuerySet很少用

IV repr()

和str()功能相似，將對象轉為字符串，很少用。

V len()

計算QuerySet元素的數量，並不推薦使用len()，除非QuerySet是求過值的（即evaluated），否則，用QuerySet.count()獲取元素數量，這個效率要高。

VI list()

將QuerySet轉為list

VII bool()，判斷是否為空

if Entry.objects.filter(headline="Test"):

print("There is at least one Entry with the headline Test")

同樣不建議這種方法判斷是否為空，而應該使用QuerySet.exists()，查詢效率高

1.2 QuerySet的方法

數據庫的常用操作就四種：增、刪、改、查，QuerySet的方法涉及刪、改、查。后面還會講model對象的方法，model方法主要是增、刪、改、還有調用model實例的字段。

(1) 刪delete()

原型：delete()

返回：None

相當於delete-from-where, delete-from-join-where。先filter，然后對得到的QuerySet執行delete()方法就行了，它會同時刪除關聯它的那些記錄，比如我刪除記錄表1中的A記錄，表2中的B記錄中有A的外鍵，那同時也會刪除B記錄，那ManyToMany關系呢？對於ManyToMany，刪除其中一方的記錄時，會同時刪除中間表的記錄，即刪除雙方的關聯關系。由於有些數據庫，如Sqlite不支持delete與limit連用，所以在這些數據庫對QuerySet的切片執行delete()會出錯。如

>>> a = UserEx.objects.filter(is_active=False)

>>> b = a[:3]

>>> b.delete() #執行時會報錯

解決：UserEx.objects.filter(pk__in=b).delete()

in后面可以是一個QuerySet，見 https://docs.djangoproject.com/en/1.6/ref/models/querysets/#in

(2) 改 update()

批量修改，返回修改的記錄數。不過update()中的鍵值對的鍵只能是主表中的字段，不能是關聯表字段，如下

Entry.objects.update(blog__name='foo') #錯誤，無法修改關聯表字段，只能修改Entry表的字段

Entry.objects.filter(blog__name='foo').update(comments_on=False) #正確

最好的方法是先filter，查詢出QuerySet，然后再執行QuerySet.update()。

由於有些數據庫，不支持update與limit連用，所以在這些數據庫對QuerySet的切片執行update()會出錯。

(3)查詢 filter(kwargs)、exclude(kwargs)、get(**kwargs)

相當於select-from-where，select-from-join-where，很多網站讀數據庫操作最多。可以看到，filter()的參數是變個數的鍵值對，而不會出現>,<,!=等符號，這些符號分別用__gt,__lt,~Q或exclude()，不過對於!=，建議使用Q查詢，更不容易出錯。可以使用雙下划線對OneToOne、OneToMany、ManyToMany進行關聯查詢和反向關聯查詢，而且方法都是一樣的，如：

>>> Entry.objects.filter(blog__name='Beatles Blog') #限定外鍵表的字段

#下面是反向連接，不過要注意，這里不是entry_set，entry_set是Blog instance的一個屬性，代表某個Blog object

#的關聯的所有entry，而QuerySet的方法中反向連接是直接用model的小寫，不要把兩者搞混。It works backwards,

#too. To refer to a “reverse” relationship, just use the lowercase name of the model.

>>> Blog.objects.filter(entry__headline__contains='Lennon')

>>> Blog.objects.filter(entry__authors__name='Lennon') #ManyToMany關系，反向連接

>>> myblog = Blog.objects.get(id=1)

>>> Entry.objects.filter(blog=myblog) #正向連接。與下面一句等價，既可以用實體，也可以用

#實體的主鍵，其實即使用實體，也是只用實體的主鍵而已。這兩種方式對OneToOne、

#OneToMany、ManyToMany的正向、反向連接都適用。

>>> Entry.objects.filter(blog=1) #我個人不建議這樣用，對於create()，不支持這種用法

>>> myentry = Entry.objects.get(id=1)

>>> Blog.objects.filter(entry=myentry) #ManyToMany反向連接。與下面兩種方法等價

>>> Blog.objects.filter(entry=1)

>>> Blog.objects.filter(entry_id=1) #適用於OneToOne和OneToMany的正向連接

OneToOne的關系也是這樣關聯查詢，可以看到，Django對OneToOne、OneToMany、ManyToMany關聯查詢及其反向關聯查詢提供了相同的方式，真是牛逼啊。對於OneToOne、OneToMany的主表，也可以使用下面的方式

Entry.objects.filter(blog_id=1)，因為blog_id是數據庫表Entry的一個字段，這條語句與Entry.objects.filter(blog=blog1)生成的SQL是完全相同的。

與filter類似的還有exclude(**kwargs)方法，這個方法是剔除，相當於select-from-where not。可以使用雙下划線對OneToOne、OneToMany、ManyToMany進行關聯查詢和反向關聯查詢，方法與filter()中的使用方法相同。

>>> Entry.objects.exclude(pub_date__gt=datetime.date(2005, 1, 3), headline='Hello')

轉為SQL為

SELECT *

FROM Entry

WHERE NOT (pub_date > '2005-1-3' AND headline = 'Hello')

(4)SQL其它關鍵字在django中的實現

在SQL中，很多關鍵詞在刪、改、查時都是可以用的，如order by、 like、in、join、union、and、or、not等等，我們以查詢為例，說一下django如何映射SQL的這些關鍵字的（查、刪、改中這些關鍵字的使用方法基本相同）。

No1 F類（無對應SQL關鍵字）

前面提到的filter/exclude中的查詢參數值都是常量，如果我們想比較model的兩個字段怎么辦呢？Django也提供了方法，F類，F類實例化時，參數也可以用雙下划線，也可以邏輯運算，如下

>>> from django.db.models import F

>>> Entry.objects.filter(n_comments__gt=F('n_pingbacks'))

>>> from datetime import timedelta

>>> Entry.objects.filter(mod_date__gt=F('pub_date') + timedelta(days=3))

>>> Entry.objects.filter(authors__name=F('blog__name'))

No2 Q類（對應and/or/not）

如果有or等邏輯關系呢，那就用Q類，filter中的條件可以是Q對象與非Q查詢混和使用，但不建議這樣做，因為混和查詢時Q對象要放前面，這樣就有難免忘記順序而出錯，所以如果使用Q對象，那就全部用Q對象。Q對象也很簡單，就是把原來filter中的各個條件分別放在一個Q()即可，不過我們還可以使用或與非，分別對應符號為”|”和”&”和”~”，而且這些邏輯操作返回的還是一個Q對象，另外，逗號是各組條件的基本連接符，也是與的關系，其實可以用&代替（在python manage.py shell測試過，&代替逗號，執行的SQL是一樣的），不過那樣的話可讀性會很差，這與我們直接寫SQL時，各組條件and時用換行一樣，邏輯清晰。

from django.db.models import Q

>>> Poll.objects.get( Q(pub_date=date(2005, 5, 2)) | Q(pub_date=date(2005, 5, 6)),

question__startswith='Who') #正確，但不要這樣混用

>>> Poll.objects.get( Q(pub_date=date(2005, 5, 2)) | Q(pub_date=date(2005, 5, 6)),

Q(question__startswith='Who')) #推薦，全部是Q對象

>>> Poll.objects.get( (Q(pub_date=date(2005, 5, 2)) | Q(pub_date=date(2005, 5, 6)))&

Q(question__startswith='Who')) #與上面語句同意，&代替”,”，可讀性差

Q類中時應該可以用F類，待測試。

No3 annotate（無對應SQL關鍵字）

函數原型annotate(*args, **kwargs)

返回QuerySet

往每個QuerySet的model instance中加入一個或多個字段，字段值只能是聚合函數，因為使用annotate時，會用group by，所以只能用聚合函數。聚合函數可以像filter那樣關聯表，即在聚合函數中，Django對OneToOne、OneToMany、ManyToMany關聯查詢及其反向關聯提供了相同的方式，見下面例子。

>>> from django.contrib.auth.models import User

>>> from django.db.models import Count

#計算每個用戶的userjob數量，字段命名為ut_num，返回的QuerySet中的每個object都有

#這個字段。在UserJob中定義User為外鍵，在Job中定義與User是ManyToMany

>>> a = User.objects.filter(is_active=True, userjob__is_active=True). annotate(n=Count(‘userjob’)) #一對多反向連接

>>> b = User.objects.filter(is_active=True, job__is_active=True).annotate(n=Count(‘job__name’)) #多對多反向連接，User與Job是多對多

>>> len(a) #這里才會對a求值

>>> len(b) #這里才會對b求值

a對應的SQL語句為(SQL中沒有為表起別名,u、ut是我加的)：

select auth.user.*,Count(ut.id) as ut_num

from auth_user as u

left outer join job_userjob as ut on u.id = ut.user_id

where u.is_active=True and ut.is_active=True

group by u.*

b對應的SQL語句為(SQL中沒有為表起別名,u、t、r是我加的)：

select u.*,Count(t.name) as n

from auth_user as u

left outer join job_job_users as r on u.id=r.user_id

left outer join job_job as t on r.job_id=t.id

where t.is_active=True and u.is_active=True

group by u.*

No4 order_by——對應order by

函數原型 order_by(*fields)

返回QuerySet

正向的反向關聯表跟filter的方式一樣。如果直接用字段名，那就是升序asc排列；如果字段名前加-，就是降序desc

No5 distinct——對應distinct

原型 distinct()

一般與values()、values_list()連用，這時它返回ValuesQuerySet、ValuesListQuerySet

這個類跟列表很相似，它的每個元素是一個字典。它沒有參數（其實是有參數的，不過，參數只在PostgreSQL上起作用）。使用方法為

>>> a=Author.objects.values_list(name).distinct()

>>> b=Author.objects.values_list(name,email).distinct()

對應的SQL分別為

select distinct name

from Author

和

select distinct name,email

from Author

No6 values()和values_list()——對應‘select 某幾個字段’

函數原型values(*field), values_list(*field)

返回ValuesQuerySet, ValuesListQuerySet

Author.objects.filter(**kwargs)對應的SQL只返回主表（即Author表）的所有字段值，即使在查詢時關聯了其它表，關聯表的字段也不會返回，只有當我們通過Author instance用關聯表時，Django才會再次查詢數據庫獲取值。當我們不用Author instance的方法，且只想返回幾個字段時，就要用values()，它返回的是一個ValuesQuerySet對象，它類似於一個列表，不過，它的每個元素是字典。而values_list()跟values()相似，它返回的是一個ValuesListQuerySet，也類型於一個列表，不過它的元素不是字典，而是元組。一般的，當我們不需要model instance的方法且返回多個字段時，用values(*field)，而返回單個字段時用values_list(‘field’,flat=True)，這里flat=True是要求每個元素不是元組，而是單個值，見下面例子。而且我們可以返回關聯表的字段，用法跟filter中關聯表的方式完全相同。

>>> a = User.objects.values(‘id’,’username’,’userex__age’)

>>> type(a)

>>> a

[{‘id’:0,’username’:u’test0’,’ userex__age’: 20},{‘id’:1,’username’:u’test1’,’userex__age’: 25},

{‘id’:2,’username’:u’test2’, ’ userex__age’: 28}]

>>> b= User.objects.values_list(’username’,flat=True)

>>> b

[u’test0’, u’test1’ ,u’test2’]

No7 select_related()——對應返回關聯記錄實體

原型select_related(*filed)

返回QuerySet

它可以指定返回哪些關聯表model instance，這里的field跟filter()中的鍵一樣，可以用雙下划線，但也有不同，You can refer to any ForeignKey or OneToOneField relation in the list of fields passed to select_related()，QuerySet中的元素中的OneToOne關聯及外鍵對應的是都是關聯表的一條記錄，如my_entry=Entry.objects.get(id=1)，my_entry.blog就是關聯表的一條記錄的對象。select_related()不能用於OneToMany的反向連接，和ManyToMany，這些都是model的一條記錄對應關聯表中的多條記錄。前面提到了對於a = Author.objects.filter(**kwargs)這類語句，對應的SQL只返回主表，即Author的所有字段，並不會返回關聯表字段值，只有當我們使用關聯表時才會再查數據庫返回，但有些時候這樣做並不好。看下面兩段代碼，這兩段代碼在1.1中提到過。在代碼1中，在遍歷a前，先執行a對應的SQL，拿到數據后，然后再遍歷a，而遍歷過程中，每次都還要查詢數據庫獲取關聯表。代碼2中，當遍歷開始前，先拿到Entry的QuerySet，並且也拿到這個QuerySet的每個object中的blog對象，這樣遍歷過程中，就不用再查詢數據庫了，這樣就減少了數據庫讀次數。

代碼1

a = Entry.objects.all()

for e in a:

print (e.blog.name)

代碼2

a = Entry.objects.select_related('blog')

for e in a:

print (e.blog.name)

No8 prefetch_related(*field) ——對應返回關聯記錄實體的集合

函數原型prefetch_related(*field)

返回的是QuerySet

這里的field跟filter()中的鍵一樣，可以用雙下划線。用於OneToMany的反向連接，及ManyToMany。其實，prefetch_related()也能做select_related()的事情，但由於策略不同，可能相比select_related()要低效一些，所以建議還是各管各擅長的。select_related是用select ……join來返回關聯的表字段，而prefetch_related是用多條SQL語句的形式查詢，一般，后一條語句用IN來調用上一句話返回的結果。

class Restaurant(models.Model):

pizzas = models.ManyToMany(Pizza, related_name='restaurants')

best_pizza = models.ForeignKey(Pizza, related_name='championed_by')

>>> Restaurant.objects.prefetch_related('pizzas__toppings')

>>> Restaurant.objects.select_related('best_pizza').prefetch_related('best_pizza__toppings')

先用select_related查到best_pizza對象，再用prefetch_related 從best_pizza查出toppings

No9 extra()——實現復雜的where子句

函數原型：extra(select=None, where=None, params=None, tables=None, order_by=None, select_params=None)

基本上，查詢時用django提供的方法就夠用了，不過有時where子句中包含復雜的邏輯，這種情況下django提供的方法可能不容易做到，還好，django有extra()， extra()中直接寫一些SQL語句。不過，不同的數據庫用的SQL有些差異，所以盡可能不要用extra()。需要時再看使用方法吧。

No10 aggregate(*args, **kwargs)——對應聚合函數

參數為聚合函數，最好用**kwargs的形式，每個參數起一個名字。

該函數與annotate()有何區別呢？annotate相當於aggregate()和group by的結合，對每個group執行aggregate()函數。而單獨的aggregate()並沒有group by。

>>> from django.db.models import Count

>>> q = Blog.objects.aggregate(Count('entry')) #這是用*args的形式，最好不要這樣用

>>> q = Blog.objects.aggregate(number_of_entries=Count('entry')) #這是用**kwargs的形式

{'number_of_entries': 16}

至此，我們總結了QuerySet方法返回的數據形式，主要有五種。第一種：返回QuerySet，每個object只包含主表字段；第二種：返回QuerySet，每個object除了包含主表所有字段，還包含某些關聯表的object，這種情況要用select_related()和prefetch_related()，可以是任意深度（即任意多個雙下划線）的關聯，通常一層關聯和二層關聯用的比較多；第三種：返回ValuesQuerySet, ValuesListQuerySet，它們的每個元素包含若干主表和關聯表的字段，不包含任何實體和關聯實例，這種情況要用values()和values_list()；第四種：返回model instance；第五種:單個值，如aggregate()方法。

No11 exists()、count()、len()

如果只是想知道一個QuerySet是否為空，而不想獲取QuerySet中的每個元素，那就用exists()，它要比len()、count()、和直接進行if判斷效率高。如果只想知道一個QuerySet有多大，而不想獲取QuerySet中的每個元素，那就用count()；如果已經從數據庫獲取到了QuerySet，那就用len()

No12 contains/startswith/endswith——對應like

字段名加雙下划線，除了它，還有icontains，即Case-insensitive contains，這個是大小寫不敏感的，這需要相應數據庫的支持。有些數據庫需要設置

才能支持大小寫敏感。

No13 in——對應in

字段名加雙下划線

No14 exclude(field__in=iterable)——對應not in

iterable是可迭代對象

No15 gt/gte/lt/lte——對應於>,>=,<,<=

字段名加雙下划線

No16 range——對應於between and

字段名加雙下划線，range后面值是列表

No17 isnull——對應於is null

Entry.objects.filter(pub_date__isnull=True)對應的SQL為SELECT ... WHERE pub_date IS NULL;

No18 QuerySet切片——對應於limit

QuerySet的索引只能是非負整數，不支持負整數，所以QuerySet[-1]錯誤

a=Entry.objects.all()[5:10]

b=len(a)

執行Entry.objects.all()[5:8]，對於不同的數據庫，SQL語句不同，Sqlite 的SQL語句為select * from tablename limit 3 offset 5; MySQL的SQL語句為select * from tablename limit 5,3

參考資料：

1、https://docs.djangoproject.com/en/1.6/ref/models/querysets/

2、https://docs.djangoproject.com/en/1.6/topics/db/queries/

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 django框架 ORM,queryset 特點 Django ORM QuerySet集合對象的特性 django orm 中所有的方法（QuerySet對象的所有方法） Django ORM Queryset 的緩存機制, 惰性查詢簡述 ORM（三）QuerySet查詢字段操作 Django之QuerySet 查詢 Django（19）QuerySet API 【Django】QuerySet的分頁和排序 python項目Django(QuerySet) django queryset合並問題

Django ORM之QuerySet

1.QuerySet

1.1 簡介

I遍歷

II切片

III序列化，即Pickling

IV repr()

V len()

VI list()

VII bool()，判斷是否為空

1.2 QuerySet的方法

(1) 刪delete()

(2) 改 update()

(3)查詢 filter(**kwargs)、exclude(**kwargs)、get(**kwargs)

(4)SQL其它關鍵字在django中的實現

No1 F類（無對應SQL關鍵字）

No2 Q類（對應and/or/not）

No3 annotate（無對應SQL關鍵字）

No4 order_by——對應order by

No5 distinct——對應distinct

No6 values()和values_list()——對應‘select 某幾個字段’

No7 select_related()——對應返回關聯記錄實體

No8 prefetch_related(*field) ——對應返回關聯記錄實體的集合

No9 extra()——實現復雜的where子句

No10 aggregate(*args, **kwargs)——對應聚合函數

No11 exists()、count()、len()

No12 contains/startswith/endswith——對應like

No13 in——對應in

No14 exclude(field__in=iterable)——對應not in

No15 gt/gte/lt/lte——對應於>,>=,<,<=

No16 range——對應於between and

No17 isnull——對應於is null

No18 QuerySet切片——對應於limit

免責聲明！

(3)查詢 filter(kwargs)、exclude(kwargs)、get(**kwargs)