Django進階之QuerySet和中介模型

本文轉載自查看原文 2017-10-24 16:25 1060 Django / Flask / RestFramework

QuerySet

　　QuerySet是查詢集，就是傳到服務器上的url里面的查詢內容。其形態類似於Python的列表，列表中的元素是QuerySet對象。支持大部分列表的內置方法。

可切片

　　QuerySet可以使用Python 的切片語法來限制查詢集記錄的數目，它等同於SQL 的limit和offset語句。通常，查詢集 的切片返回一個新的查詢集 ，但它不會執行查詢。

注意：QuerySet的索引不支持負索引，不可以用[ :-1]

Book.object.all()[0:5]#顧頭不顧尾

可迭代

　　如Python中的列表一樣，QuerySet也支持迭代，可以用for循環進行遍歷取值

articleList=models.Article.objects.all()

for article in articleList:
    print(article.title)

惰性查詢

　　查詢集是惰性執行的 ——Django會對查詢返回的結果集QuerySet進行緩存，這是為了提高效率。也就是說在創建一個QuerySet對象的時候，Django並不會立即向數據庫發出查詢命令，只有在需要用到這個QuerySet的時候Django 才會真正運行這個查詢。

queryResult=models.Article.objects.all() # 不走數據庫
 
print(queryResult) # 進行數據庫查詢操作
 
for article in queryResult:
    print(article.title)    # 會進行數據庫查詢

緩存機制

　　每個查詢集都包含一個緩存來最小化對數據庫的訪問。理解它是如何工作的可以幫我們編寫最高效的代碼。

　　在一個新創建的查詢集中，緩存為空。首次對查詢集進行求值 —— 同時發生數據庫查詢 ——Django 將保存查詢的結果到查詢集的緩存中並返回明確請求的結果（例如，如果正在迭代查詢集，則返回下一個結果）。接下來對該查詢集的求值將重用緩存的結果。

　　請牢記這個緩存行為，因為對查詢集使用不當的話，它會坑你的。例如，下面的語句創建兩個查詢集，對它們求值后內存中不會進行緩存：

print([a.title for a in models.Article.objects.all()])
print([a.create_time for a in models.Article.objects.all()])

　　這意味着相同的數據庫查詢將執行兩次，顯然倍增了數據庫的負載。同時，還有可能兩個結果列表並不包含相同的數據庫記錄，因為在兩次請求期間有可能有Article被添加進來或刪除掉。為了避免這個問題，只需保存查詢集並重新使用它：

queryResult=models.Article.objects.all()
print([a.title for a in queryResult])
print([a.create_time for a in queryResult])

那么，什么時候查詢集才不會被緩存呢？

　　查詢集不會永遠緩存它們的結果。當只對查詢集的部分進行求值時會檢查緩存，如果這個部分不在緩存中，那么接下來查詢返回的記錄都將不會被緩存。所以，這意味着使用切片或索引來限制查詢集將不會填充緩存。

#重復獲取查詢集對象中一個特定的索引將每次都查詢數據庫：
queryset = Entry.objects.all()
print queryset[5] # Queries the database
print queryset[5] # Queries the database again

#如果已經對全部查詢集求值過，則將檢查緩存：
queryset = Entry.objects.all()
[entry for entry in queryset] # Queries the database
print queryset[5] # Uses cache
print queryset[5] # Uses cache

#下面是一些其它例子，它們會使得全部的查詢集被求值並填充到緩存中：
[entry for entry in queryset]
bool(queryset)
 entry in queryset
 list(queryset)

#注：簡單地打印查詢集不會填充緩存。
queryResult=models.Article.objects.all()
print(queryResult) #  hits database
print(queryResult) #  hits database

exists()與iterator()

exists()

　　簡單的使用if語句進行判斷也會完全執行整個QuerySet並且把數據放入內存，雖然我們可能並不需要這些數據！為了避免這個，可以用exists()方法來檢查是否有數據：

if queryResult.exists():
    #SELECT (1) AS "a" FROM "blog_article" LIMIT 1; args=()
        print("exists...")

iterator()

　　當QuerySet非常巨大時，緩存會成為問題。

　　處理成千上萬的記錄時，將它們一次裝入內存是很浪費的。更糟糕的是，巨大的QuerySet可能會鎖住系統進程，使得程序瀕臨崩潰。所以我們要避免在遍歷數據的同時產生QuerySet緩存，可以使用iterator()方法來獲取數據，處理完數據就將其丟棄。

objs = Book.objects.all().iterator()
# iterator()可以一次只從數據庫獲取少量數據，這樣可以節省內存
for obj in objs:
    print(obj.title)
#但是再次遍歷的話不會打印,因為迭代器已經在上一次遍歷(next)到最后一次了,沒得遍歷了
for obj in objs:
    print(obj.title)

　　當然，使用iterator()方法來防止生成緩存意味着遍歷同一個QuerySet時會重復進行數據庫操作執行查詢。所以使用iterator()的時候要確保代碼在操作一個大的QuerySet時沒有重復執行查詢。

總結:

　　QuerySet的cache是用於減少程序對數據庫的查詢，在通常的使用下會保證只有在需要的時候才會查詢數據庫。使用exists()和iterator()方法可以優化程序對內存的使用。不過，由於它們並不會生成緩存，可能會造成額外的數據庫查詢。　

中介模型

　　處理類似搭配 pizza 和 topping 這樣簡單的多對多關系時，使用標准的ManyToManyField 就可以了。但是，有時可能需要關聯數據到兩個模型之間的關系上。

　　例如，有這樣一個應用，它記錄音樂家所屬的音樂小組。我們可以用一個ManyToManyField 表示小組和成員之間的多對多關系。但是，有時你可能想知道更多成員關系的細節，比如成員是何時加入小組的。對於這些情況，我們可以用中介模型來定義多對多關系（即自己創建多對多產生的第三張關系表）。你可以將其他字段放在中介模型里面。源模型的ManyToMany 字段將使用through參數指向中介模型。

對於上面的音樂小組的例子，代碼如下：

from django.db import models
 
class Person(models.Model):
    name = models.CharField(max_length=128)
    def __str__(self):              # __unicode__ on Python 2
        return self.name
 
class Group(models.Model):
    name = models.CharField(max_length=128)
    members = models.ManyToManyField(Person, through='Membership')
#外鍵建在多的一方，through參數表示通過自定義的第三張表作為關系表
 
    def __str__(self):         
        return self.name
 
class Membership(models.Model):#中介模型（自定義的第三張表）
    person = models.ForeignKey(Person)
    group = models.ForeignKey(Group)
    date_joined = models.DateField()#自定義屬性
    invite_reason = models.CharField(max_length=64)#自定義屬性

　　有了中介模型以后，我們就不能用簡單的add和create來創建關系，因為你不能只創建 Person和 Group之間的關聯關系，你還要指定 Membership模型中所需要的所有信息；而簡單的add、create 和賦值語句是做不到這一點的。所以它們不能在使用中介模型的多對多關系中使用。同樣、也不能用remove來解除表之間的關系，但是可以用clear。

我們要創建多對多的關系，得用以下示例：

ringo = Person.objects.create(name="Ringo Starr")
paul = Person.objects.create(name="Paul McCartney")
beatles = Group.objects.create(name="The Beatles")
m1 = Membership(person=ringo, group=beatles,date_joined=date(1962, 8, 16),invite_reason="Needed a new drummer.")
m1.save()

print(beatles.members.all())#[<Person: Ringo Starr>]
print( ringo.group_set.all())#[<Group: The Beatles>]

m2 = Membership.objects.create(person=paul, group=beatles, date_joined=date(1960, 8, 1),invite_reason="Wanted to form a band.")

print(beatles.members.all())#[<Person: Ringo Starr>, <Person: Paul McCartney>]

beatles.members.clear()#解除關系


#以下方法不可用
beatles.members.add(john)
beatles.members.create(name="George Harrison")
beatles.members = [john, paul, ringo, george]

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Django進階-QuerySet篇 Django-model進階(中介模型，查詢優化，extra,整體插入) Django筆記 —— 模型高級進階 Django之QuerySet 查詢 Django（19）QuerySet API 【Django】QuerySet的分頁和排序 python項目Django(QuerySet) django queryset合並問題 django學習之Model（三）QuerySet Django中的QuerySet