Django進階之QuerySet和中介模型


QuerySet

  QuerySet是查詢集,就是傳到服務器上的url里面的查詢內容。其形態類似於Python的列表,列表中的元素是QuerySet對象。支持大部分列表的內置方法。

可切片

  QuerySet可以使用Python 的切片語法來限制查詢集記錄的數目 ,它等同於SQL 的limit和offset語句。通常,查詢集 的切片返回一個新的查詢集 ,但它不會執行查詢。

注意:QuerySet的索引不支持負索引,不可以用[ :-1]

Book.object.all()[0:5]#顧頭不顧尾

 

可迭代

  如Python中的列表一樣,QuerySet也支持迭代,可以用for循環進行遍歷取值

articleList=models.Article.objects.all()

for article in articleList:
    print(article.title)

 

惰性查詢

  查詢集是惰性執行的 ——Django會對查詢返回的結果集QuerySet進行緩存,這是為了提高效率。也就是說在創建一個QuerySet對象的時候,Django並不會立即向數據庫發出查詢命令,只有在需要用到這個QuerySet的時候Django 才會真正運行這個查詢。

queryResult=models.Article.objects.all() # 不走數據庫
 
print(queryResult) # 進行數據庫查詢操作
 
for article in queryResult:
    print(article.title)    # 會進行數據庫查詢

 

緩存機制

  每個查詢集都包含一個緩存來最小化對數據庫的訪問。理解它是如何工作的可以幫我們編寫最高效的代碼。

  在一個新創建的查詢集中,緩存為空。首次對查詢集進行求值 —— 同時發生數據庫查詢 ——Django 將保存查詢的結果到查詢集的緩存中並返回明確請求的結果(例如,如果正在迭代查詢集,則返回下一個結果)。接下來對該查詢集的求值將重用緩存的結果。

  請牢記這個緩存行為,因為對查詢集使用不當的話,它會坑你的。例如,下面的語句創建兩個查詢集,對它們求值后內存中不會進行緩存:

print([a.title for a in models.Article.objects.all()])
print([a.create_time for a in models.Article.objects.all()])

  這意味着相同的數據庫查詢將執行兩次,顯然倍增了數據庫的負載。同時,還有可能兩個結果列表並不包含相同的數據庫記錄,因為在兩次請求期間有可能有Article被添加進來或刪除掉。為了避免這個問題,只需保存查詢集並重新使用它:

queryResult=models.Article.objects.all()
print([a.title for a in queryResult])
print([a.create_time for a in queryResult])

那么,什么時候查詢集才不會被緩存呢?

  查詢集不會永遠緩存它們的結果。當只對查詢集的部分進行求值時會檢查緩存, 如果這個部分不在緩存中,那么接下來查詢返回的記錄都將不會被緩存。所以,這意味着使用切片或索引來限制查詢集將不會填充緩存。

#重復獲取查詢集對象中一個特定的索引將每次都查詢數據庫:
queryset = Entry.objects.all()
print queryset[5] # Queries the database
print queryset[5] # Queries the database again

#如果已經對全部查詢集求值過,則將檢查緩存:
queryset = Entry.objects.all()
[entry for entry in queryset] # Queries the database
print queryset[5] # Uses cache
print queryset[5] # Uses cache

#下面是一些其它例子,它們會使得全部的查詢集被求值並填充到緩存中:
[entry for entry in queryset]
bool(queryset)
 entry in queryset
 list(queryset)

#注:簡單地打印查詢集不會填充緩存。
queryResult=models.Article.objects.all()
print(queryResult) #  hits database
print(queryResult) #  hits database

 

exists()與iterator()

exists()

  簡單的使用if語句進行判斷也會完全執行整個QuerySet並且把數據放入內存,雖然我們可能並不需要這些 數據!為了避免這個,可以用exists()方法來檢查是否有數據:

if queryResult.exists():
    #SELECT (1) AS "a" FROM "blog_article" LIMIT 1; args=()
        print("exists...")

 

iterator()

  當QuerySet非常巨大時,緩存會成為問題。

  處理成千上萬的記錄時,將它們一次裝入內存是很浪費的。更糟糕的是,巨大的QuerySet可能會鎖住系統進程,使得程序瀕臨崩潰。所以我們要避免在遍歷數據的同時產生QuerySet緩存,可以使用iterator()方法來獲取數據,處理完數據就將其丟棄。

objs = Book.objects.all().iterator()
# iterator()可以一次只從數據庫獲取少量數據,這樣可以節省內存
for obj in objs:
    print(obj.title)
#但是再次遍歷的話不會打印,因為迭代器已經在上一次遍歷(next)到最后一次了,沒得遍歷了
for obj in objs:
    print(obj.title)

  當然,使用iterator()方法來防止生成緩存意味着遍歷同一個QuerySet時會重復進行數據庫操作執行查詢。所以使用iterator()的時候要確保代碼在操作一個大的QuerySet時沒有重復執行查詢。

 

總結:

  QuerySet的cache是用於減少程序對數據庫的查詢,在通常的使用下會保證只有在需要的時候才會查詢數據庫。 使用exists()和iterator()方法可以優化程序對內存的使用。不過,由於它們並不會生成緩存,可能會造成額外的數據庫查詢。 

 

 

中介模型

  處理類似搭配 pizza 和 topping 這樣簡單的多對多關系時,使用標准的ManyToManyField  就可以了。但是,有時可能需要關聯數據到兩個模型之間的關系上。

  例如,有這樣一個應用,它記錄音樂家所屬的音樂小組。我們可以用一個ManyToManyField 表示小組和成員之間的多對多關系。但是,有時你可能想知道更多成員關系的細節,比如成員是何時加入小組的。對於這些情況,我們可以用中介模型來定義多對多關系(即自己創建多對多產生的第三張關系表)。 你可以將其他字段放在中介模型里面。源模型的ManyToMany 字段將使用through參數指向中介模型。

對於上面的音樂小組的例子,代碼如下:

from django.db import models
 
class Person(models.Model):
    name = models.CharField(max_length=128)
    def __str__(self):              # __unicode__ on Python 2
        return self.name
 
class Group(models.Model):
    name = models.CharField(max_length=128)
    members = models.ManyToManyField(Person, through='Membership')
#外鍵建在多的一方,through參數表示通過自定義的第三張表作為關系表
 
    def __str__(self):         
        return self.name
 
class Membership(models.Model):#中介模型(自定義的第三張表)
    person = models.ForeignKey(Person)
    group = models.ForeignKey(Group)
    date_joined = models.DateField()#自定義屬性
    invite_reason = models.CharField(max_length=64)#自定義屬性

  有了中介模型以后,我們就不能用簡單的add和create來創建關系,因為你不能只創建 Person和 Group之間的關聯關系,你還要指定 Membership模型中所需要的所有信息;而簡單的addcreate 和賦值語句是做不到這一點的。所以它們不能在使用中介模型的多對多關系中使用。同樣、也不能用remove來解除表之間的關系,但是可以用clear。

我們要創建多對多的關系,得用以下示例:

ringo = Person.objects.create(name="Ringo Starr")
paul = Person.objects.create(name="Paul McCartney")
beatles = Group.objects.create(name="The Beatles")
m1 = Membership(person=ringo, group=beatles,date_joined=date(1962, 8, 16),invite_reason="Needed a new drummer.")
m1.save()

print(beatles.members.all())#[<Person: Ringo Starr>]
print( ringo.group_set.all())#[<Group: The Beatles>]

m2 = Membership.objects.create(person=paul, group=beatles, date_joined=date(1960, 8, 1),invite_reason="Wanted to form a band.")

print(beatles.members.all())#[<Person: Ringo Starr>, <Person: Paul McCartney>]

beatles.members.clear()#解除關系


#以下方法不可用
beatles.members.add(john)
beatles.members.create(name="George Harrison")
beatles.members = [john, paul, ringo, george]

 

 

 

 

 

 

                               


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM