Django模型驗證器詳解和源碼分析


轉發請注明來源

在Django的模型字段參數中,有一個參數叫做validators,這個參數是用來指定當前字段需要使用的驗證器,也就是對字段數據的合法性進行驗證,比如大小、類型等。

Django的驗證器可以分為模型相關的驗證器和表單相關的驗證器,它們基本類似,但在使用上有區別。

本文討論的是模型相關的驗證器。

一、自定義驗證器

一個驗證器其實就是一個可調用的對象(函數或類),接收一個初始輸入值作為參數,對這個值進行一系列邏輯判斷,如果不滿足某些規則或者條件,則表示驗證不通過,拋出一個ValidationError異常。如果滿足條件則通過驗證,不返回任何內容(也就是默認的return None),可以繼續下一步。

驗證器具有重要作用,可以被重用在別的字段上,是工具類型的邏輯封裝。

下面是一個驗證器的例子,它只允許偶數通過驗證:

from django.core.exceptions import ValidationError
from django.utils.translation import gettext_lazy as _

def validate_even(value):
    if value % 2 != 0:
        raise ValidationError(
            _('%(value)s is not an even number'),
            params={'value': value},
        )

通過下面的方式,將偶數驗證器應用在字段上:

from django.db import models

class MyModel(models.Model):
    even_field = models.IntegerField(validators=[validate_even])

因為驗證器運行之前,(輸入的)數據會被轉換為 Python 對象,因此我們可以將同樣的驗證器用在 Django form 表單中(事實上Django為表單提供了另外一些驗證器):

from django import forms

class MyForm(forms.Form):
    even_field = forms.IntegerField(validators=[validate_even])

你還可以通過Python的魔法方法__cal__()編寫更復雜的可配置的驗證器,比如Django內置的RegexValidator驗證器就是這么干的。

驗證器也可以是一個類,但這時候就比較復雜了,需要確保它可以被遷移框架序列化,確保編寫了deconstruction()__eq__()方法。這種做法很難找到參考文獻和博文,要靠自己摸索或者研究DJango源碼。

二、工作機制

讓我們來測試一下上面寫的驗證器:

>>> from .models import MyModel
>>> a = MyModel.objects.create(even_field=3)
>>> a
<MyModel: MyModel object (1)>
>>> a.even_field
3

什么?!!!不是說只有偶數才能通過驗證嗎?這里我提供了數字3,可是為什么創建成功了??

我們接着在admin站點中注冊MyModel模型,然后在圖形化界面后台中創建MyModel的實例,你會發現這個時候驗證器起作用了,奇數是無法通過表單驗證的!

為什么會這樣??

這就要從Django的源碼說起!

Django是這么設計的:

  • 模型的驗證器不會在調用save()方法的時候自動執行
  • 表單的驗證器會在調用save()方法的時候自動執行

為什么這么設計?個人猜測,Django官方為了序列化、鏈式調用等功能的兼容性,沒有自動進行驗證操作。

這個設計在源碼中是怎么體現的?

  • Django的模型相關源碼中,沒有is_valid()方法,也不會自動調用full_clean() 方法,所以Django不會自動進行模型驗證。但是它依然提供了四個重要的驗證方法,也就是full_clean()clean_fields()clean()validate_unique(),一會細說
  • Django的表單系統forms的相關源碼中,表單在save之前會自動執行一個is_valid()方法,這個方法里會調用驗證器。

表單的內容在其它章節中講解。

下面介紹Django模型的驗證步驟和四個方法:

模型驗證的步驟:

  1. 如果你手動調用了full_clean()方法,那么會依次自動調用下面的三個方法
  2. clean_fields():驗證各個字段的合法性
  3. clean():驗證模型級別的合法性
  4. validate_unique():驗證字段的獨一無二性

本質上,后面三個方法是具體實現,full_clean()是領頭羊,實際操作中,你完全可以具體使用其中一個或多個。用了full_clean()就等於后面三個都用。

full_clean()

簽名:Model.full_clean(exclude=None, validate_unique=True)

  • exclude用於指定某些字段不進行驗證,也就是所謂的例外字段
  • validate_unique用於指定是否調用validate_unique()方法

讓我們看下它的源代碼:

    def full_clean(self, exclude=None, validate_unique=True):

        errors = {}
        if exclude is None:
            exclude = []
        else:
            exclude = list(exclude)

        try:
            self.clean_fields(exclude=exclude)    #1
        except ValidationError as e:
            errors = e.update_error_dict(errors)

        try:
            self.clean()    #2
        except ValidationError as e:
            errors = e.update_error_dict(errors)

        if validate_unique:
            for name in errors:
                if name != NON_FIELD_ERRORS and name not in exclude:
                    exclude.append(name)
            try:
                self.validate_unique(exclude=exclude)   #3
            except ValidationError as e:
                errors = e.update_error_dict(errors)

        if errors:
            raise ValidationError(errors)

可以看出,它依次調用了其它三個方法,如果最后的errors中有內容,則拋出ValidationError異常。

我們最好不要去修改full_clean()方法的源代碼,一般也不用重寫它,直接調用即可。

模型的save()方法不會自動調用full_clean()方法,你必須手動調用。

如果調用驗證器后,拋出ValidationError異常,Django會將所有的異常信息放置在e.message_dict字典中供使用。比如下面的例子:

# 在視圖中我們可以這么做
from django.core.exceptions import ValidationError
try:
    article.full_clean()
except ValidationError as e:
    # 在這里做一些異常處理操作
    pass

在模型定義中我們可以如下重寫save()方法,實現自動驗證功能,不需要在視圖中反復調用了:

# models.py
from django.core.exceptions import ValidationError
from django.utils.translation import gettext_lazy as _

def validate_even(value):
    if value % 2 != 0:
        raise ValidationError(
            _('%(value)s is not an even number'),
            params={'value': value},
        )
       
from django.db import models

class MyModel(models.Model):
    even_field = models.IntegerField(validators=[validate_even])

    def save(self, *args, **kwargs):   # 重寫save方法是關鍵
        try:
            self.full_clean()   
            super().save(*args, **kwargs)
        except ValidationError as e:
            print('模型驗證沒通過: %s' % e.message_dict)

執行過程展示:

>>> from .models import MyModel
>>> a = MyModel.objects.create(even_field=5)
模型驗證沒通過:  {'even_field': ['5 is not an even number']}

這樣,我們就實現了自動的模型驗證。

小技巧:可以通過打印e來查看,Django怎么封裝的錯誤信息,給我們提供了哪些鍵值,比如上例中,我們可以使用e.message_dict['even_field']

clean_fields()

簽名:Model.clean_fields(exclude=None)

參數同上,看下它的源代碼:

    def clean_fields(self, exclude=None):

        if exclude is None:
            exclude = []

        errors = {}
        for f in self._meta.fields:
            if f.name in exclude:
                continue

            raw_value = getattr(self, f.attname)
            if f.blank and raw_value in f.empty_values:
                continue
            try:
                setattr(self, f.attname, f.clean(raw_value, self))  #核心是這一句
            except ValidationError as e:
                errors[f.name] = e.error_list

        if errors:
            raise ValidationError(errors)

我們最好也不要去修改和重寫它的源代碼。

這個方法本質上就是循環模型中的所有字段,找出其中定義了驗證器的那些,並執行它們。

我們前面自定義的偶數驗證器,其實就是在這里被調用的。

clean()

這個方法很特別,我們看看它的源代碼:

    def clean(self):
        """
        Hook for doing any extra model-wide validation after clean() has been
        called on every field by self.clean_fields. Any ValidationError raised
        by this method will not be associated with a particular field; it will
        have a special-case association with the field defined by NON_FIELD_ERRORS.
        """
        pass

什么都沒有!實際上,這個方法是給你留了個鈎子,你需要重寫它,然后在里面編寫模型級別的驗證,比如修改模型的屬性,以及跨字段相關的驗證邏輯。

下面我們通過一個例子來展示它的用法:

import datetime
from django.core.exceptions import ValidationError
from django.db import models
from django.utils.translation import gettext_lazy as _

class Article(models.Model):
    content = models.TextField()
    status = models.CharField(max_length=32)
    pub_date = models.DateField(blank=True, null=True)

    def clean(self):
        # 不允許草稿文章具有發布日期字段
        if self.status == '草稿' and self.pub_date is not None:
            raise ValidationError(_('草稿文章尚未發布,不應該有發布日期!'))
        # 如果已發布的文章還沒有設置發布日期,則將發布日期設置為當天
        if self.status == '已發布' and self.pub_date is None:
            self.pub_date = datetime.date.today()

# 更多Django技術文章請訪問https://www.liujiangblog.com

說明:

  • gettext_lazy在這里無關緊要
  • 在Article模型中重寫了clean方法,它不需要接受其它參數
  • 第一個if判斷,不允許草稿文章具有發布日期字段。如果你提供了,對不起,拋出ValidationError異常
  • 第二個if判斷,如果已發布的文章還沒有設置發布日期,則將發布日期設置為當天
  • 這是一個跨字段的,全局性的驗證方法,它不像我們一開始自定義的驗證器那樣,不是作為一個驗證器參數進行提供,而是寫在clean方法中了,一定要注意區別。

clean()方法寫好了,我們就可以在Article模型中重寫save()方法了:

    def save(self, *args, **kwargs):

        from django.core.exceptions import NON_FIELD_ERRORS

        try:
            self.full_clean()
            super().save(*args, **kwargs)
        except ValidationError as e:
            print('驗證沒通過: %s' % e.message_dict[NON_FIELD_ERRORS])

注意:這里我們導入了NON_FIELD_ERRORS,在最后打印了e.message_dict[NON_FIELD_ERRORS],這是為什么呢?

因為,clean()中編寫的都是模型級別、跨字段的驗證方法,沒有具體和某個字段綁定,所以Django提供了一個NON_FIELD_ERRORS關鍵字,用來說明這不是某個字段引起的異常,而是非字段相關的錯誤。

如果你非要將錯誤定位到某個具體的字段,也不是不可以的,如下例子所示:

class Article(models.Model):
    ...
    def clean(self):
        if self.status == '草稿' and self.pub_date is not None:
            raise ValidationError({'pub_date': _('草稿文章尚未發布,不應該有發布日期!')})
        ...

甚至,你可以如下方式,映射字段和錯誤信息:

raise ValidationError({
    'title': ValidationError(_('Missing title.'), code='required'),
    'pub_date': ValidationError(_('Invalid date.'), code='invalid'),
})

這些技巧,本質上就是給ValidationError異常類提供信息參數。

validate_unique()

簽名:Model.validate_unique(exclude=None)

它的源代碼也很簡單:

    def validate_unique(self, exclude=None):

        unique_checks, date_checks = self._get_unique_checks(exclude=exclude)

        errors = self._perform_unique_checks(unique_checks)
        date_errors = self._perform_date_checks(date_checks)

        for k, v in date_errors.items():
            errors.setdefault(k, []).extend(v)

        if errors:
            raise ValidationError(errors)

這個方法類似clean_fields(),只不過它只用來驗證模型中的唯一性約束是否滿足,而不是字段的值是否滿足驗證需求。

如果你提供了exclude參數,那么該參數包含的所有字段都不會進行唯一性驗證。

我們最好也不要去修改和重寫它的源代碼。

總結

Django中模型驗證器的使用套路:

  • 編寫字段級別的驗證器,在字段中作為參數指定
  • 或者編寫clean()方法,實現模型級別、跨字段的驗證功能
  • 重寫save()方法,調用full_clean(),實現全自動的驗證
  • 或者在視圖中,通過模型實例調用full_clean()方法,實現手動驗證

三、內置驗證器

驗證器的作用很重要,需求也很廣泛,Django為此內置了一些驗證器,我們直接拿來使用即可:

RegexValidator

這是正則匹配驗證器。用於對輸入的值進行正則搜索,如果命中,則平安無事,如果沒命中則彈出 ValidationError 異常。

數字簽名:class RegexValidator(regex=None, message=None, code=None, inverse_match=None, flags=0)

參數說明:

  • regex:用於匹配的正則表達式
  • message:自定義異常錯誤信息。默認是"Enter a valid value"
  • code:自定義錯誤碼。默認是"invalid"
  • inverse_match:將通過和不通過驗證的判斷邏輯反轉。也就是未命中則平安,命中則出錯。
  • flags:編譯正則表達式時使用的正則flags。默認為0。

EmailValidator

數字簽名:class EmailValidator(message=None, code=None, whitelist=None)

郵件格式驗證器。

參數說明:

  • message: 自定義錯誤信息,默認為 "Enter a valid email address"。
  • code: 自定義錯誤碼,默認為"invalid"。
  • whitelist:郵件域名白名單,默認為['localhost']

URLValidator

數字簽名:class URLValidator(schemes=None, regex=None, message=None, code=None)

RegexValidator的子類,用於驗證url的格式是否正確。

schemes:指定URL/URI的協議模式,默認值為['http', 'https', 'ftp', 'ftps']

validate_email

EmailValidator的一個實例,未做任何自定義。

validate_slug

一個確保輸入值是字母、數字、下划線和連字符組合的RegexValidator的實例。

validate_unicode_slug

上面的Unicode編碼版本

validate_ipv4_address

一個RegexValidator的實例,用於判斷輸入值是否為ipv4格式

validate_ipv6_address

上面的ipv6版本

validate_ipv46_address

同時支持ipv4和ipv6

validate_comma_separated_integer_list

判斷輸入是否是一個以逗號分隔的數字列表,一個RegexValidator的實例。

int_list_validator

數字簽名:int_list_validator(sep=', ', message=None, code='invalid', allow_negative=False)

判斷一個由數字組成的字符串是否以指定的sep分隔。allow_negative用於反轉判斷邏輯。

MaxValueValidator

簽名:class MaxValueValidator(limit_value, message=None)

是否超過指定最大值

MinValueValidator

簽名:class MinValueValidator(limit_value, message=None)

是否小於指定的最小值

MaxLengthValidator

簽名:class MaxLengthValidator(limit_value, message=None)

輸入值的長度是否超過限定值

MinLengthValidator

輸入值的長度是否小於限定值

DecimalValidator

簽名:lass DecimalValidator(max_digits, decimal_places)

數字驗證器。當發生下面情況時彈出異常:

  • 輸入值超過max_digits
  • 輸入值的位數超過decimal_places
  • 輸入值大於最大位數與小數位數之差。(待確認)

FileExtensionValidator

簽名:class FileExtensionValidator(allowed_extensions, message, code)

文件擴展名不在合法性列表中。合法性列表通過參數allowed_extensions指定。

validate_image_file_extension

通過pillow庫確定一個圖片文件的擴展名是合法的

ProhibitNullCharactersValidator

簽名:class ProhibitNullCharactersValidator(message=None, code=None)

對輸入值進行 str(value) 操作,轉換成字符串,然后如果這個字符串中包含1個以上的空字符'\x00',則驗證失敗。

更多特性請參考官方文檔


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM