normalize,字面意思就是正規化 加入space 大概意思就是空格的處理了
官方解釋是這樣的:
通過去掉前導和尾隨空白並使用單個空格替換一系列空白字符,使空白標准化。如果省略了該參數,上下文節點的字符串值將標准化並返回。
剛好在實際項目中碰到了這樣的一個問題,
定位一個下來的時候,最開始的時候是這樣寫的:
li.xpath("./td[2]/text()").extract_first()
但是,每次點擊后 class的值便會增加一個空格,這樣class=' '這個就無法定位了,后來在同事的指導下,引入了normalize-space這個關鍵字
修改后的寫法就是
li.xpath("normalize-space(./td[2]/text())").extract_first()
這樣就搞定了 對於我目前的項目來說很實用
