如何給列表降維?sum()函數的妙用


 

上個月,學習群里的 S 同學問了個題目,大意可理解為列表降維 ,例子如下:

oldlist = [[1, 2, 3], [4, 5]]

# 想得到結果:
newlist = [1, 2, 3, 4, 5]

原始數據是一個二維列表,目的是獲取該列表中所有元素的具體值。從抽象一點的角度來理解,也可看作是列表解壓或者列表降維。

這個問題並不難,但是,怎么寫才比較優雅呢?

# 方法一,粗暴拼接法:
newlist = oldlist[0] + oldlist[1]

這種方法簡單粗暴,需要拼接什么內容,就取出來直接拼接。然而,如果原列表有很多子列表,則這個方法就會變得繁瑣了。

我們把原問題升級一下:一個二維列表包含 n 個一維列表元素,如何優雅地把這些子列表拼成一個新的一維列表?

方法一的做法需要寫 n 個對象,以及 n - 1 次拼接操作。當然不可行。下面看看方法二:

# 方法二,列表推導式:
newlist = [i for j in range(len(oldlist)) for i in oldlist[j]]

這個表達式中出現了兩個 for 語句,在第一個 for 語句中,我們先取出原列表的長度,然后構造 range 對象,此時 j 的取值范圍是 [0, n-1] 的閉區間。

在第二個 for 語句中,oldlist[j] 指的正是原列表的第 j 個子列表,for i in oldlist[j] 則會遍歷取出 j 子列表的元素,由於 j 取值的區間正對應於原列表的全部索引值,所以,最終達到解題目的。

這種方法足夠優雅了,而且理解也並不難。

然而,我們是否就能滿足於此了呢?有沒有其它奇技淫巧,哦不,是其它高級方法呢?F 同學貢獻了一個思路:

# 方法三,巧用sum:
newlist = sum(oldlist,[])

說實話,這個方法令我大感意外!sum() 函數不是用於求和的么?怎么竟然有此用法?

這個寫法利用了什么原理呢?由於我開始時不知道 sum() 函數可以接收兩個參數,不清楚它們是怎么用於計算的,所以一度很困惑。但是,當我知道 sum() 的完整用法時,我恍然大悟。

接下來也不賣關子了,直接揭曉吧。

語法: sum(iterable[, start]) ,sum() 函數的第一個參數是可迭代對象,如列表、元組或集合等,第二個參數是起始值,默認為 0 。其用途是以 start 值為基礎,再與可迭代對象的所有元素相“加”。

在上例中,執行效果是 oldlist 中的子列表逐一與第二個參數相加,而列表的加法相當於 extend 操作,所以最終結果是由 [] 擴充成的列表。

這里有兩個關鍵點:sum() 函數允許帶兩個參數,且第二個參數才是起點。 可能 sum() 函數用於數值求和比較多,然而用於作列表的求和,就有奇效。它比列表推導式更加優雅簡潔!

至此,前面的升級版問題就得到了很好的回答。簡單回顧一下,s 同學最初的問題可以用三種方法實現,第一種方法中規中矩,第二種方法正道進階,而第三種方法旁門左道(沒有貶義,只是說它出人意料,卻效果奇佳)。

這道並不算難的問題,在眾人的討論與分享后,竟還引出了很有價值的學習內容。前不久,同樣是群內的一個問題,也產生了同樣的學習效果,詳見《Python進階:如何將字符串常量轉為變量?》。

我從中得到了一個啟示:應該多角度地思考問題,設法尋求更優解,同時,基礎知識應掌握牢固,並靈活貫通起來。

學無止境,這里我還想再開拓一下思路,看看能發現些什么。

1、如果原列表的元素除了列表,還有其它類型的元素,怎么把同類的元素歸並在一起呢?

2、如果是一個三維或更高維的列表,怎么更好地把它們壓縮成一維列表呢?

3、sum() 函數還有什么知識要點呢?

前兩個問題增加了復雜度,解決起來似乎沒有“靈丹妙葯”了,只能用笨方法分別拆解,逐一解壓。

第三個思考題是關於 sum() 函數本身的用法,我們看看官方文檔是怎么說的:

The iterable’s items are normally numbers, and the start value is not allowed to be a string.

For some use cases, there are good alternatives to sum(). The preferred, fast way to concatenate a sequence of strings is by calling ''.join(sequence). To add floating point values with extended precision, see math.fsum(). To concatenate a series of iterables, consider using itertools.chain().

sum() 的第二個參數不允許是字符串。如果用了,會報錯:

TypeError: sum() can't sum strings [use ''.join(seq) instead]

為什么不建議使用 sum() 來拼接字符串呢?哈哈,文檔中建議使用 join() 方法,因為它更快。為了不給我們使用慢的方法,它竟特別限定不允許 sum() 的第二個參數是字符串。

文檔還建議,在某些使用場景時,不要用 sum() ,例如當以擴展精度對浮點數求和時,推薦使用 math.fsum() ;當要拼接一系列的可迭代對象時,應考慮使用 itertools.chain()

浮點數的計算是個難題,我曾轉載過一篇《如何在 Python 里面精確四舍五入?》,對此有精彩分析。而itertools.chain() 可以將不同類型的可迭代對象串聯成一個更大的迭代器,這在舊文《Python進階:設計模式之迭代器模式》中也有論及。

不經意間,sum() 函數的注意事項,竟把 Python 其它的進階內容都聯系起來了。小小的函數,竟成為學習之路上的一個樞紐。

前段時間,我還寫過 range() 、locals() 和 eval() 等內置函數,也是通過一個問題點,而關聯出多個知識點, 獲益良多。這些內置函數/類的魔力可真不小啊。

本文到此結束,希望對你有所幫助。

友情提示: 本公眾號內有限時抽獎活動,送出 Python 書籍 15 本,書目有《Python數據分析與挖掘實戰》、《Python語言程序設計》《自學Python編程基礎、科學計算及數據分析》《實用機器學習》、《Python程序員面試算法寶典》,活動結束時間為本月 20 日 18 點 ,趕快來抽獎啦!詳情請戳:抽獎送書

公眾號【Python貓】, 專注Python技術、數據科學和深度學習,力圖創造一個有趣又有用的學習分享平台。本號連載優質的系列文章,有喵星哲學貓系列、Python進階系列、好書推薦系列、優質英文推薦與翻譯等等,歡迎關注哦。PS:后台回復“愛學習”,免費獲得一份學習大禮包。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM