機器學習 - Python 02


好了,咱們接着上一節的內容,繼續學習機器學習中的Python語法部分。這一節算是Python語法的最后一節了。也就是說如果真的看懂了這兩節的內容,理論上說就機器學習的領域或者方向,語言已經不是問題了。同時也意味着馬上真正的進入機器學習的核心部分了。好了,那咱們接下來正式開始咱們的學習啦。

  • Tuples

Tuples是Python中的一種新的形式的數據collection(至少相對於C++, objective-C,Java是新的。其他的我就不敢肯定了,免得被打臉,哈哈)。其實她和List幾乎是一樣的,除了2個方面的不同。她和list的區別主要是下面2個方面的不同:1)Tuples 的創建的展現是講元素element用括號包起來,而List是用的中括號。2)Tuples一旦創建 元素是不可改變的,即它是immutable的,而List的元素是可以改變的,即Mutable的。好了,下面看一下tuples的創建代碼展示一下,否則光說不練假把式。哈哈哈

t = (1,2,3)

上面的代碼就是創建了一個tuple,他的元素有三個,分別是1,2,3. 那么既然有了list為什么還要Tuples呢? 這主要是因為Tuple的應用場景主要是用於那些有多個返回值的函數中,想象一下,如果一個函數有多個返回值,你要怎么弄呢?對了,你肯定想到了List對吧?可是List里面的數據可能因為多人協同開發的時候被其他同事修改了,是會有一定Risk的。那么自然而然我們就想到了要用Tuples這個數據結構,因為他是Immutable的,如果有人試圖修改她的值,他會報錯的。總結起來就是List是可讀可寫的,而Tuples是只讀的。看看下面這個返回多個值的例子吧。

a = 0.125.as_integer_ratio()

上面的函數返回了2個值,分別是分子和分母,都是整型數據。返回的數據是(1,8)。

關於Tuples還有一個點是Individual assignments(翻譯過來應該是叫單獨賦值,不知道翻譯的對不對,容我裝個B,哈哈哈),這里的意思是講Tuple中的值可以分別賦值給不同的變量,如下所示:

numerator,demonstrater = a

上面代碼的運行結果就是:numerator = 1, demonstrater = 8.

  • Dictionary

好了,現在接受最后一種形式的collection,就是字典。這和其他語言都很像,就是key-value鍵值對。好了,下面先來瞧一瞧咱們dictionary的創建

numbers = {"one":1,"two":2,"three":3}

這和其他很多種的語言的都一樣,再來看看如何通過Key值來retrieve value。

numbers["one"]

下面介紹一下dictionary中的比較高級但是在實際中會經常用到的的功能,這些語法特性看起來挺牛逼,其實都是紙老虎,哈哈,心態上我們要藐視他媽,操作上要重視他們哈。

1) in operator

in的關鍵字是Python中最常見的一個關鍵字,沒有之一!!!!在list中用,在dictionary中用,在條件判斷時會用,在循環中還是會用的。既然這一節講的是dictionary,我們就看看她在dictionary中的應用吧。

#create a dictionary
planets = ['Mercury', 'Venus', 'Earth', 'Mars', 'Jupiter', 'Saturn', 'Uranus', 'Neptune']
plants_to_initial = {planet:planet[0] for planet in planets}
"Mercury" in plants_to_initial  # the in operator will tell us whether something is a key in the dictionary

上面的創建字典代碼現在看不懂沒關系,她就是創建了一個字典,這個字典的key值是這些星星的名字,value值就是這些星星的首字母。這里重要的是最后一行代碼,判斷“Mercury”這個字符串是不是這個字典的key值。如果是key,返回True, 否則返回False。

2)遍歷key值

#the for loop will loop over its keys
for key in plants_to_initial:
    print(key,end = " ")

如上代碼所示,直接對dictionary遍歷,返回的是每一個key-value鍵值對的key值。上面代碼就是打印這個字典的所有的key值。

3) 同事遍歷key-value 鍵值對

在字典中,如果想要同時遍歷鍵值對,我們必須通過dictionary的一個method,叫做:items(). 這個方法返回一個list,里面的元素是tuples,這些tuples里面的元素就是key,values. 話不多說,直接上代碼看

for planet, initial in plants_to_initial.items():#items()will return its key-value pairs
    print(planet,initial)
  • String

好了,終於進入到最最常用的一種基本數據類型了-string。幾乎在所用的應用中,產生和消費的數據,幾乎字符串占了絕大部分。當然啦,在機器學習中最常用到的數據類型是int和float,但是string類型的也是經常會出現的。其實String可以將它看成一串字符,這一串字符就好比一個list。用英文來說就是 A string is a sequences of characters. (是不是瞬間高大上了,從大蒜變成了咖啡。哈哈哈哈)。 所以在Python中,幾乎你在list中看到的方法,都同樣適用於String. 

1) String 的創建和index

planet = "Pluto"
planet[0]#return P
planet[-3:]#return uto
len(planet)#return 5

2)常用的String方法

#string methods
planet.upper()#return PLUTO
planet.lower()#return pluto
planet.index("uto")#return 2
planet.startswith("Plu")#return True
planet.endswith("asds")#return False

3) List 和 String之間的相互轉換

#going between strings and lists
#string -> list   split method
planets = "Pluto is a planet"
list_planets = planets.split()#return a list of ["Pluto","is","a","planet"]
dates = '2019-10-08'
list_dates = dates.split('-')#returns ["2019","10","08"], the element are also all string types
#list->string  join method
year,month,day = list_dates #individual assignment
'/'.join([year,month,day]) #returns "2019/10/08"

注意無論是String->List還是List->String, 他們的基本元素都是String,而不會是Int或者Float或者其他什么稀奇古怪的數據類型。也就是說,無論是Split還是Join, 他們操作的對象都是String。例如:'/'.join([1,2,3]),這句代碼就會報錯,因為1,2,3都是整型數據而不是string。這里比較抽象哈,自己慢慢體會。

4)formatting a string

String是一個非常靈活的數據類型,例如int也可以轉換成string,等等。因此我們常常需要將不同數據類型的數據拼接在一起,然后轉換成一個string。這種情況下,我們經常需要用到format方法,當然也存在其他方法可以完成這個任務,但是format的牛逼之處不僅僅在於這,她還可以格式化數據的表現格式,例如保留幾位小數點,大數字的表現形式等等,具體的可以參考下面的代碼。

position = 9
"{}, you will be the {}th planet to me".format(planet,position) #returns 'Pluto, you will be the 9th planet to me'
"{:.2}".format(0.123345) #returns "0.12", the result is converted to string type
"{:,}".format(1234578) #returns '1,234,578' the result is also converted to string type
"{0},{1},{1},{0},{0}".format(12,55)#indexing of format the result is '12,55,55,12,12', the result is also string type
  • Loop comprehension

Loop comprehension 是Python中非常受歡迎的一個特性,她能夠快速創建List和dictionary,並且使用起來非常靈活,在將來機器學習的實踐中你們會發現非常好用。說了這么多,那么接下來我們來看看到底什么是Loop Comprehension.

1) 利用Loop Comprehension 來快速創建dictionary。

其實這已經在前面的代碼中有所體現了,如下面的代碼所示,快速創建字典。

plants_to_initial = {planet:planet[0] for planet in planets}

其實就是用for in 的循環,然后通過key:value的形式,批量的產生鍵值對,最后生成一個字典。

2)利用Loop Comprehension 來創建List

List的創建也是很靈活的,也可以操作循環的元素,來達到一些個性化或者特殊需求的一些目的。甚至她還可以通過組合條件判斷的語句達到更加精細化的控制,創建List的一些常用方式如下所示

numbers = [1,2,3,4]
squares = [n**2 for n in numbers] #returns [1,4,9,16]
print(squares)    
short_squares = [n for n in squares if n<9] #returns [1,4]
count_number_of_squares = len([n for n in squares if n < 100]) #returns 4

 

總結: 前面一節內容還有這一節內容大體上已經介紹了常用Python的絕大部分特性,如果已經掌握,我覺得僅僅對於機器學習這個領域的學習的話,已經夠用了。這兩節的內容是給已經有其他語言經驗的人准備的(如果一點計算機語言經驗都沒有,我建議還是從Hello World開始)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM