what's the CPU
CPU 的全稱是 Central Processing Unit ,CPU 與計算機的關系就相當於大腦和人的關系。CPU 的核心是從程序或應用程序獲取指令並執行計算。此過程可以分為三個關鍵階段:提取,解碼和執行。CPU 從系統的主存中提取指令,然后解碼該指令的實際內容,然后再由 CPU 的相關部分執行該指令。
CPU 內部處理過程
下圖展示了一般程序的運行流程(以 C 語言為例),可以說了解程序的運行流程是掌握程序運行機制的基礎和前提。
在這個流程中,CPU 負責的就是解釋和運行最終轉換成機器語言的內容。
CPU 的構成
CPU 主要由兩部分構成
- 控制單元:從內存中提取指令並解碼執行
- 算數邏輯單元(ALU):處理算數和邏輯運算
CPU 是計算機的心臟和大腦,和內存一樣都是由許多晶體管組成的電子部件。CPU 接收數據輸入,執行指令並處理信息。與輸入/輸出(I / O)設備進行通信,這些設備向 CPU 發送數據和從 CPU 接收數據。
從功能來看,CPU 的內部由寄存器、控制器、運算器和時鍾四部分組成,各部分之間通過電信號連通。
寄存器是中央處理器內的組成部分。它們可以用來暫存指令、數據和地址。可以將其看作是內存的一種。根據種類的不同,一個 CPU 內部會有 20 - 100個寄存器。
控制器負責把內存上的指令、數據讀入寄存器,並根據指令的結果控制計算機
運算器負責運算從內存中讀入寄存器的數據
時鍾負責發出 CPU 開始計時的時鍾信號
CPU 是一系列寄存器的集合體
不同類型的 CPU ,其內部寄存器的種類,數量以及寄存器存儲的數值范圍都是不同的。根據功能的不同,可以將寄存器划分為下面這幾類
種類 | 功能 |
---|---|
累加寄存器 | 存儲運行的數據和運算后的數據。 |
標志寄存器 | 用於反應處理器的狀態和運算結果的某些特征以及控制指令的執行。 |
程序計數器 | 程序計數器是用於存放下一條指令所在單元的地址的地方。 |
基址寄存器 | 存儲數據內存的起始位置 |
變址寄存器 | 存儲基址寄存器的相對地址 |
通用寄存器 | 存儲任意數據 |
指令寄存器 | 儲存正在被運行的指令,CPU內部使用,程序員無法對該寄存器進行讀寫 |
棧寄存器 | 存儲棧區域的起始位置 |
其中程序計數器、累加寄存器、標志寄存器、指令寄存器和棧寄存器都只有一個,其他寄存器一般有多個。
程序計數器
用於存儲下一條指令所在單元的地址。
程序執行時,PC的初值為程序第一條指令的地址,在順序執行程序時,控制器首先按程序計數器所指出的指令地址從內存中取出一條指令,然后分析和執行該指令,同時將 PC 的值加 1 指向下一條要執行的指令。
下面以一個事例詳細的看一下程序計數器的執行過程
這是一段進行相加的操作,程序啟動,在經過編譯解析后會由操作系統把硬盤中的程序復制到內存中,示例中的程序是將 123 和 456 執行相加操作,並將結果輸出到顯示器上。
地址 0100 是程序運行的起始位置。Windows 等操作系統把程序從硬盤復制到內存后,會將程序計數器作為設定為起始位置 0100,然后執行程序,每執行一條指令后,程序計數器的數值會增加1(或者直接指向下一條指令的地址),然后,CPU 就會根據程序計數器的數值,從內存中讀取命令並執行,也就是說,程序計數器控制着程序的流程。
條件分支和循環機制
高級語言中的條件控制流程主要分為三種:順序執行、條件分支、循環判斷
- 順序執行是按照地址的內容順序的執行指令。條件分支是根據條件執行任意地址的指令。循環是重復執行同一地址的指令。
- 順序執行的情況比較簡單,每執行一條指令程序計數器的值就是 + 1。
- 條件和循環分支會使程序計數器的值指向任意的地址,這樣一來,程序便可以返回到上一個地址來重復執行同一個指令,或者跳轉到任意指令。
下面以條件分支為例來說明程序的執行過程(循環也很相似)
程序的開始過程和順序流程是一樣的,CPU 從 0100 處開始執行命令,在 0100 和 0101 都是順序執行,PC 的值順序 +1,執行到 0102 地址的指令時,判斷 0106 寄存器的數值大於 0,跳轉(jump)到0104 地址的指令,將數值輸出到顯示器中,然后結束程序,0103 的指令被跳過了,這就和程序中的 if 判斷是一樣的,在不滿足條件的情況下,指令會直接跳過。所以 PC 的執行過程也就沒有直接 +1,而是下一條指令的地址。
標志寄存器
條件和循環分支會使用到 jump(跳轉指令) ,會根據當前的指令來判斷是否跳轉,無論當前累加寄存器的運算結果是正數、負數還是零,標志寄存器都會將其保存
CPU 在進行運算時,標志寄存器的數值會根據當前運算的結果自動設定,運算結果的正、負和零三種狀態由標志寄存器的三個位表示。標志寄存器的第一個字節位、第二個字節位、第三個字節位各自的結果都為1時,分別代表着正數、零和負數。
CPU 的執行機制比較有意思,假設累加寄存器中存儲的 XXX 和通用寄存器中存儲的 YYY 做比較,執行比較的背后,CPU 的運算機制就會做減法運算。而無論減法運算的結果是正數、零還是負數,都會保存到標志寄存器中。結果為正表示 XXX 比 YYY 大,結果為零表示 XXX 和 YYY 相等,結果為負表示 XXX 比 YYY 小。程序比較的指令,實際上是在 CPU 內部做減法
運算。
函數調用機制
哪怕是高級語言編寫的程序,函數調用處理也是通過把程序計數器的值設定成函數的存儲地址來實現的。函數執行跳轉指令后,必須進行返回處理,單純的指令跳轉沒有意義
下面是一個實現函數跳轉的例子
圖中將變量 a 和 b 分別賦值為 123 和 456 ,調用 MyFun(a,b) 方法,進行指令跳轉。圖中的地址是將 C 語言編譯成機器語言后運行時的地址,由於 1 行 C 程序在編譯后通常會變為多行機器語言,所以圖中的地址是分散的。在執行完 MyFun(a,b)指令后,程序會返回到 MyFun(a,b) 的下一條指令,CPU 繼續執行下面的指令。
函數的調用和返回很重要的兩個指令是 call 和 return 指令,再將函數的入口地址設定到程序計數器之前,call 指令會把調用函數后要執行的指令地址存儲在名為棧的主存內。函數處理完畢后,再通過函數的出口來執行 return 指令。return 指令的功能是把保存在棧中的地址設定到程序計數器。MyFun 函數在被調用之前,0154 地址保存在棧中,MyFun 函數處理完成后,會把 0154 的地址保存在程序計數器中。
這個調用過程如下
在一些高級語言的條件或者循環語句中,函數調用的處理會轉換成 call 指令,函數結束后的處理則會轉換成 return 指令。
寄存器和變址寄存器
通過地址和索引實現數組
通過這兩個寄存器,可以對主存上的特定區域進行划分,來實現類似數組的操作
首先,我們用十六進制數將計算機內存上的 00000000 - FFFFFFFF 的地址划分出來。那么,凡是該范圍的內存地址,只要有一個 32 位的寄存器,便可查看全部地址。但如果想要想數組那樣分割特定的內存區域以達到連續查看的目的的話,使用兩個寄存器會更加方便。
例如,我們用兩個寄存器(基址寄存器和變址寄存器)來表示內存的值
這種表示方式很類似數組的構造。用數組名表示數組全部的值,通過索引來區分數組的各個數據元素,例如: a[0] - a[4],[]
內的 0 - 4 就是數組的下標。
CPU 指令執行過程
幾乎所有的馮·諾伊曼型計算機的 CPU,其工作都可以分為5個階段:取指令、指令譯碼、執行指令、訪存取數、結果寫回。
- 取指令階段是將內存中的指令讀取到 CPU 中寄存器的過程,程序寄存器用於存儲下一條指令所在的地址
- 指令譯碼階段,在取指令完成后,立馬進入指令譯碼階段,在指令譯碼階段,指令譯碼器按照預定的指令格式,對取回的指令進行拆分和解釋,識別區分出不同的指令類別以及各種獲取操作數的方法。
- 執行指令階段,譯碼完成后,就需要執行這一條指令了,此階段的任務是完成指令所規定的各種操作,具體實現指令的功能。
- 訪問取數階段,根據指令的需要,有可能需要從內存中提取數據,此階段的任務是:根據指令地址碼,得到操作數在主存中的地址,並從主存中讀取該操作數用於運算。
- 結果寫回階段,作為最后一個階段,結果寫回(Write Back,WB)階段把執行指令階段的運行結果數據“寫回”到某種存儲形式:結果數據經常被寫到 CPU 的內部寄存器中,以便被后續的指令快速地存取;