備考2021 軟考高級系統架構師筆記 整理中...
目錄
- 軟考官網 報名通道
- 軟考架構師筆記(一):計算機系統基礎
- 軟考架構師筆記(二):計算機網絡基礎與信息安全
- 軟考架構師筆記(三):操作系統基礎
- 軟考架構師筆記(四):企業信息化與系統規划
- 軟考架構師筆記(五):系統需求工程 需求分析
- 軟考架構師筆記(六):數據庫
- 軟考架構師筆記(七):系統分析 系統設計
- 軟考架構師筆記(八):系統架構
- 軟考架構師筆記(九):軟件工程與項目管理
- 軟考架構師筆記(十):系統測試 維護 穩定性
Flynn分類法
、
指令集 CISC RISC
CISC復雜指令集:指令多,指令頻率差別大,復雜度高,多尋址,微程序控制技術(微碼)實現譯碼,
RISC精簡指令集:指令數量少,指令頻率接近,大多數在一個機器周期完成,單周期,少尋址,多通用寄存器,硬布線邏輯控制,操作寄存器,適用於流水線,優化編譯效率,支持高級語言。
流水線技術
流水線是指在程序執行時多條指令重疊進行操作的一種准並行處理實現技術。
各種部件同時處理是針對不同指令而言的,它們可同時為多條指令的不同部分進行工作,以提高各部件的利用率和指令的平均執行速度。
並行包括同時性與並發性兩種含義,同時性指兩個或兩個以上的事件在同一時刻發生,並發性指的是兩個或兩個以上的事件在同一時間間隔發生。
流水線建立時間:1條指令執行時間。
流水線周期:執行時間最長的一段
一條指令的執行過程可以分3個階段:
取指:按照指令計數器的內容訪問主存儲器,取出一條指令送到指令寄存器。
分析:對指令操作碼部分進行譯碼,按照給定的尋址方式和地址字段中的內容形成操作數地址,並用這個地址讀取操作數。
執行:把運算結果寫到通用寄存器或主存中。
順序執行的過程:
取址 -》分析 -》執行
使用流水線執行過程:
相關的計算考點:
流水線執行時間(理論公式):(t1+t2+..+tk)+(n-1)*∆t
流水線執行時間(實踐公式):k*∆t +(n-1)*∆t
流水線吞吐率:吞吐率TP=指令數/執行時間
流水線最大吞吐率:
流水線加速比:順序執行時間/流水線執行時間
計算機開機過程
BIOS引導程序是固化在ROM芯片上的,每當開機時自動執行BIOS引導程序。它主要執行如下任務:
·標識和配置所有的即插即用設備。如果系統有即插即用設備的BIOS,系統將搜索和測試所有安裝的即插即用設備,並為它們分配DMA通道、IRQ及它們需要的其他設備。
·完成加電自檢(POST)。加電自檢主要檢測和測試內存、端口、鍵盤、視頻適配器、磁盤驅動器等基本設備。有一些新版本的系統還支持CD-ROM驅動器。
·對引導驅動器可引導分區定位。在CMOS中,用戶可以設置系統的引導順序,以便對引導驅動器的可引導分區重新定位。大多數系統的引導順序是軟件驅動,然后是硬件驅動,其次是CD-ROM驅動器。
·加載主引導記錄及引導驅動器的分區表,執行主引導記錄MBR。
主引導記錄在硬盤上找到可引導分區后,將其分區引導記錄裝入內存,並將控制權交給分區引導記錄。由分區引導記錄定位根目錄,再裝入操作系統。
存儲系統
層次化存儲結構
寄存器
指令寄存IR 器用來存放從內存中讀取的指令。
通用寄存器GR 可用於傳送和暫存數據,也可參與算術邏輯運算,並保存運算結果。
程序計數器PC 是用於存放下一條指令所在單元的地址。當執行一條指令時,首先需要根據PC中存放的指令地址,將指令由內存取到指令寄存器中,即將程序計數器PC中的內容送到地址總線上,此過程稱為”取指令”。與此同時,PC中的地址或自動加1或由轉移指針給出下一條指令的地址。此后經過分析指令,執行指令。完成第一條指令的執行,而后根據PC取出第二條指令的地址,如此循環,執行每一條指令。
狀態寄存器PSW 用於存放狀態標志與控制標志如,中斷標志、溢出標志等。
Cache
Cache的功能提高CPU數據輸入輸出的速率,突破馮,諾依曼瓶頸,即CPU與存儲系統間數據傳送帶寬限制。
在計算機的存儲系統體系中,Cache是訪問速度最快的層次。
使用Cache改善系統性能的依據是程序的局部性原理。
時間局部性:如果一個信息項正在被訪問,那么在近期很可能還會被再次訪問。程序的循環,堆棧等是產生時間局部性的原因;
空間局部性:指一旦程序訪問了某個存儲單元,不久以后,其附近的存儲單元也將被訪問,即程序在一段時間內所訪問的地址可能集中在一定的范圍內,其典型情況是程序順序執行。
工作集理論:工作集是進程運行時被頻繁訪問的頁面合集
工作原理 :依據局部性原理,把主存儲器中訪問概率高的內容存放在cache中。當CPU需要讀取數據時,首先在cache中查找是否有所需內容,如果有,則直接從cache中讀取;
若沒有,再從主存中讀取該數據,然后同時送往CPU和cache。
如果CPU需要訪問的內容大多能在cache中找到(訪問命中),則可以大大提高系統性能。
CPU發出訪存請求后,存儲器地址先被送到cache控制器以確定所需數據是否已在cache中,若命中則直接對cache進行訪問。該過程稱為cache的地址映射。常見的映射方法有直接映射、相聯映射和組相聯映射。
直接相聯映像:硬件電路較簡單,但沖突率很高。
全相聯映像:電路難於設計和實現,只適用於小容量的cache,沖突率較低。
組相聯映像:直接相聯與全相聯的折中。
Cache中數據裝滿后必須淘汰現有數據,裝入新數據,淘汰算法有:隨機淘汰法、先進先出法FIFO、近期最少使用淘汰法LRU。
Cache寫數據常用方法包含以下幾類:
寫直達:當要寫cache時,數據同時寫回主存儲器,也稱為寫通,也叫貫穿。
寫回:CPU修改cache的某一行后,相應數據不立即寫入主存,而在該行被從cache中淘汰時,才把數據寫回主存儲器中。
標記法:對cache中的每個數據設置一個有效位。當數據進入cache后,有效位置1,當CPU要對該數據進行修改時,只需將其寫入主存儲器,並將該位清0。
當要從cache中讀取數據時,需要測試其有效位:若為1則從cache中取,否則從主存中取。
校驗碼
校驗碼通常是一組數字的最后一位,由前面的數字通過某種運算得出,用以檢驗該組數字的正確性。
常見的校驗碼有中華人民共和國居民身份證的最后一位、ISBN號碼的最后一位、組織機構代碼的最后一位、數據傳輸的正確性驗證碼等。
代碼作為數據在向計算機或其它設備進行輸入時,容易產生輸入錯誤,為了減少輸入錯誤,編碼專家發明了各種校驗檢錯方法,並依據這些方法設置了校驗碼。
- 奇偶校驗:只檢奇數位錯,不能糾錯。
- 循環校驗碼CRC:可查錯,不可糾錯,運用模二除法計算校驗碼。
- 海明校驗:可查錯,可糾錯;海明校驗碼校驗位計算:2r>=r+m-1。
https://baijiahao.baidu.com/s?id=1594263251060755624&wfr=spider&for=pc
常見校驗碼分類:
碼距
奇偶校驗碼
海明碼
把校驗碼放到 2的n次方位,多種奇偶校驗交錯在一起
10 9 8 7 6 5 4 3 2 1
上面有6個信息位,4個校驗位
CRC循環冗余校驗碼
原始報文 使用模2運算 除一個約定好的 多項式,為了整除 需要給源碼補充上 幾位(實際上一定是多項式最高次冪-1) 接收放 收到后,用同樣的多項式去驗證;
編碼及浮點數運算
原碼:為二進制的數,如:10 原碼0000 1010
反碼:正數與原碼相同,如:10 反碼0000 1010
負數為原碼0變1,1變0,(符號位不變)
如:-10 原碼1000 1010
反碼1111 0101
補碼:正數的補碼與原碼相同,如:10 補碼 : 0000 1010
負數的反碼為補碼減1,如:-10 反碼:1111 0101
補碼:1111 0110
計算機中數字以補碼儲存,因為原碼和反碼計算不准確,而補碼是准確的,補碼可以直接處理正負數的加減。
浮點數:科學計數法: N=尾數*基數(的指數)
1、浮點數各部分表示意義:N = 尾數*基數指數
(1)一般尾數用補碼,階碼用移碼;
(2)階碼的位數決定數的表示范圍,位數越多范圍越大;
(3)尾數的位數決定數的有效精度,位數越多精度越高。
浮點數所能表示的數值范圍如下:最大的正數
2、浮點數運算規則:對階 > 尾數計算 > 結果格式化
(1)對階時,小數向大數看齊;
(2)對階是通過較小數的尾數右移實現的。
性能指標及阿姆達爾解決方案
計算機系統的性能一般包括兩個大的方面。
一個方面是它的可靠性或可用性,也就是計算機系統能正常工作的時間,其指標可以是能夠持續工作的時間長度(例如,平均無故障時間),也可以是在一段時間內,能正常工作的時間所占的百分比;
另一個方面是它的處理能力或效率,這又可分為三類指標,
第一類指標是吞吐率(例如,系統在單位時間內能處理正常作業的個數)
第二類指標是響應時間(從系統得到輸入到給出輸出之間的時間)
第三類指標是資源利用率,即在給定的時間區間中,各種部件(包括硬設備和軟件系統)被使用的時間與整個時間之比。
當然,不同的系統對性能指標的描述有所不同,例如,計算機網絡系統常用的性能評估指標為信道傳輸速率、信道吞吐量和容量、信道利用率、傳輸延遲、響應時間和負載能力等。
主頻,時鍾周期,總線周期,指令周期
主頻和CPU時鍾周期(Clock Cycle):主頻又稱為時鍾頻率,時鍾周期是時鍾頻率的倒數。
主頻為1GHz 則說明1秒鍾有1G個時鍾周期,每個時鍾周期為1000*1000*1000/1G=1ns.
指令周期(Instruction Cycle):取出並執行一條指令的時間。
總線周期(BUS Cycle):也就是一個訪存儲器或I/O端口糧作所用的時間。
指令周期、總線周期和時鍾周期之間的關系:一個指令周期由若干個總線周期組成,而一個總線周期時間又包含有若干個時鍾周期(也可說一個指令周期包含若干個時鍾周期)。
MIPS,MFIOPS
吞吐率指的是單位時間內完成的任務數,常用的表示方式有MIPS和MFILOPS.
MIPS:每秒處理的百萬級的機器語言指令數,主要用於衡量標量機性能
MFLOPS:每秒百萬個浮點操作,不能反映整體情況,只能反映浮點運算情況,主要用於衡量t向量機性能。
Amdahl定律
可靠性
可靠性用平均無故障時間(MeanTime To Failure MTTF)來度量,即計算機系統平均能夠正常運行多長時間,才發生一次故障。系統可靠性越高,平均無故障時間就越長。
可維護性用平均維修時間(MTTR)來度量,即系統發生故障后維修和重新恢復正常運行平均花費的時間,系統的可維護性越好,平均維修時間越短。
計算機系統可用性是系統保持正常運行時間的百分比,定義為:MTTF/(MTTF+MTTR)×100%.
用戶容易對可靠性和可用性產生混淆,二者的重要區別是系統是可維修的還是不可維修的。可靠性通常低於可用性,因為可靠性要求系統在整個[0,t]時間段內都必須正常運行;而對於可用性的要求就沒有那么高,系統可以發生故障,然后在時間段[0,t]內修復。
性能評價方法
真實程序>核心程序>小型基准程序>合成基准程序
時鍾頻率法:以時鍾頻率高低衡量速度。
指令執行速度法:表示機器運算速度的單位是MIPS。
等效指令速度法:通過各類指令在程序中所占的比例(W;)進行計算得到的。特點:考慮指令比例不同的問題。
數據處理速率法(PDR):PDR值的方法來衡量機器性能,PDR值越大,機器性能越好。PDK=L/K特點:考慮CPU+存儲
綜合理論性能法(CTP):CTP用MTOPS(Million Theoretical Operations Per Second,每秒百萬次理論運算)表示。CTP的估算方法是,首先算出處理部件每個計算單元的有效計算率,再按不同字長加以調整,得出該計算單元的理論性能,所有組成該處理部件的計算單元的理論性能之和即為CTP。
基准程序法:把應用程序中用得最多、最頻繁的那部分核心程序作為評估計算機系統性能的標准程序,稱為基准測試程序(benchmark)。基准程序法是目前一致承認的測試系統性能的較好方法。 考慮了諸如IVO結構、操作系統、編譯程序的效率對系統性能的影響,
計算機性能評估方法基本上分為兩大類,分別是測量方法和模型方法。
測量方法指通過一定的測量設備或測量程序,可以直接從系統中測得各項性能指標或與之密切的相關度量,然后,由它們經過一些簡單的運算,求出相應的性能指標。
模型方法的基本思想是,首先對要評估的系統建立適當模型,然后求出模型的性能指標,以便對系統進行性能評估。本試題考查的是測量方法中的經典評測方法的基本知識。
測量方法中經典的性能評估方法有時鍾頻率法、指令執行速度法、等效指令速度法、數據處理速率法、綜合理論性能法等。
時鍾頻率法:計算機的時鍾頻率在一定程度上反映了機器速度,對於同一種機型的計算機,時鍾頻率越高,計算機的速度就越快,但是不同體系結構的計算機,相同頻率下,其速度和性能可能會差別很大。
指令執行速度法:計算機發展中,由於加法的指令速度大體上可反映出乘法、除法等其他算術運算的速度,而邏輯運算、轉移指令等簡單指令的執行時間往往設計成與加法指令相同,因此可以采用加法指令的運算速度來衡量計算機的速度。
等效指令速度法:也稱為吉普森或混合比例計算法,是通過各類指令在程序中所占的比例進行計算后得到的計算機運算速度。
數據處理速率法(ProcessingDataRate,PDR):采用計算PDR值的方法來衡量機器性能,PDR值越大,機器性能越好。PDR與每條指令和每個操作數的平均位數以及每條指令的平均運算速度有關。PDR主要對CPU和主存儲器的速度進行度量,不適合衡量機器的整體速度,不能全面反映計算機的性能,因為它沒有涉及Cache、多功能部件等技術對性能的影響。
綜合理論性能法:該方法是首先計算出處理部件每個計算單元的有效計算率,再按不同字長加以調整,得出該計算單元的理論性能,所有組成該處理部件的計算單元的理論性能之和即為最終的計算機性能。
多媒體
顏色:
真彩色是指圖像中的每個像素值都分成R、G、B三個基色分量,每個基色分量直接決定其基色的強度,這樣產生的色彩稱為真彩色。
偽彩色圖像的每個像素值實際上是一個索引值或代碼,該代碼值作為色彩查找表CLUT(Color Look-Up Table)中某一項的入口地址,根據該地址可查找出包含實際R、G、B的強度值。
這種用查找映射的方法產生的色彩稱為偽彩色。
直接色的像素值分為紅、綠、藍子域,每一個子域索引一份獨立的色彩映射,可改變色彩映射的內容。
矢量是一種既有大小又有方向的量,又稱為向量。一般來說,在物理學中稱作矢量,例如,速度、加速度、力等就是這樣的量。合棄實際含義,就抽象為數學中的概念一向量。在計算機中,矢量圖可以無限放大永不變形。
視頻:
多信息文本格式(RTF)是一種方便於不同的設備、系統查看的文本和圖形文檔格式。
WAV為微軟公司發的一種聲音文件格式,它符合RIFF文件規范,用於保存Windows平台的音頻信息資源,被Windows平台及其應用程序所廣泛支持。
MPEG是運動圖像壓縮算法的國際標准,現已被幾乎所有的計算機平台支持。它包括MPEG-1,MPEG-2,MPEG-4等。
MPEG-1被廣泛地應用在VCD(Video Compact Disk)的制作,絕大多數的VCD采用MPEG-1格式壓縮。 MPEG-1視頻中的幀間編碼主要采用了基於運動補償的幀間預測編碼,幀內編碼主要采用了變換編碼。
MPEG-1標准中,視頻圖像的幀序列包括幀內圖像(l幀)、預測圖像(P幀)和插補圖像(B幀),或稱雙向預測圖像3種。幀內圖像(l幀)不參照任何過去的或者將來的其他圖像幀,壓縮編碼直接采用類JPEG的壓縮算法,故其可以直接作為索引和訪問點;
MPEG-21是ISO/IEC制定為一個標准,致力於定義多媒體應用的一個開放框架。
預測圖像使用基於運動補償的單向幀間預測編碼;而插補圖像則使用雙向幀間預測編碼。
MPEG-2應用在DVD(Digital Video/Versatile Disk)的制作方面、HDTV(高清晰電視廣播)和一些高要求的視頻編輯、處理方面。MPEG格式視頻的文件擴展名通常是MPEG或MPG。
JPG全名是JPEG,JPEG圖片以24位顏色存儲單個位圖。JPEG是與平台無關的格式,支持最高級別的壓縮,不過,這種壓縮是有損耗的。漸近式JPEG文件支持交錯。
藍光(Blu-ray)或稱藍光盤(Blu-ray Disc,縮寫為BD)利用波長較短(405nm)的藍色激光讀取和寫入數據,並因此而得名。而傳統DVD需要光頭發出紅色激光(波長為650nm)來讀取或寫入數據,通常來說波長越短的激光,能夠在單位面積上記錄或讀取更多的信息。因此,藍光極大地提高了光盤的存儲容量,對於光存儲產品來說,藍光提供了一個跳躍式發展的機會。目前為止,藍光是最先進的大容量光碟格式,BD激光技術的巨大進步,使你能夠在一張單碟上存儲25GB的文檔文件。這是現有(單碟)DVDs的5倍。在速度上,藍光允許1~2倍或者說每秒4.5~9兆字節的記錄速度。
聲音:
PCM通過抽樣、量化、編碼三個步驟將連續變化的模擬信號轉換為數字編碼。
ADPCM編碼在PCM脈沖編碼調制的基礎上引入了“自適應”的思想。“自適應”是指根據輸入信號幅度大小自動地改變量化階的大小。
LPC是根據過去已有的幾個采樣值的模型的線性組合來推斷現在的采樣值,進而用實際采樣值與預測采樣值之差(預測誤差)及線性預測系數進行編碼。
MPEG音頻編碼方法使用了心理聲學模型。