8086匯編語言學習(二) 8086匯編開發環境搭建和Debug模式介紹


1. 8086匯編開發環境搭建

  在上篇博客中簡單的介紹了8086匯編語言。工欲善其事,必先利其器,在8086匯編語言正式開始學習之前,先介紹一下如何搭建8086匯編的開發環境。

  匯編語言設計之初是用於在沒有操作系統的裸機上直接操作硬件的,但對於大部分人來說,在8086裸機上直接進行編程將會面臨各種困難。好在我們可以使用軟件模擬器來模擬硬件進行8086的學習實踐。在《匯編語言》中作者推薦通過windows環境下的masmdebug進行學習。

masm介紹:

  masm是一款DOS下的匯編工具包,在8086匯編的學習中我們需要其中的幾個文件,分別是masm.exelink.exe

  masm.exe 匯編器,用於將文本格式的匯編語言源文件編譯為.obj結尾的二進制文件,其生成的.obj結尾的二進制目標文件是被編譯的源文件的對應的機器碼。單獨的源程序目標文件通常是無法直接運行的,還需要和互相依賴的其它同樣編譯完成的二進制文件鏈接在一起才能生成最終的可執行文件(比如所需要的靜態庫函數) 。因此,obj文件通常也被叫做中間文件。

  link.exe 鏈接器,obj文件需要通過鏈接才能轉換成可執行程序,而鏈接器就是負責完成這一任務的。鏈接器能將多個obj目標文件以及其所依賴的庫程序進行統一處理(例如多個目標文件中指令、數據內存地址的偏移處理),並生成可執行文件。

debug介紹:

  debug.exe 調試器,windows提供了一個在dos中調試8086匯編程序的工具debug.exe,提供了展示程序運行時CPU中各寄存器、內存中數據指令級的單步調試等功能。debug程序的使用會在本篇博客的后半段進行詳細介紹。

64位操作系統兼容性問題:

  由於《匯編語言》一書出版較早,當時的windows系統還是32位的,32位windows系統都默認安裝了masm與debug,能打開dos窗口直接使用。但目前普遍使用的、新的windows 64位操作系統中卻並沒有默認提供masm工具包和debug.exe,同時masm、debug也與64位的windows系統版本不兼容。

想在64位的windows系統下使用masm、debug有兩個常用方法:

  1. 通過虛擬機安裝一個老版本的windows操作系統(推薦windows xp)

  2. 通過DOSBox這一輕量級的ms-dos模擬器來運行,但上文所述的依賴程序需單獨下載(百度網盤下載鏈接:https://pan.baidu.com/s/158NKJoea6_Y4UmCFsDP0oQ#list/path=%2F)

  個人推薦第二種方法,下面介紹如何在windows64位操作系統下使用DOSBox來搭建8086匯編語言的開發環境。

DOSBox安裝與使用

DOSBox下載安裝:

  DOSBox可以在官網下載,這里也提供了百度網盤的下載鏈接(0.74版本):https://pan.baidu.com/s/11_GcPpTqJm78N8xEXZpPMw

  安裝完畢后,找到安裝目錄下的DOSBox.exe並啟動,能看到如下圖界面。

  

  作為dos的模擬器和普通的dos窗口沒有明顯區別,但是初始時並不能直接訪問到本地磁盤,需要先將本地磁盤掛載到DOSBox中

DOSBox掛載本地磁盤:

  1. 在本地操作系統磁盤上選擇一個文件夾目錄,作為掛載的磁盤路徑(例如C:\dos)

  2. 在DOSBox啟動的dos窗口中執行命令:mount C C:\dos(代表着將本地的C:\dos路徑掛載到DOSBox的C盤路徑下),能把dos窗口的工作目錄切換到C盤,接下來就可以正常訪問被掛載的磁盤路徑下的內容了。

  3. 將前面提到過的debug.exe等文件都放在這個掛載的本地磁盤路徑下(例如C:\dos),通過DOSBox就可以兼容的運行masm工具包中的程序和debug.exe了

  

添加自動執行腳本以避免重復操作:

  由於上述DOSBox的磁盤掛載是臨時的,每次重新啟動DOSBox后都需要重新輸入命令進行掛載,太麻煩了。我們可以通過修改DOSBox配置的方式,免去這些重復的操作。

  找到DOSBox安裝目錄下的DOSBox 0.74 Options.bat,使用系統自帶的記事本直接打開,暫不研究其它配置段的作用,找到最后的【autoexec】段,配置在【autoexec】的內容會作為命令在DOSBox啟動時按順序被自動執行。  

  將掛載磁盤操作命令配置在【autoexec】段中能避免重復操作。修改並保存配置文件后,重新啟動DOSBox,發現配置中添加的命令會被自動執行。

  

2. 8086debug模式介紹

  在搭建好了8086匯編的開發環境后,接下來介紹8086的debug模式。執行debug.exe以進入debug調試模式,在dos中通過輸入命令的方式進行交互。

  

  debug模式下有20多種不同命令,限於篇幅這里只會介紹幾個以后實驗時常用到的命令。(通過回車執行命令,DOS下的命令默認是不區分大小寫的)

R命令 查看/改變CPU寄存器內容

  R命令的作用是查看和修改debug模式下CPU中寄存器的值。

  (-r) 單獨的輸入r,可以查看當前CPU的內容

  (-r 寄存器名) r加上寄存器名可以在接下來的":"提示后輸入新的值,以達到修改對應寄存器內容的目的(示例中第二行 AX 0000表示修改前寄存器AX的值為0000)  

D命令 查看內存中的內容

  D命令的作用是查看內存中的內容。

  D命令有許多不同的傳參方式可供使用,先介紹最易理解的(段地址:偏移地址)查看方式。D命令默認會顯示尋址地址開始的后128個內存單元的內容,以16進制的方式顯示(每個內存單元8位,一行最多16個內存單元),而最右邊會將內存單元中的二進制數據以ascll碼的形式翻譯展示。

  

  有時,我們只想聚焦於某一部分內存地址的內容,而默認展示的內存視圖不是很方便。

  D命令提供了另外一種訪問內存的方式(段地址:偏移起始地址 偏移終止地址),其能夠展示(段地址:偏移起始地址 至 段地址:偏移終止地址)的內存信息,范圍兩端均為閉區間。

  

E命令 改變內存中的內容

  E命令的作用是改變內存中的內容

  和對CPU中寄存器的查看,修改不同,對內存進行查看和修改較為復雜,為此debug設計了兩個不同的命令分別進行控制(E命令修改內存、D命令查看內存)。

  通過(E 起始地址 數據1 數據2 數據3...)命令可以修改內存中以起始地址開始,順序的N個內存單元的值(N為實際參數傳遞的數量)。

  

   也可以和R命令修改CPU中寄存器值類似的,通過提示來修改特定內存單元的值。00.12  00代表內存單元在修改前的值,12是我們手動輸入的、需要修改的新值。

  

  可以通過E命令向內存輸入對應的機器指令,因為機器指令也是數據的一種

有以下指令(左側為機器碼,右側為對應的匯編指令):

  B80100  mov ax,0001

  BB0200  mov bx,0002

  01D8      add ax,bx

  我們可以向內存1000:0處寫入這些機器指令,以供接下來通過debug執行這段機器指令 (執行命令:E 1000:0 B8 01 00 BB 02 00 01 D8)。

  

U命令 將內存數據轉換為匯編指令展示

  U命令的作用是將內存中的二進制數據轉換為匯編指令展示(反匯編)。

  D命令能夠將內存中的數據以16進制或ascll碼的形式展現出來,但有時我們需要觀察的是內存中的機器指令時,D命令的視圖過於抽象,不利於理解。debug提供了U命令來解決這個問題。

  對於前面我們在1000:0處輸入的機器指令,使用 U 1000:0 命令(u 內存地址)可以將內存中的數據以匯編語言指令的方式進行展示。

  

  可以觀察到,左邊展示的是內存地址,中間則是16進制的內存視圖,右邊展示的是內存中數據所對應的匯編指令(例如: 1000:0000B80100MOV AX,0001)。

  由於我們只輸入了三條匯編指令,而后面內存中的數據並不是我們想要執行的,但U命令卻依然將其以匯編指令的形式轉換並顯示出來了。

  這也是前一篇博客所提到的,內存中的數據完全是二進制的,既可以將其看做普通的二進制數據、十六進制數據、ascll碼文本數據,也可以視作程序指令,這些二進制的"數據"的處理完全取決於如何對其進行解釋

T命令 單步執行機器指令

  T命令的作用是進行單步機器指令的調試

  以上文通過E命令寫入內存1000:0的三條指令舉例,介紹如何使用T命令來讓CPU執行1000:0處的機器指令。T命令用於單步調試,一次只會執行一條機器指令。

  8086CPU在運行時會將CS:IP寄存器所指向的內存單元中的內容解釋為指令執行,要將內存1000:0處的內容作為指令執行必須先修改CS、IP兩個寄存器的值,使之指向1000:0。

  

   先執行一次T命令,1000:0處的指令(mov ax,0001)便會被執行,可以觀察到寄存器ax的值已經變成了0001;同時寄存器IP的值增加了3(mov ax,0001的指令長度為3),此時CS:IP指向的便是位於1000:3處的下一條指令(mov bx,0002),在視圖的最后一行中也有所體現

   

   再執行一次T命令,會執行1000:3處的指令(mov bx,0002),可以觀察到寄存器bx的值變成了0002;寄存器IP的值又增加了3(mov bx,0002的指令長度也是3),此時CS:IP指向的便是位於1000:6處的下一條指令(add ax,bx)

  

  最后執行一次T命令,add ax,bx會被執行(類似 ax=ax+bx)。寄存器ax的值已經變成了之前寄存器ax和bx中的數據之和0003;寄存器IP的值增加了2(add ax,bx的指令長度是2),CS:IP指向1000:8。

  

A命令 以匯編指令的形式向內存中寫入內容

  A命令能夠以匯編指令的形式向內存中寫入內容

  對於內存操作,D命令可以查看內存中的內容,但如果想查看的是程序指令,顯然U命令更加方便;E命令可以向內存中寫入數據,但對於程序指令的寫入,直接操作二進制機器碼的方式過於硬核。為此,debug提供了A命令,我們可以通過A命令以匯編指令的形式向內存中寫入內容。

  通過A命令將(mov ax,0001,mov bx,0002,add ax,bx)三條指令寫入內存1000:0處:

  

  通過A命令進行指令的寫入,和E命令達到的效果一樣,但使用起來卻更加便捷。A命令能夠自動識別所輸入匯編指令的長度,正確的在內存中寫入程序指令。

  debug提供了D、E兩種命令用於對內存進行通用的操作(純二進制、十六進制數據的讀、寫)。

  對於程序指令,debug提供了U、A兩種命令以更人性化的方式來讀寫內存中的指令內容。

3. 總結

  在debug模式下可以模擬8086匯編非常自由的控制CPU和內存,這也是匯編語言的強大之處和魅力所在。

貼近硬件底層的編程能夠讓我們編寫出來的程序非常高效,但也存在一些問題:

  1.內存中的內容被當做指令還是數據來處理完全取決於如何解釋,編程時稍有不慎就會導致CPU執行一些不應該執行的指令,甚至造成巨大的破壞。

  2.在未來還會介紹如何使用匯編語言來實現高級語言中出現的結構體、數組等概念。這些數據結構完全是程序邏輯上的,內存本身可沒有這些功能。因此在使用匯編訪問內存中結構化的數據時,一不小心就會出現內存訪問越界,錯位等問題。

  3.匯編語言的抽象程度過低,許多在高級語言中很簡單的功能在匯編中也需要很多的代碼來實現(匯編實現的控制台打印hello world可能是常用語言中最繁瑣的了)。

  編程語言的貼近底層與機器高效性如果站在更高的角度上看其實是一把雙刃劍:直接操控底層的機器方便,機器執行效率高的同時,也是危險、開發效率底下的。匯編語言程序員不得不付出巨大的精力來仔細思考、斟酌這些底層機器層面的細節,以避免出現相關bug,大大降低了開發效率。這也是高級語言誕生,並不斷發展的主要原因。

  高級語言大家族中按抽象程度來看,從偏底層的C,C++到java、python等,再到目前抽象程度最高的lisp。隨着抽象程度的提高,離機器底層越遠,執行效率通常也隨之降低。但程序員所需要考慮的機器細節也就越少,能更專注於業務邏輯,進而提高了開發效率。比如在使用C編程時還需要仔細考慮指針錯誤,堆上無用內存回收等問題,到了更高級的java、python中,這些問題都交由編譯器、虛擬機解決了,對開發人員也幾乎透明了。

  天下沒有免費的午餐,在選擇適合的編程語言開發程序時,需要在機器執行效率和開發效率間做出取舍。但隨着科學技術的發展,計算機硬件會越來越強大,對機器效率的擔憂會越來越少,對程序開發效率的考慮將占據主導地位,越來越多的程序將會傾向於使用抽象程度更高的編程語言進行開發。

  雖然需要使用匯編語言的場合越來越少,但對匯編語言和底層機器硬件有一定的了解的話,依然能夠幫助程序員更深刻的理解上層的知識內容、寫出更高效的程序。

  畢竟,人類是無法抽象、封裝到完美無缺的,有時還是你需要跳進下水道,深入底層一探究竟的。

  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM