A.5.1 文件格式
ARM 源程序文件(即源文件)為文件格式,可以使用任一文本編輯器編寫程序代碼。
A.5.2 ARM 匯編的一些規范
ARM 匯編中,所有標號必須在一行的頂格書寫,其后面不要添加“:”,而所有指令均不能頂格書寫。ARM 匯編器對標識符大小寫敏感,書寫標號及指令時字母大小寫要一致,在ARM 匯編程序中,一個ARM 指令、偽指令、寄存器名可以全部為大寫字母,也可以全部為小寫字母,但不要大小寫混合使用。注釋使用“;”,注釋內容由“;”開始到此行結束,注釋可以在一行的頂格書寫。
格式:[標號] <指令|條件|S> <操作數>[;注釋]
源程序中允許有空行,適當地插入空行可以提高源代碼的可讀性。如果單行太長,可以使用字符“”將其分行,“”后不能有任何字符,包括空格和制表符等。對於變量的設置,常量的定義,其標識符必須在一行的頂格書寫。
匯編指令正確的例子和錯誤的例子如下:
正確的例子:
…
Str1 SETS My string1.” ;設置字符串變量Str1
Count RN R0 ;定義寄存器名Count
USR_STACK EQU 64 ;定義常量
START LDR R0,=0x1123456 ;R0=0x123456H
MOV R1,#0
LOOP
MOV R2,#3
…
錯誤的例子:
START MOV R0,#1 ;標號START 沒有頂格寫
ABC: MOV R1,#2 ;標號后不能帶:
MOV R2,#3 ;命令不允許頂格書寫
loop Mov R2,#3 ;指令中大小寫混合
B Loop ;無法跳轉到Loop 標號
(2)標號
在ARM 匯編中,標號代表一個地址,段內標號的地址在匯編時確定,而段外標號的地址值在連接時確定。根據標號的生成方式,可以有以下3 鍾:
基於PC 的標號
基於PC 的標號時位於目標指令前的標號或程序中的數據定義偽指令前的標號,這種標號在匯編時將被處理成PC 值加上或減去一個數字常量。它常用於表示跳轉指令的目標地址,或者代碼段中所嵌入的少量數據。
基於寄存器的標號
基於寄存器的標號通常用MAP 和FILED 偽指令定義,也可以用於EQU 偽指令定義,這種標號在匯編時被處理成寄存器的值加上或減去一個數字常量。它常用於訪問位於數據段中的數據。
絕對地址
絕對地址是一個32 為的數字量,它可以尋址的范圍為0~232-1,可以直接尋址整個內存空間。
(3)局部標號
局部標號主要用於局部范圍代碼中,在宏定義也是很有用的。局部標號是一個0~99 之間的十進制數字,可重復定義,局部標號后面可以緊接一個通常表示該局部變量作用范圍的符號。局部變量的作用范圍為當前段,也可以用偽指令ROUT 來定義局部標號的作用范圍。
局部標號定義格式:N{routname}
其中:N 局部標號,為0~99。
routname 局部標號作用范圍的名稱,由ROUT 偽指令定義。
局部標號引用格式:
%{F|B}{A|T} N{routname}
其中: % 表示局部標號引用操作。
F 指示編譯器只向前搜索
B 指示編譯器只向后搜索
A 指示編譯器搜索宏的所有嵌套層次
T 指示編譯器搜索宏的當前層
如果F 和B 都沒有指定,則編譯器先向前搜索,再向后搜索。如果A 和T 都沒有指定,編譯器搜索所有從宏的當前層次到宏的最高層次,比當前層次的層次不再搜索。
如果指定了routname,編譯器向前搜索最近的ROUT 偽指令,若routname 與該ROUT偽指令定義的名稱不匹配,編譯器報告錯誤,匯編失敗。
示例如下:
routintA ROUT
…
3routineA
BEQ %4routineA
BGE %3
4routineA
…
otherstuff ROUT
…
(4)符號
在ARM 匯編中,符號可以代表地址、變量、數字常量。當符號代表地址時又稱為標號,符號就是變量的變量名、數字常量的名稱、標號,符號的命名規則如下:
a. 符號由大小寫字母、數字以及下划線組成;
b. 除局部標號以數字開頭外,其它的符號不能以數字開頭;
c. 符號區分大小寫,且所有字符都是有意義的;
d. 符號在其作用域范圍你必須是唯一的;
e. 符號不能與系統內部或系統預定義的符號同名;
f. 符號不要與指令助記符、偽指令同名。
(5)常量
數字常數
數字常量有三種表示方式:
十進制數,如:12,5,876,0。
十六進制數,如0x4387,0xFF0, 0x1。
n 進制數,用n-XXX 表示,其中n 為2~9,XXX 為具體的數。如2-010111,8-4363156等。
字符常量
字符常量由一對單引號及中間字符串表示,標准C 語言中的轉義符也可使用。如果需要包含雙引號或“$”,必須使用“”和$$代替。如下示例:
Hello SETS “Hello World!”
Errorl SETS “The parameter ““VFH””error$$2”
布爾常量
布爾常量的邏輯真為{TRUE},邏輯假為{FALSE}。如下示例:
testno SETS {FALSE}
(6)段定義
ARM 匯編程序設計采用分段式設計,一個ARM 源程序至少需要一個代碼段,大的程序可以包含多個代碼段及數據段。
ARM 匯編程序經過匯編處理后生成一個可執行的映象文件,該文件通常包含下面3部分內容:
- 一個或多代碼段。代碼段通常是只讀的。
- 零個或多個包含初始化值的數據段。這些數據段通常是可讀寫的。
- 零個或多個不包含初始值的數據段。這些數據被初始化為0,通常中可讀寫的。
連接器根據一定的規則將各個段安排到內存中的相應位置。源程序中段之間的相鄰關系與執行的映象文件中段之間的相鄰關系並不一定相同。
代碼段的例子如下:
AREA Hello,CODE,READONLY ;聲明代碼段Hello
ENTRY ;程序入口(調試用)
START MOV R7,#10
MOV R6,#5
ADD R6,R6,R7 ;R6=R6+R7
B ;死循環
END
每一個匯編文件都要以END 結束,包括*INC 文件,否則編譯會有警告。
數據段的例子如下:
AREA DataArea,DATA,NOINIT,ALLGN=2
DISPBUF SPACE 100
RCVBUF SPACE 100
…
(7)宏定義及其作用
使用宏定義可以提高程序的可讀性,簡化程序代碼和同步修改。ARM 宏定義與標准C的#define 相似,只在源程序中進行字符代換。宏定義從MACRO 偽指令開始,到MEND 結束,並可以使用參數。
宏要先定義,然后再使用。使用時直接書寫宏名,並根據對應的宏定義格式設置輸入參數或書寫標號等。當源程序被匯編時,匯編編譯器將展開每一個宏調用,用宏定義體代替程序中的宏調用,並使用實際的參數值代替宏定義時的形式參數。
程序程序清單見后,程序中定義了一個宏CALL,用於調用子程序,調用時設置所要調用的子程序名$Function 及兩個入口參數$dat1 和$dat2。由於宏定義體中使用的是MOV 指令,所以$dat1 參數只能為8 位圖的立即數或通用寄存器。
宏應用的例子:
…
MACRO ;宏定義
CALL $Function,$dat1,$dat2 ;宏名稱為CALL,帶3 個參數
IMPORT $Function ;聲明外部子程序
MOV R0,$dat1 ;設置子程序參數,R0=$dat1
MOV R1,$dat2
BL Function ;調用子程序
MEND ;宏定義結束
…
CALL FADD1,#3,#2 ;宏調用
…
匯編預處理后,宏調用將被展開,程序清單如下:
…
IMPORT FADD1
MOV R0,#3
MOV R1,#3
BL FADD1
…
A.5.3 子程序的調用
使用BL 指令進行調用,該指令會把返回的PC 值保存在LR,示例如下:
…
BL DLEAY
…
DELAY …
MOV PC,LR
當子程序執行完畢后,使用MOV、B/BX、STMFD 等指令返回,當然STMFD 要與LDMFD 配套使用,子程序返回的方法:
MOV PC,LR
或 B LR
或 BX LR
或 STMFD SP!{R0-R7,PC }
ARM7TDMI(-S)是沒有BLX 指令的,但是可以通過幾條程序實現其功能,模擬BLX 指令如下:
ADR R1,DELAY+1
MOV LR,PC ;保存返回地址到LR
BX R1 ;跳轉並切換指令集
…
A.5.4 數據比較跳轉
匯編程序可以使用CMP 指令進行兩個數據比較,然后調高相應的ARM 條件碼,實現跳轉。代碼例子如下:
CMP R5,#10
BEQ DOEQUAL ;若R5 為10,則跳轉到DOEQUAL
…
CMP R1,R2
ADDHI R1,R1,#10 ;若R1>R2,則R1=R1+10
ADDLS R1,R1,#5 ;若R1<=R2,則R1=R1+5
…
ANDS R1,R1,#0x80 ;R1=R1&0x80,並設置相應標志位
BNE WAIT ;若R1 的d7 位為則跳轉到WAIT
A.5.5 循環
下面的代碼為循環程序的例子。例子指定循環次數,每循環一次進行減1 操作,並判斷結果是否為0,若為0 則退出循環。
MOV R1,#10
LOOP … ;循環體
SUBS R1,R1,#1
BNE LOOP
…
A.5.6 數據塊復制
程序可以使用存儲器訪問指令LDM/STM 指令進行讀取和存儲,數據塊復制示例如下:
LDR R0,=DATA_DST ;指向數據目標地址
LDR R1,=DATA_SRC ;指向數據源地址
MOV R10,#10 ;復制數據個數為10*N 個字
LOOP LDMIA R1!,{R2-R9} ;N 為LDM/STM 指令操作數據個數
STMIA R0!,{R2-R9}
SUBS R10,R10,#1
BNE LOOP
…
A.5.7 棧操作
ARM 使用存儲器訪問指令LDM/STM 實現棧操作,用於子程序寄存器保存。注意,使用堆棧時,要先分配好堆棧空間,設置好寄存器R13(即堆棧指針SP),否則操作失敗。
OUTDAT
STMFD SP!{R0-R7,LR}
…
BL DELAY
…
LDMFD SP!{R0-R7,PC}
A.5.8 特殊寄存器定義及應用
基於ARM 核的芯片一般有片內外設,它們通過其特殊寄存器訪問。片內外設的使用示例如下:
WDTC EQU 0xE000000 ;寄存器定義
…
LDR R0,=WDTC
MOV R1,#0x12
STR R1,[R0] ;WDTC=0x12
散轉功能
散轉是匯編程序常用的一種算法,其示例如下:
CMP R0,#MAXINDEX ;判斷索引號是否超出最大索引值
ADDLO PC,PC,R0,LSL #2 ;若沒有超出,則跳轉到相應位置
B ERROR ;若已經超出,則進行出錯處理
;散轉表,對應索引號為0~N
B FUN1
B FUN2
B FUN3
…
A.5.9 查表操作
查表操作是匯編程序常用的一種操作,其示例如下:
…
LDR R3,=DISP_TAB ;取得表頭
LDR R2,[R3,R5,LSL #2] ;根據R5 的值查表,取出相應的值
…
;下表為0--F 的字模
DISR_TAB DCD 0xC0,0xF9,0xA4,0x99,0x92
DCD 0x82,0xF8,0x80,0x90,0x88,0x83
DCD 0xC6,0xa1,0x86,0x8E,0xFF
A.5.10 長跳轉
ARM 的B 和BL 指令不能全空間跳轉,但通過對PC 進行賦值,實現32 位地址的跳轉/調用,示例如下:
ADD LR,PC,#4 ;保存返回地址,即RET_FUN
LDR PC,[PC,#-4] ;跳轉到LADR_FUN
DCD LADR_FUN
RET_FUN …
也可使用偽指令LDR PC,=LADR_FUN 實現長跳轉。
A.5.11 對信號量的支持
ARM 提供一條內存與寄存器交換的指令SWP 用於支持信號量的操作,實現系統任務之間的同步或互斥,其使用的例子如下:
DISP_SEM EQU 0x40002A00
…
DISP_WAIT MOV R1,#0
LDR R0,=DISP_SEM
SWP R1,R1[R0] ;取出信號量,並設置其為0
CMP R1,#0 ;判斷是否有信號
BEQ DISP_WAIT ;若沒有信號,則等待
…
A.5.12 偽指令使用
LDR 偽指令和NOP 偽指令應用例子代碼如下:
LDR R1,=0x12345678 ;加載32 位立即數
LDR R0,=LDE_TAB ;加載標號地址
NOP ;空指令
B ;死循環
A.5.13 一個完整的例子
下面是匯編程序完整的例子:
ABC EQU 0x12
;聲明一個代碼段Example
AREA Example,CODE,READONLY
ENIRY
CODE32
ADR R0,Thumb_START+1 ;裝載地址,並設置d0 位為1
BX R0 ;切換到Thumb 狀態
CODE16 ;聲明16 位代碼(Thumb)
Thumb_START
MOV R1,#ABC
ADD R1,R1,#0x10
B Thumb_START
END
A.5.14 外設控制
在32 位的ARM 核芯片中,其外設的控制寄存器中,一般會設置“置位/復位”寄存器,這樣可以方便的實現位操作,而不會影響其它位,如 IOSET=0x01 只會將P0.1 的置位,而其它I/O 狀態不變,另外,ARM 存儲/保存指令具有前偏移功能,所以對外設的控制寄存器進行操作時可使用此功能,避免了每次都加載寄存器地址的操作示例如下:
LDR R0,=GPIO_BASE
MOV R1,#0x00
STR R1,[R0,#0x04] ;IOSET=0x00
MOV R1,#0x10
STR R1,[R0,#0x0C] ;IOCLR=0x101
A.5.15 三級流水線介紹
ARM7TDM(-S)使用三級流水線執行指令,第一階段從內存中取回的指令,第二階段開始解碼,而第三階段實際執行指令。故此,程序計數器總是超出當前執行的指令兩條指令。(在為跳轉指令計算偏移量時必須計算在內)。因為有這個流水線,在跳轉時丟失2 個指令周期(因為要重新添滿流水線)。所以最好利用條件執行指令來避免浪費周期。
條件跳轉示例:
…
CMP R0,#0
BEQ LOOP1
MOV R1,#0x10
MOV R2,#0x88
LOOP1
…
可以寫為更有效的:
…
CMP R0,#0
MOVNE R1,#0x10
MOVNE R2,#0x88
…