在ARM處理器的匯編語言中,對指令語法格式中的<shifter_operand>的常數表達式有這樣的規定:“該常數必須對應8位位圖,即常數是由一個8位的常數循環移位偶數位得到的。
首先從ARM指令系統的語法格式說起:
一條ARM指令語法格式分為如下幾個部分:
<opcode>{<cond>}{S} <Rd>,<Rn>{,<shifter_operand>}
其中,<>內的項是必須的,{}內的項是可選的,如<opcode>是指令助記符,是必須的,而{<cond>}為指令執行條件,是可選的,如果不寫則使用默認條件AL(無條件執行)。
(1)Opcode 指令助記符,如LDR,STR 等
(2)Cond 執行條件,如EQ,NE 等
(3)S 是否影響CPSR 寄存器的值,書寫時影響CPSR,否則不影響
(4)Rd 目標寄存器
(5)Rn 第一個操作數的寄存器
(6)shifter_operand 第二個操作數
其指令編碼格式如下:
31-28 |
27-25 |
24-21 |
20 |
19-16 |
15-12 |
11-0 (12位) |
cond |
001 |
opcode |
S |
Rn |
Rd |
shifter_operand |
當第2 個操作數的形式為:
#immed_8r常數表達式時“該常數必須對應8位位圖,即常數是由一個8位的常數循環移位偶數位得到的。”
其意思是這樣:
#immed_8r在芯片處理時表示一個32位數,但是它是由一個8位數(比如:01011010,即0x5A)通過循環移位偶數位得到(1000 0000 0000 0000 0000 0000 0001 0110,就是0x5A通過循環右移2位(偶數位)的到的)。
而1010 0000 0000 0000 0000 0000 0001 0110,就不符合這樣的規定,編譯時一定出錯。因為你可能通過將1011 0101循環右移位得到它,但是不可能通過循環移位偶數位得到。1011 0000 0000 0000 0000 0000 0001 0110,也不符合這樣的規定,很明顯:1 0110 1011 有9位。
為什么要有這樣的規定?
要從指令編碼格式來解釋(這就是我為什么一開始講的是指令編碼格式),仔細看表格中的shifter_operand所占的位數:12位。要用一個12位的編碼來表示任意的32位數是絕對不可能的(12位數有2^12種可能,而32位數有2^32種)。但是又要用12位的編碼來表示32位數,怎么辦?
只有在表示數的數量上做限制。通過編碼來實現用12位的編碼來表示32位數。
在12位的shifter_operand中:8位存數據,4位存移位的次數。
(1)8位存數據:解釋了“該常數必須對應8位位圖”。
(2)4位存移位的次數:解釋了為什么只能移偶數位。4位只有16種可能值,而32位數可以循環移位32次(32種可能),那就只好限制:只能移偶數位(兩位兩位地移,好像一個16位數在移位,16種移位可能)。這樣就解決了能表示的情況是實際情況一半的矛盾。
所以對#immed_8r常數表達式的限制是解決指令編碼的第二個操作數位數不足以表示32位操作數的無奈之舉,但在我看來:這個可以說是聰明的做法。因為如果直接用12位數來表示32位操作數,只能表示0 到(2^12-1)。大於(2^12-1)的數就沒辦法表示了。而且細細想來“8位存數據,4位存移位的次數”,應該是最好的組合了(我並未想過所有的組合,只是順便試了幾個)。
ARM指令第二操作數#immed_8r詳解:
大多數ARM通用數據處理指令有一個靈活的第2操作數(flexible second operand),這里這解釋一下其中的一種格式,#immed_8r常量的表達式。常量必須對應於8位位圖(pattern)。該位圖在32位字中,被循環移位偶數位(0,2,4,...28,30)。合法常量0xff,0xff000,0xf000000f。非法常量:0x101,0xff04
ARM 在32位模式下,一條指令長度為32位,在上述數據處理指令中,操作數2為12位。所以像0x7f02這樣的數,要兩條指令才能完成。
MOV R3, #0x7F00 ;E3 A0 3C 7F 該指令自己完成0x7f移位
ORR R1, R3, #2
所以直接是找不到0x7f02的
關於循環移位,其實arm中只有循環右移(ROR)。0x7f到0x7f00是通過循環右移24次才實現的,這里每次移動2位所以是12次(0xc)
在 ARM 數據處理指令中, 當參與操作的第二操作數為立即數時, 每個立即數都是采用一個8位的常數循環右移偶數位而間接得到, 其中循環右移的位數有一個4位二進制的2倍表示. 則有效立即數可表示為: <immediate> := immed_8; 循環右移(2×rotate_imm)
. 其中: <immediate>
代表立即數, immed_8
代表8位常數, 即所謂的"8位圖", rotate_imm
代表4位的循環右移值. 這樣一來出現了一個問題: 盡管表示的范圍變大了, 但是12位所能表現的數字的個數是一定的. 因此, ARM 規定並不是所有的32位常數都是合法的立即數, 只有通過上面的構造方法得到的才是合法的立即數, 編譯的時候才不會報錯.
舉個例子吧:
0x3FC(0000 0000 0000 0000 0000 0011 1111 1100) 是由 0xff 循環右移 2 位得到的;
200(0000 0000 0000 0000 0000 0000 1100 1000) 是由 0xc8 循環右移 2 位得到的, 它們都是合法的.
而 0x1FE(0000 0000 0000 0000 0000 0001 1111 1110) 和
511(0000 0000 0000 0000 0000 0001 1111 1111) 無法看成是8位的常數循環右移偶數位而得到的, 因此是非法的.
指令操作數立即數時候,每個立即數由一個8位的常數循環右移偶數位得到。
<immediate>= immed_8 循環右移( 2*rotate_imm)
打個比如:
1.立即數0xF200是由0xCF2間接表示的,即是由8位的0xF2循環右移24(2*12)得到的immed_8 == 0xF2; rotate_imm == 0xC
2.立即數0x3F0是由0xE3F間接表示的,即是由8位的0x3F循環右移28(2*14)得到的immed_8 == 0x3F; rotate_imm == 0xE或者立即數0x3F0是由0xFFC間接表示的,即是由8位的0xFC循環右移30(2*15)得到的immed_8 == 0xFC; rotate_imm == 0xF
表示方法有好幾種
PS:其實你沒必要一個一個的算,只要利用LDR偽指令就可以了,例如:
ldr r1, =12345678
編譯器自然會給你做工作,現實的編程中應該也是這個居多吧
比較下來, 我們可以這樣總結:
- 判斷一個數是否符合8位位圖的原則, 首先看這個數的二進制表示中1的個數是否不超過8個. 如果不超過8個, 再看這n個1(n<=8)是否能同時放到8個二進制位中, 如果可以放進去, 再看這八個二進制位是否可以循環右移偶數位得到我們欲使用的數. 如果可以, 則此數符合8位位圖原理, 是合法的立即數. 否則, 不符合.
- 無法表示的32位數, 只有通過邏輯或算術運算等其它途徑獲得了. 比如0xffffff00, 可以通過0x000000ff按位取反得到.
因此以后的編程中, 時刻檢查用到的第二操作數是否符合8位位圖是一件千萬不能疏忽的事. 至於為什么要將這12位 operand2
"八四開", 這個問題就要請教大牛了.
- 把數據轉換成二進制,從低到高寫成 4 個一組,最高位不夠一組的補 0;
- 數 1 的個數,如果大於 8 個,肯定不是立即數,如果小於 8 個看步驟 3;
- 如果數據當中有連續大於等於 24 個 0,循環左移偶數位,使高位全部是 0;
- 找最高位 1,去掉前面的最大的偶數個 0 ;
- 找到最低位的 1,去掉后面最大偶數個 0;
- 數剩下的位數,如果小於等於 8 位,那么這個數就是立即數,否則不是立即數。