本文轉載自查看原文 2020-06-05 21:08 557 GO匯編

匯編語言的為例

系統調用

//
// System calls for AMD64, Linux
//

// func Syscall(trap int64, a1, a2, a3 uintptr) (r1, r2, err uintptr);
// Trap # in AX, args in DI SI DX R10 R8 R9, return in AX DX
// Note that this differs from "standard" ABI convention, which
// would pass 4th arg in CX, not R10.

// func SyscallWrite_Darwin(fd int, msg string) int
TEXT ·SyscallWrite_Darwin(SB), NOSPLIT, $0
    MOVQ $(0x2000000+4), AX // #define SYS_write 4
    MOVQ fd+0(FP),       DI
    MOVQ msg_data+8(FP), SI
    MOVQ msg_len+16(FP), DX
    SYSCALL
    MOVQ AX, ret+0(FP)
    RET

func SyscallWrite_Darwin(fd int, msg string) int

func main() {
    if runtime.GOOS == "darwin" {
        SyscallWrite_Darwin(1, "hello syscall!\n")
    }
}

直接調用C函數

#include <stdint.h>

int64_t myadd(int64_t a, int64_t b) {
    return a+b;
}

func asmCallCAdd(cfun uintptr, a, b int64) int64

// System V AMD64 ABI
// func asmCallCAdd(cfun uintptr, a, b int64) int64
TEXT ·asmCallCAdd(SB), NOSPLIT, $0
    MOVQ cfun+0(FP), AX // cfun
    MOVQ a+8(FP),    DI // a
    MOVQ b+16(FP),   SI // b
    CALL AX
    MOVQ AX, ret+24(FP)
    RET

/*
#include <stdint.h>

int64_t myadd(int64_t a, int64_t b) {
    return a+b;
}
*/
import "C"

import (
    asmpkg "path/to/asm"
)

func main() {
    if runtime.GOOS != "windows" {
        println(asmpkg.asmCallCAdd(
            uintptr(unsafe.Pointer(C.myadd)),
            123, 456,
        ))
    }
}

AVX指令

package cpu

var X86 x86

// The booleans in x86 contain the correspondingly named cpuid feature bit.
// HasAVX and HasAVX2 are only set if the OS does support XMM and YMM registers
// in addition to the cpuid feature bit being set.
// The struct is padded to avoid false sharing.
type x86 struct {
    HasAES       bool
    HasADX       bool
    HasAVX       bool
    HasAVX2      bool
    HasBMI1      bool
    HasBMI2      bool
    HasERMS      bool
    HasFMA       bool
    HasOSXSAVE   bool
    HasPCLMULQDQ bool
    HasPOPCNT    bool
    HasSSE2      bool
    HasSSE3      bool
    HasSSSE3     bool
    HasSSE41     bool
    HasSSE42     bool
}

import (
    cpu "path/to/cpu"
)

func main() {
    if cpu.X86.HasAVX2 {
        // support AVX2
    }
}

// func CopySlice_AVX2(dst, src []byte, len int)
TEXT ·CopySlice_AVX2(SB), NOSPLIT, $0
    MOVQ dst_data+0(FP),  DI
    MOVQ src_data+24(FP), SI
    MOVQ len+32(FP),      BX
    MOVQ $0,              AX

LOOP:
    VMOVDQU 0(SI)(AX*1), Y0
    VMOVDQU Y0, 0(DI)(AX*1)
    ADDQ $32, AX
    CMPQ AX, BX
    JL   LOOP
    RET

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

GO匯編-匯編語言的為例

匯編語言的為例

系統調用

系統調用雖然簡單，但是它是操作系統對外的接口，因此不同的操作系統調用規范可能有很大地差異。我們先看看Linux在AMD64架構上的系統調用規范，在syscall/asm_linux_amd64.s文件中有注釋說明：

這是syscall.Syscall函數的內部注釋，簡要說明了Linux系統調用的規范。系統調用的前6個參數直接由DI、SI、DX、R10、R8和R9寄存器傳輸，結果由AX和DX寄存器返回。macOS等類UINX系統調用的參數傳輸大多數都采用類似的規則。

我們將基於write系統調用包裝一個字符串輸出函數。下面的代碼是macOS版本：

這樣我們就基於系統調用包裝了一個定制的輸出函數。在UNIX系統中，標准輸入stdout的文件描述符編號是1，因此我們可以用1作為參數實現字符串的輸出：

如果是Linux系統，只需要將編號改為write系統調用對應的1即可。而Windows的系統調用則有另外的參數傳輸規則。在X64環境Windows的系統調用參數傳輸規則和默認的C語言規則非常相似，在后續的直接調用C函數部分再行討論。

直接調用C函數

在計算機的發展的過程中，C語言和UNIX操作系統有着不可替代的作用。因此操作系統的系統調用、匯編語言和C語言函數調用規則幾個技術是密切相關的。

在理解了C語言函數的調用規范之后，匯編代碼就可以繞過CGO技術直接調用C語言函數。為了便於演示，我們先用C語言構造一個簡單的加法函數myadd：

然后我們需要實現一個asmCallCAdd函數：

下面是System V AMD64 ABI規范的asmCallCAdd函數的實現：

然后我們就可以使用asmCallCAdd函數直接調用C函數了：

AVX指令

internal/cpu包針對X86處理器提供了以下特性檢測：

因此我們可以用以下的代碼測試運行時的CPU是否支持AVX2指令集：

AVX512是比較新的指令集，只有高端的CPU才會提供支持。為了主流的CPU也能運行代碼測試，我們選擇AVX2指令來構造例子。AVX2指令每次可以處理32字節的數據，可以用來提升數據復制的工作的效率。

下面的例子是用AVX2指令復制數據，每次復制數據32字節倍數大小的數據：

其中VMOVDQU指令先將0(SI)(AX*1)地址開始的32字節數據復制到Y0寄存器中，然后再復制到0(DI)(AX*1)對應的目標內存中。VMOVDQU指令操作的數據地址可以不用對齊。

AVX2共有16個Y寄存器，每個寄存器有256bit位。如果要復制的數據很多，可以多個寄存器同時復制，這樣可以利用更高效的流水特性優化性能。

免責聲明！

系統調用雖然簡單，但是它是操作系統對外的接口，因此不同的操作系統調用規范可能有很大地差異。我們先看看Linux在AMD64架構上的系統調用規范，在`syscall/asm_linux_amd64.s`文件中有注釋說明：

這是`syscall.Syscall`函數的內部注釋，簡要說明了Linux系統調用的規范。系統調用的前6個參數直接由`DI、SI、DX、R10、R8和R9`寄存器傳輸，結果由`AX和DX`寄存器返回。macOS等類UINX系統調用的參數傳輸大多數都采用類似的規則。

其中VMOVDQU指令先將`0(SI)(AX1)`地址開始的32字節數據復制到Y0寄存器中，然后再復制到`0(DI)(AX1)`對應的目標內存中。VMOVDQU指令操作的數據地址可以不用對齊。