【Go】優雅的讀取http請求或響應的數據-續

本文轉載自查看原文 2019-02-01 21:09 2193 bytes/ ioutil/ go/ pool/ http/ makeSlice/ net.http/ buffer

原文鏈接：https://blog.thinkeridea.com/201902/go/you_ya_de_du_qu_http_qing_qiu_huo_xiang_ying_de_shu_ju_2.html

之前發布【Go】優雅的讀取http請求或響應的數據文章，網友 “wxe” 咨詢：“優化前后的請求耗時變化有多大”，之前只分析了內存分配，這篇文章用單元測試的方式分析優化前后的耗時情況，本文源碼。

非常感謝 “wxe” 網友的提問，讓我在測試過程中發現一個 json 序列化的問題。

之前我們優化了兩個部分，json 與 ioutil.ReadAll，先對比 ioutil.ReadAll, 這里測試的代碼分成兩個部分做對比，一部分單純對比 ioutil.ReadAll 和 io.Copy + sync.Pool，另一部分增加 jsoniter.Unmarshal 來延遲 pool.Put(buffer) 的執行, 源碼。

package iouitl_readall

import (
	"bytes"
	"io"
	"io/ioutil"
	"sync"

	jsoniter "github.com/json-iterator/go"
)

var pool = sync.Pool{
	New: func() interface{} {
		return bytes.NewBuffer(make([]byte, 4096))
	},
}

func IoCopyAndJson(r io.Reader) error {
	buffer := pool.Get().(*bytes.Buffer)
	buffer.Reset()
	defer pool.Put(buffer)

	res := Do(r)
	_, err := io.Copy(buffer, res)
	if err != nil {
		return err
	}

	m := map[string]string{}
	err = jsoniter.Unmarshal(buffer.Bytes(), &m)
	return err
}

func IouitlReadAllAndJson(r io.Reader) error {
	res := Do(r)
	data, err := ioutil.ReadAll(res)
	if err != nil {
		return err
	}

	m := map[string]string{}
	err = jsoniter.Unmarshal(data, &m)
	return err
}

func IoCopy(r io.Reader) error {
	buffer := pool.Get().(*bytes.Buffer)
	buffer.Reset()
	defer pool.Put(buffer)

	res := Do(r)
	_, err := io.Copy(buffer, res)
	if err != nil {
		return err
	}

	return err
}

func IouitlReadAll(r io.Reader) error {
	res := Do(r)
	data, err := ioutil.ReadAll(res)
	if err != nil {
		return err
	}
	_ = data
	return err
}

測試代碼如下源碼:

package iouitl_readall

import (
	"bytes"
	"testing"
)

var data = bytes.Repeat([]byte("ABCD"), 1000)

func BenchmarkIouitlReadAll(b *testing.B) {
	b.RunParallel(func(pb *testing.PB) {
		for pb.Next() {
			err := IouitlReadAll(bytes.NewReader(data))
			if err != nil {
				b.Error(err.Error())
			}
		}
	})
}

func BenchmarkIoCopy(b *testing.B) {
	b.RunParallel(func(pb *testing.PB) {
		for pb.Next() {
			err := IoCopy(bytes.NewReader(data))
			if err != nil {
				b.Error(err.Error())
			}
		}
	})
}

func BenchmarkIouitlReadAllAndJson(b *testing.B) {
	b.RunParallel(func(pb *testing.PB) {
		for pb.Next() {
			err := IouitlReadAllAndJson(bytes.NewReader(data))
			if err != nil {
				b.Error(err.Error())
			}
		}
	})
}

func BenchmarkIoCopyAndJson(b *testing.B) {
	b.RunParallel(func(pb *testing.PB) {
		for pb.Next() {
			err := IoCopyAndJson(bytes.NewReader(data))
			if err != nil {
				b.Error(err.Error())
			}
		}
	})
}

測試結果如下:

goos: darwin
goarch: amd64
pkg: github.com/thinkeridea/example/iouitl_readall
BenchmarkIouitlReadAll-8          	  500000	      2752 ns/op	   14496 B/op	       6 allocs/op
BenchmarkIoCopy-8                 	20000000	        65.2 ns/op	      48 B/op	       1 allocs/op
BenchmarkIouitlReadAllAndJson-8   	  100000	     20022 ns/op	   46542 B/op	     616 allocs/op
BenchmarkIoCopyAndJson-8          	  100000	     17615 ns/op	   32102 B/op	     611 allocs/op

結論：

可以發現 IoCopy 方法是 IouitlReadAll 方法效率的 40 倍，內存分配也很少，而 IoCopyAndJson 和 IouitlReadAllAndJson 的效率差異極小僅有 2407ns，大約是 1.13倍，不過內存分配還是少了很多的，為什么會這樣呢，這就是 sync.Pool 的導致的，sync.Pool 每次獲取使用時間越短，命中率就越高，就可以減少創建新的緩存，這樣效率就會大大提高，而 jsoniter.Unmarshal 很耗時，就導致 sync.Pool 的命中率降低了，所以性能下降極其明顯.

使用 io.Copy + sync.Pool 表面上執行效率不會有很大提升，但是會大幅度減少內存分配，從而可以減少 GC 的負擔，在單元測試中我們並沒有考慮 GC 的問題，而 GC 能帶來的性能提升會更有優勢。

在看一下 json 使用 sync.Pool 的效果吧源碼

package iouitl_readall

import (
	"bytes"
	"encoding/json"

	jsoniter "github.com/json-iterator/go"
)

func Json(r map[string]string) error {
	data, err := json.Marshal(r)
	if err != nil {
		return err
	}

	_ = data
	return nil
}

func JsonPool(r map[string]string) error {
	buffer := pool.Get().(*bytes.Buffer)
	buffer.Reset()
	defer pool.Put(buffer)

	e := json.NewEncoder(buffer)
	err := e.Encode(r)
	if err != nil {
		return err
	}

	return nil
}

func JsonIter(r map[string]string) error {
	data, err := jsoniter.Marshal(r)
	if err != nil {
		return err
	}

	_ = data
	return nil
}

func JsonIterPool(r map[string]string) error {
	buffer := pool.Get().(*bytes.Buffer)
	buffer.Reset()
	defer pool.Put(buffer)

	e := jsoniter.NewEncoder(buffer)
	err := e.Encode(r)
	if err != nil {
		return err
	}

	return nil
}

性能測試代碼源碼:

package iouitl_readall

import (
	"strconv"
	"strings"
	"testing"
)

var request map[string]string

func init() {
	request = make(map[string]string, 100)
	for i := 0; i < 100; i++ {
		request["X"+strconv.Itoa(i)] = strings.Repeat("A", i/2)
	}
}
func BenchmarkJson(b *testing.B) {
	b.RunParallel(func(pb *testing.PB) {
		for pb.Next() {
			err := Json(request)
			if err != nil {
				b.Error(err.Error())
			}
		}
	})
}

func BenchmarkJsonIter(b *testing.B) {
	b.RunParallel(func(pb *testing.PB) {
		for pb.Next() {
			err := JsonIter(request)
			if err != nil {
				b.Error(err.Error())
			}
		}
	})
}

func BenchmarkJsonPool(b *testing.B) {
	b.RunParallel(func(pb *testing.PB) {
		for pb.Next() {
			err := JsonPool(request)
			if err != nil {
				b.Error(err.Error())
			}
		}
	})
}

func BenchmarkJsonIterPool(b *testing.B) {
	b.RunParallel(func(pb *testing.PB) {
		for pb.Next() {
			err := JsonIterPool(request)
			if err != nil {
				b.Error(err.Error())
			}
		}
	})
}

測試結果如下:

goos: darwin
goarch: amd64
pkg: github.com/thinkeridea/example/iouitl_readall
BenchmarkJson-8                   	  100000	     13297 ns/op	   13669 B/op	     207 allocs/op
BenchmarkJsonPool-8               	  100000	     13310 ns/op	   10218 B/op	     206 allocs/op
BenchmarkJsonIter-8               	  500000	      2948 ns/op	    3594 B/op	       4 allocs/op
BenchmarkJsonIterPool-8           	  200000	      6126 ns/op	    6040 B/op	     144 allocs/op
PASS
ok  	github.com/thinkeridea/example/iouitl_readall	12.716s

這里使用了兩個 json 包，一個是標准庫的，一個是 jsoniter (也是社區反饋效率最高的)，對比兩個包使用 sync.Pool 和不使用之間的差異，發現標准庫 json 包使用后內存有少量減少，但是運行效率稍微下降了，差異不是很大，jsoniter 包差異之所謂非常明顯，發現使用 sync.Pool 之后不僅內存分配更多了，執行效率也大幅度下降，差了將近3倍有余。

是不是很奔潰，這是啥情況 jsoniter 本身就使用了 sync.Pool 作緩沖，我們使用 jsoniter.NewEncoder(buffer) 創建一個序列化實例，但是其內部並沒有直接使用 io.Writer 而是先使用緩沖序列化數據，之后寫入 io.Writer, 具體代碼如下：

// Flush writes any buffered data to the underlying io.Writer.
func (stream *Stream) Flush() error {
	if stream.out == nil {
		return nil
	}
	if stream.Error != nil {
		return stream.Error
	}
	n, err := stream.out.Write(stream.buf)
	if err != nil {
		if stream.Error == nil {
			stream.Error = err
		}
		return err
	}
	stream.buf = stream.buf[n:]
	return nil
}

這樣一來我們使用 buffer 做 json 序列化優化效果就大打折扣，甚至適得其反了。

再次感謝 “wxe” 網友的提問，這里沒有使用實際的應用場景做性能測試，主要發現在性能測試中使用 http 服務會導致 connect: can't assign requested address 問題，所以測試用使用了函數模擬，如果有朋友有更好的測試方法歡迎一起交流。

轉載：

本文作者：戚銀（thinkeridea）

本文鏈接： https://blog.thinkeridea.com/201902/go/you_ya_de_du_qu_http_qing_qiu_huo_xiang_ying_de_shu_ju_2.html

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 HTTP請求響應格式 Flask HTTP請求與響應【HTTP】HTTP協議的請求與響應使用tcpdump查看HTTP請求響應詳細信息數據 HTTP 請求/響應報文數據結構【GO】http請求代理 Ajax_HTTP請求以及響應 HTTP請求頭和響應頭 VBS進行http請求及JSON數據的讀取和生成 HTTP：HTTP請求頭和響應頭詳解