高並發下的 AtomicLong 性能有點差!【轉】


https://mp.weixin.qq.com/s?__biz=MzU2NjIzNDk5NQ==&mid=2247485812&idx=1&sn=9bd9f4da67c26389f2ddb863df9d3f13&chksm=fcaed368cbd95a7e7d43c5f4ea521ea2be5a6f08afb53db2c9f7b62852893bf2add5bdd18878&scene=0&xtrack=1&key=26419cf260e57da27a497ee3e8539b118a5465a64b00273cf4ea6c6bd4607d62ae1776e6f9243ed088d8cea24f8a7fa796c8d14e3a29a8c97f6494a413eef5c7b744ccb1bb9beafaeae00ccde1e33055&ascene=0&uin=MTA5ODA4NTExOA%3D%3D&devicetype=iMac+MacBookAir7%2C2+OSX+OSX+10.14.3+build(18D109)&version=12020710&nettype=WIFI&lang=zh_CN&fontScale=100&pass_ticket=eRTIIVLd6l8rI%2Bn2%2BAYhyH9s7xNFfcOEYmamqzbM1GU2wPaxXWqGJ3WZYmvyw4zO

 

如果讓你實現一個計數器,有點經驗的同學可以很快的想到使用AtomicInteger或者AtomicLong進行簡單的封裝。

因為計數器操作涉及到內存的可見性和線程之間的競爭,而Atomic*的實現完美的屏蔽了這些技術細節,我們只需要執行相應的方法,就能實現對應的業務需求。

Atomic**雖然好用,不過這些的操作在並發量很大的情況下,性能問題也會被相應的放大。我們可以先看下其中 getAndIncrement的實現代碼

  1. public final long getAndIncrement() {

  2. return unsafe.getAndAddLong(this, valueOffset, 1L);

  3. }

  4.  

  5. // unsafe類中的實現

  6. public final long getAndAddLong(Object var1, long var2, long var4) {

  7. long var6;

  8. do {

  9. var6 = this.getLongVolatile(var1, var2);

  10. } while(!this.compareAndSwapLong(var1, var2, var6, var6 + var4));

  11.  

  12. return var6;

  13. }

很顯然,在 getAndAddLong實現中,為了實現正確的累加操作,如果並發量很大的話,cpu會花費大量的時間在試錯上面,相當於一個spin的操作。如果並發量小的情況,這些消耗可以忽略不計。

既然已經意識到Atomic*有這樣的缺陷,Doug Lea大神又給我們提供了LongAdder,內部的實現有點類似ConcurrentHashMap的分段鎖,最好的情況下,每個線程都有獨立的計數器,這樣可以大量減少並發操作。

下面通過JMH比較一下AtomicLong 和 LongAdder的性能。

  1. @OutputTimeUnit(TimeUnit.MICROSECONDS)

  2. @BenchmarkMode(Mode.Throughput)

  3. public class Main {

  4.  

  5. private static AtomicLong count = new AtomicLong();

  6. private static LongAdder longAdder = new LongAdder();

  7. public static void main(String[] args) throws Exception {

  8. Options options = new OptionsBuilder().include(Main.class.getName()).forks(1).build();

  9. new Runner(options).run();

  10. }

  11.  

  12. @Benchmark

  13. @Threads(10)

  14. public void run0(){

  15. count.getAndIncrement();

  16. }

  17.  

  18. @Benchmark

  19. @Threads(10)

  20. public void run1(){

  21. longAdder.increment();

  22. }

  23. }

1、設置BenchmarkMode為Mode.Throughput,測試吞吐量 2、設置BenchmarkMode為Mode.AverageTime,測試平均耗時

線程數為1

1、吞吐量

  1. Benchmark Mode Cnt Score Error Units

  2. Main.run0 thrpt 5 154.525 ± 9.767 ops/us

  3. Main.run1 thrpt 5 89.599 ± 7.951 ops/us

2、平均耗時

  1. Benchmark Mode Cnt Score Error Units

  2. Main.run0 avgt 5 0.007 ± 0.001 us/op

  3. Main.run1 avgt 5 0.011 ± 0.001 us/op

單線程情況下: 1、AtomicLong的吞吐量和平均耗時都占優勢

線程數為10

1、吞吐量

  1. Benchmark Mode Cnt Score Error Units

  2. Main.run0 thrpt 5 37.780 ± 1.891 ops/us

  3. Main.run1 thrpt 5 464.927 ± 143.207 ops/us

2、平均耗時

  1. Benchmark Mode Cnt Score Error Units

  2. Main.run0 avgt 5 0.290 ± 0.038 us/op

  3. Main.run1 avgt 5 0.021 ± 0.001 us/op

並發線程為10個時:

  • LongAdder的吞吐量比較大,是AtomicLong的10倍多。

  • LongAdder的平均耗時是AtomicLong的十分之一。

線程數為30

1、吞吐量

  1. Benchmark Mode Cnt Score Error Units

  2. Main.run0 thrpt 5 36.215 ± 2.341 ops/us

  3. Main.run1 thrpt 5 486.630 ± 26.894 ops/us

2、平均耗時

  1. Main.run0 avgt 5 0.792 ± 0.021 us/op

  2. Main.run1 avgt 5 0.063 ± 0.002 us/op

線程數為30個時:

  • LongAdder的吞吐量比較大,也是AtomicLong的10倍多。

  • LongAdder的平均耗時也是AtomicLong的十分之一。

總結

一些高並發的場景,比如限流計數器,建議使用LongAdder替換AtomicLong,性能可以提升不少。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM