高并发下的 AtomicLong 性能有点差！【转】

本文转载自查看原文 2019-03-28 18:03 1188 转载待整理

https://mp.weixin.qq.com/s?__biz=MzU2NjIzNDk5NQ==&mid=2247485812&idx=1&sn=9bd9f4da67c26389f2ddb863df9d3f13&chksm=fcaed368cbd95a7e7d43c5f4ea521ea2be5a6f08afb53db2c9f7b62852893bf2add5bdd18878&scene=0&xtrack=1&key=26419cf260e57da27a497ee3e8539b118a5465a64b00273cf4ea6c6bd4607d62ae1776e6f9243ed088d8cea24f8a7fa796c8d14e3a29a8c97f6494a413eef5c7b744ccb1bb9beafaeae00ccde1e33055&ascene=0&uin=MTA5ODA4NTExOA%3D%3D&devicetype=iMac+MacBookAir7%2C2+OSX+OSX+10.14.3+build(18D109)&version=12020710&nettype=WIFI&lang=zh_CN&fontScale=100&pass_ticket=eRTIIVLd6l8rI%2Bn2%2BAYhyH9s7xNFfcOEYmamqzbM1GU2wPaxXWqGJ3WZYmvyw4zO

如果让你实现一个计数器，有点经验的同学可以很快的想到使用AtomicInteger或者AtomicLong进行简单的封装。

因为计数器操作涉及到内存的可见性和线程之间的竞争，而Atomic*的实现完美的屏蔽了这些技术细节，我们只需要执行相应的方法，就能实现对应的业务需求。

Atomic**虽然好用，不过这些的操作在并发量很大的情况下，性能问题也会被相应的放大。我们可以先看下其中 getAndIncrement的实现代码

public final long getAndIncrement() {
return unsafe.getAndAddLong(this, valueOffset, 1L);
}
// unsafe类中的实现
public final long getAndAddLong(Object var1, long var2, long var4) {
long var6;
do {
var6 = this.getLongVolatile(var1, var2);
} while(!this.compareAndSwapLong(var1, var2, var6, var6 + var4));
return var6;
}

很显然，在 getAndAddLong实现中，为了实现正确的累加操作，如果并发量很大的话，cpu会花费大量的时间在试错上面，相当于一个spin的操作。如果并发量小的情况，这些消耗可以忽略不计。

既然已经意识到Atomic*有这样的缺陷，Doug Lea大神又给我们提供了LongAdder，内部的实现有点类似ConcurrentHashMap的分段锁，最好的情况下，每个线程都有独立的计数器，这样可以大量减少并发操作。

下面通过JMH比较一下AtomicLong 和 LongAdder的性能。

@OutputTimeUnit(TimeUnit.MICROSECONDS)
@BenchmarkMode(Mode.Throughput)
public class Main {
private static AtomicLong count = new AtomicLong();
private static LongAdder longAdder = new LongAdder();
public static void main(String[] args) throws Exception {
Options options = new OptionsBuilder().include(Main.class.getName()).forks(1).build();
new Runner(options).run();
}
@Benchmark
@Threads(10)
public void run0(){
count.getAndIncrement();
}
@Benchmark
@Threads(10)
public void run1(){
longAdder.increment();
}
}

1、设置BenchmarkMode为Mode.Throughput，测试吞吐量 2、设置BenchmarkMode为Mode.AverageTime，测试平均耗时

线程数为1

1、吞吐量

Benchmark Mode Cnt Score Error Units
Main.run0 thrpt 5 154.525 ± 9.767 ops/us
Main.run1 thrpt 5 89.599 ± 7.951 ops/us

2、平均耗时

Benchmark Mode Cnt Score Error Units
Main.run0 avgt 5 0.007 ± 0.001 us/op
Main.run1 avgt 5 0.011 ± 0.001 us/op

单线程情况下： 1、AtomicLong的吞吐量和平均耗时都占优势

线程数为10

1、吞吐量

Benchmark Mode Cnt Score Error Units
Main.run0 thrpt 5 37.780 ± 1.891 ops/us
Main.run1 thrpt 5 464.927 ± 143.207 ops/us

2、平均耗时

Benchmark Mode Cnt Score Error Units
Main.run0 avgt 5 0.290 ± 0.038 us/op
Main.run1 avgt 5 0.021 ± 0.001 us/op

并发线程为10个时：

LongAdder的吞吐量比较大，是AtomicLong的10倍多。
LongAdder的平均耗时是AtomicLong的十分之一。

线程数为30

1、吞吐量

Benchmark Mode Cnt Score Error Units
Main.run0 thrpt 5 36.215 ± 2.341 ops/us
Main.run1 thrpt 5 486.630 ± 26.894 ops/us

2、平均耗时

Main.run0 avgt 5 0.792 ± 0.021 us/op
Main.run1 avgt 5 0.063 ± 0.002 us/op

线程数为30个时：

LongAdder的吞吐量比较大，也是AtomicLong的10倍多。
LongAdder的平均耗时也是AtomicLong的十分之一。

总结

一些高并发的场景，比如限流计数器，建议使用LongAdder替换AtomicLong，性能可以提升不少。

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 高并发下redis (转)高并发下怎么做余额扣减？ mysql 高并发下查询很慢_高并发下的MySQL 高并发下的HashMap，ConcurrentHashMap 漫画：高并发下的HashMap php高并发下的抢购利用听云Server和听云Network实测Kubernetes和Mesos在高并发下的网络性能高并发的socket的高性能设计【转】高并发下日志组件的各种实现方式高并发下的抢购/秒杀功能