2.1 原子操作

导读

本章主要讲述多线程竞争下的原子操作。

在 1.2 章节的线程模型中，我们了解到了 CPU 缓存机制，在本章中需要应用到这些知识。

知识点

竞争条件

当两个或两个以上的线程访问共享数据，并且尝试同时改变它时，就会发生争用的情况。它们所依赖的那部分共享数据，叫做竞争条件。

数据争用是竞争条件中的一种，出现竞争条件可能会导致内存(数据)损坏或者出现不确定性的行为。

在操作系统中，会学到临界资源、临界区之类的知识，这里就不提了，只涉及 .NET 部分的概念。

线程同步

如果有 N 个线程都会执行某个操作，当一个线程正在执行这个操作时，其它线程都必须依次等待，这就是线程同步。

多线程环境下出现竞争条件，通常是没有执行正确的同步而导致的。

CPU时间片和上下文切换

时间片(timeslice)是操作系统分配给每个正在运行的进程微观上的一段 CPU 时间。

首先，内核会给每个进程分配相等的初始时间片，然后每个进程轮番地执行相应的时间，当所有进程都处于时间片耗尽的状态时，内核会重新为每个进程计算并分配时间片，如此往复。

请参考：https://zh.wikipedia.org/wiki/%E6%97%B6%E9%97%B4%E7%89%87

上下文切换（Context Switch），也称做进程切换或任务切换，是指 CPU 从一个进程或线程切换到另一个进程或线程。

在接受到中断（Interrupt）的时候，CPU 必须要进行上下文交换。进行上下文切换时，会带来性能损失。

请参考[https://zh.wikipedia.org/wiki/上下文交換

阻塞

阻塞状态指线程处于等待状态。当线程处于阻塞状态时，会尽可能少占用 CPU 时间。

当线程从运行状态(Runing)变为阻塞状态时(WaitSleepJoin)，操作系统就会将此线程占用的 CPU 时间片分配给别的线程。当线程恢复运行状态时(Runing)，操作系统会重新分配 CPU 时间片。

分配 CPU 时间片时，会出现上下文切换。

内核模式和用户模式

只有操作系统才能切换线程、挂起线程，因此阻塞线程是由操作系统处理的，这种方式被称为内核模式(kernel-mode)。

Sleep()、Join() 等，都是使用内核模式来阻塞线程，实现线程同步(等待)。

内核模式实现线程等待时，出现上下文切换。这适合等待时间比较长的操作，这样会减少大量的 CPU 时间损耗。

如果线程只需要等待非常微小的时间，阻塞线程带来的上下文切换代价会比较大，这时我们可以使用自旋，来实现线程同步，这一方法称为用户模式(user-mode)。

Interlocked 类

Interlocked 为多个线程共享的变量提供原子操作。

使用 Interlocked 类避免竞争条件，可以在不阻塞线程(lock、Monitor)的情况下，对目标对象做修改。

Interlocked 类是静态类，让我们先来看看 Interlocked 的常用方法：

方法	作用
CompareExchange()	比较两个数是否相等，如果相等，则替换第一个值。
Decrement()	以原子操作的形式递减指定变量的值并存储结果。
Exchange()	以原子操作的形式，设置为指定的值并返回原始值。
Increment()	以原子操作的形式递增指定变量的值并存储结果。
Add()	对两个数进行求和并用和替换第一个整数，上述操作作为一个原子操作完成。
Read()	返回一个以原子操作形式加载的值。

全部方法请查看：https://docs.microsoft.com/zh-cn/dotnet/api/system.threading.interlocked?view=netcore-3.1#methods

1，CPU 缓存问题

问题：

C# 中赋值和一些简单的数学运算不是原子操作，受多线程环境影响，可能会出现问题。

我们可以使用 lock 和 Monitor 来解决这些问题，但是还有没有更加简单的方法呢？

首先我们编写以下代码：

        private static int sum = 0;
        public static void AddOne()
        {
            for (int i = 0; i < 100_0000; i++)
            {
                sum += 1;
            }
        }

这个方法的工作完成后，sum 会 +100。

我们在 Main 方法中调用：

        static void Main(string[] args)
        {
            AddOne();
            AddOne();
            AddOne();
            AddOne();
            AddOne();
            Console.WriteLine("sum = " + sum);
        }

结果肯定是 5000000，无可争议的。

但是这样会慢一些，如果作死，要多线程同时执行呢？

好的，Main 方法改成如下：

        static void Main(string[] args)
        {
            for (int i = 0; i < 5; i++)
            {
                Thread thread = new Thread(AddOne);
                thread.Start();
            }

            Thread.Sleep(TimeSpan.FromSeconds(2));
            Console.WriteLine("sum = " + sum);
        }

笔者运行一次，出现了 sum = 2633938

我们将每次运算的结果保存到数组中，截取其中一段发现：

多个线程使用同一个变量进行操作时，并不知道此变量已经在其它线程中发生改变，导致执行完毕后结果不符合期望。

我们可以通过下面这张图来解释：

操作值类型时，其内存位置的值会被复制到 CPU 缓存中，例如 CPU1 将 sum 值复制到 L2 中，CPU1 还没有将计算后的结果放到 L3， CPU2 读取了一个旧值，即 CPU2 发生脏读，此时 CPU1、CPU2 操作的 int sum 导致数据混乱。

因此，这里就需要原子操作，在某个时刻，必须只有一个线程能够进行某个操作。而上面的操作，指的是读取、计算、写入这一过程。

当然，我们可以使用 lock 或者 Monitor 来解决，但是这样会带来比较大的性能损失。

这时 Interlocked 就起作用了，对于一些简单的操作运算， Interlocked 可以实现原子性的操作。

实现原子性，可以通过多种锁来解决，目前我们学习到了 lock、Monitor，现在来学习 Interlocked ，后面会学到更加多的锁的实现。

2，Interlocked.Increment()

用于自增操作。

我们修改一下 AddOne 方法：

        public static void AddOne()
        {
            for (int i = 0; i < 100_0000; i++)
            {
                Interlocked.Increment(ref sum);
            }
        }

然后运行，你会发现结果 sum = 5000000 ，这就对了。

说明 Interlocked 可以对简单值类型进行原子操作。

Interlocked.Increment() 是递增，而 Interlocked.Decrement() 是递减。

3，Interlocked.Exchange()

Interlocked.Exchange() 实现赋值运算。

这个方法有多个重载，我们找其中一个来看看：

public static int Exchange(ref int location1, int value);

意思是将 value 赋给 location1 ，然后返回 location1 改变之前的值。

测试：

        static void Main(string[] args)
        {
            int a = 1;
            int b = 5;

            // a 改变前为1
            int result1 = Interlocked.Exchange(ref a, 2);

            Console.WriteLine($"a新的值 a = {a}   |  a改变前的值 result1 = {result1}");

            Console.WriteLine();

            // a 改变前为 2，b 为 5
            int result2 = Interlocked.Exchange(ref a, b);

            Console.WriteLine($"a新的值 a = {a}   | b不会变化的  b = {b}   |   a 之前的值  result2 = {result2}");
        }

另外 Exchange() 也有对引用类型的重载：

Exchange<T>(T, T)

4，Interlocked.CompareExchange()

其中一个重载：

public static int CompareExchange (ref int location1, int value, int comparand)

比较两个 32 位有符号整数是否相等，如果相等，则替换第一个值。

如果 comparand 和 location1 中的值相等，则将 value 存储在 location1中。否则，不会执行任何操作。

看准了，是 location1 和 comparand 比较！

使用示例如下：

        static void Main(string[] args)
        {
            int location1 = 1;
            int value = 2;
            int comparand = 3;

            Console.WriteLine("运行前：");
            Console.WriteLine($" location1 = {location1}    |   value = {value} |   comparand = {comparand}");

            Console.WriteLine("当 location1 != comparand 时");
            int result = Interlocked.CompareExchange(ref location1, value, comparand);
            Console.WriteLine($" location1 = {location1} | value = {value} |  comparand = {comparand} |  location1 改变前的值  {result}");

            Console.WriteLine("当 location1 == comparand 时");
            comparand = 1;
            result = Interlocked.CompareExchange(ref location1, value, comparand);
            Console.WriteLine($" location1 = {location1} | value = {value} |  comparand = {comparand} |  location1 改变前的值  {result}");
        }

5，Interlocked.Add()

对两个 32 位整数进行求和并用和替换第一个整数，上述操作作为一个原子操作完成。

public static int Add (ref int location1, int value);

只能对 int 或 long 有效。

回到第一小节的多线程求和问题，使用 Interlocked.Add() 来替换Interlocked.Increment()。

        static void Main(string[] args)
        {
            for (int i = 0; i < 5; i++)
            {
                Thread thread = new Thread(AddOne);
                thread.Start();
            }

            Thread.Sleep(TimeSpan.FromSeconds(10));
            Console.WriteLine("sum = " + sum);
        }
        private static int sum = 0;
        public static void AddOne()
        {
            for (int i = 0; i < 100_0000; i++)
            {
                Interlocked.Add(ref sum,1);
            }
        }

6，Interlocked.Read()

返回一个以原子操作形式加载的 64 位值。

64位系统上不需要 Read 方法，因为64位读取操作已是原子操作。在32位系统上，64位读取操作不是原子操作，除非使用 Read 执行。

public static long Read (ref long location);

就是说 32 位系统上才用得上。

具体场景我没有找到。

你可以参考一下 https://www.codenong.com/6139699/

貌似没有多大用处？那我懒得看了。

volatile

这里直接引用官方文档的解释：

volatile 关键字指示一个字段可以由多个同时执行的线程修改。出于性能原因，编译器，运行时系统甚至硬件都可能重新排列对存储器位置的读取和写入。

据官方文档，volatile 关键字可应用于以下类型的字段：

引用类型。
指针类型（在不安全的上下文中）。请注意，虽然指针本身可以是可变的，但是它指向的对象不能是可变的。换句话说，不能声明“指向可变对象的指针”。
简单类型，如 sbyte、byte、short、ushort、int、uint、char、float 和 bool。
具有以下基本类型之一的 enum 类型：byte、sbyte、short、ushort、int 或 uint。
已知为引用类型的泛型类型参数。
IntPtr 和 UIntPtr。

注意，volatile 只能用于引用类型或等于小于 32 位的值类型。

.NET 设计上是支持 32 位系统和 64 位系统的，而 long 类型固定是 64 位，在 32 位的系统下，CPU 寄存器执行指令时，寄存器一次只能处理 4 字节，要处理 long 类型，取内存就需要两次指令，高 4 字节和低 4 字节是分开计算的，因此无法保证 long 的原子性。另外，在 32 位系统下，需要额外使用其它指令配合计算 long ，因此也会消耗一部分性能。

最简单的例子就是学 C 语言时，都会学到的结构体对齐。

奇怪，既然 long 、double 不行，为啥引用类型可以？

因为 private volatile object obj; 保存的是对象的引用地址，其地址长度跟 CPU 有关，取地址值时，只需要一次取数据指令即可。

关于 volatile 的使用方法有几个误区，第一个误区是， volatile 不能保证数据隔离。

如果将上面的示例改成用 volatile ，是否可以正常？答案是不能。

    private static volatile int sum = 0;
    public static void AddOne()
    {
        for (int i = 0; i < 100_0000; i++)
        {
            sum += 1;
        }
    }

volatile 可以保证同一个字段被多个线程修改时，修改后的最新值能够被线程看到，避免发生脏读，它无法解决多个线程同时写的问题。

下面举一个不恰当的示例：

    public interface ITest
    {
        int Run();
    }
    public class A : ITest
    {
        public int Run() => 0;
    }
    public class B : ITest
    {
        public int Run() => 1;
    }

    private static volatile ITest _test;
    static void Main(string[] args)
    {
        new Thread(() =>
        {
            bool isA = true;
            while (true)
            {
                if (isA) _test = new A();
                else _test = new B();
                isA = !isA;
            }
        }).Start();
    }

当 _test 指向的对象引用被修改时，其它线程能够及时知道最新的引用对象。

当一个值被修改时，其它线程及时进行对应操作。

    private static volatile bool IsStop;
    static void Main(string[] args)
    {
        while (!IsStop) 
        {
        }
    }

初始赋值：

    public class A
    {
        private static volatile object _obj;
        static A()
        {
            if (_obj == null)
            {
                _obj = new object();
            }
        }
    }

2.1 原子操作 Interlocked