Ruby 多线程的潜力和弱点分析 -电脑资料

电脑资料 时间:2019-01-01 我要投稿
【www.unjs.com - 电脑资料】

    这篇文章主要介绍了Ruby 多线程的潜力和弱点分析,本文讲解了Ruby 多线程和 IO Block、Ruby GIL 的影响、JRuby 去除了 GIL、Ruby 多线程总结等内容,需要的朋友可以参考下

    Web 应用大多是 IO 密集型的,利用 Ruby 多进程+多线程模型将能大幅提升系统吞吐量,

Ruby 多线程的潜力和弱点分析

。其原因在于:当Ruby 某个线程处于 IO Block 状态时,其它的线程还可以继续执行。但由于存在 Ruby GIL (Global Interpreter Lock),MRI Ruby 并不能真正利用多线程进行并行计算。JRuby 去除了 GIL,是真正意义的多线程,既能应付 IO Block,也能充分利用多核 CPU 加快整体运算速度。

    上面说得比较抽象,下面就用例子一一加以说明。

    Ruby 多线程和 IO Block

    先看下面一段代码(演示目的,没有实际用途):

    代码如下:

    # File: block_io1.rb

    def func1

    puts "sleep 3 seconds in func1\n"

    sleep(3)

    end

    def func2

    puts "sleep 2 seconds in func2\n"

    sleep(2)

    end

    def func3

    puts "sleep 5 seconds in func3\n"

    sleep(5)

    end

    func1

    func2

    func3

    代码很简单,3 个方法,用 sleep 模拟耗时的 IO 操作。 运行代码(环境 MRI Ruby 1.9.3) 结果是:

    代码如下:

    $ time ruby block_io1.rb

    sleep 3 seconds in func1

    sleep 2 seconds in func2

    sleep 5 seconds in func3

    real 0m11.681s

    user 0m3.086s

    sys 0m0.152s

    比较慢,时间都耗在 sleep 上了,总共花了 10 多秒。

    采用多线程的方式,改写如下:

    代码如下:

    # File: block_io2.rb

    def func1

    puts "sleep 3 seconds in func1\n"

    sleep(3)

    end

    def func2

    puts "sleep 2 seconds in func2\n"

    sleep(2)

    end

    def func3

    puts "sleep 5 seconds in func3\n"

    sleep(5)

    end

    threads = []

    threads << Thread.new { func1 }

    threads << Thread.new { func2 }

    threads << Thread.new { func3 }

    threads.each { |t| t.join }

    运行的结果是:

    代码如下:

    $ time ruby block_io2.rb

    sleep 3 seconds in func1

    sleep 2 seconds in func2

    sleep 5 seconds in func3

    real 0m6.543s

    user 0m3.169s

    sys 0m0.147s

    总共花了 6 秒多,明显快了许多,只比最长的 sleep 5 秒多了一点,

电脑资料

Ruby 多线程的潜力和弱点分析》(https://www.unjs.com)。

    上面的例子说明,Ruby 的多线程能够应付 IO Block,当某个线程处于 IO Block 状态时,其它的线程还可以继续执行,从而使整体处理时间大幅缩短。

    Ruby GIL 的影响

    还是先看一段代码(演示目的):

    代码如下:

    # File: gil1.rb

    require ‘securerandom‘

    require ‘zlib‘

    data = SecureRandom.hex(4096000)

    16.times { Zlib::Deflate.deflate(data) }

    代码先随机生成一些数据,然后对其进行压缩,压缩是非常耗 CPU 的,在我机器(双核 CPU, MRI Ruby 1.9.3)运行结果如下:

    代码如下:

    $ time ruby gil1.rb

    real 0m8.572s

    user 0m8.359s

    sys 0m0.102s

    更改为多线程版本,代码如下:

    代码如下:

    # File: gil2.rb

    require ‘securerandom‘

    require ‘zlib‘

    data = SecureRandom.hex(4096000)

    threads = []

    16.times do

    threads << Thread.new { Zlib::Deflate.deflate(data) }

    end

    threads.each {|t| t.join}

    多线程的版本运行结果如下:

    代码如下:

    $ time ruby gil2.rb

    real 0m8.616s

    user 0m8.377s

    sys 0m0.211s

    从结果可以看出,由于 MRI Ruby GIL 的存在,Ruby 多线程并不能重复利用多核 CPU,使用多线程后整体所花时间并不缩短,反而由于线程切换的影响,所花时间还略有增加。

    JRuby 去除了 GIL

    使用 JRuby (我的机器上是 JRuby 1.7.0)运行 gil1.rb 和 gil2.rb,得到很不一样的结果。

    代码如下:

    $ time jruby gil1.rb

    real 0m12.225s

    user 0m14.060s

    sys 0m0.615s

    代码如下:

    $ time jruby gil2.rb

    real 0m7.584s

    user 0m22.822s

    sys 0m0.819s

    可以看到,JRuby 使用多线程时,整体运行时间有明显缩短(7.58 比 12.22),这是由于 JRuby 去除了 GIL,可以真正并行的执行多线程,充分利用了多核 CPU。

    总结:Ruby 多线程可以在某个线程 IO Block 时,依然能够执行其它线程,从而降低 IO Block 对整体的影响,但由于 MRI Ruby GIL 的存在,MRI Ruby 并不是真正的并行执行,JRuby 去除了 GIL,可以做到真正的多线程并行执行。

最新文章