斯威夫特的词典即使有缓慢

我正在使用Swift中的Dictionary来实现本质上的缓存。 表现远低于我的预期。 我读过其他一些问题,例如这个关于数组排序的问题,似乎表明-Ofast是答案(如果您准备接受它带来的更改)。 但是,即使编译为-Ofast ,性能也与其他语言相比较差。 我使用的是Swift版本1.0(swift-600.0.34.4.8)。

下面是一个说明问题的简单例子:

import Foundation

class Holder {
    var dictionary = Dictionary<Int, Int>()

    func store(#key: Int, value: Int) {
        dictionary[key] = value
    }
}

let holder = Holder()

let items = 5000

for (var i: Int = 0; i < 5000; i++) {
    holder.store(key: i, value: i)
}

使用-O3进行编译需要超过两秒的时间才能运行:

xcrun swift -sdk $(xcrun --show-sdk-path --sdk macosx) -O3 Test.swift && time ./Test

real    0m2.295s
user    0m2.176s
sys     0m0.117s

-Ofast编译产生-Ofast倍的改进:

xcrun swift -sdk $(xcrun --show-sdk-path --sdk macosx) -Ofast Test.swift && time ./Test

real    0m0.602s
user    0m0.484s
sys     0m0.117s

相比之下,这个Java实现:

import java.util.Map;
import java.util.HashMap;

public class Test {
    public static void main(String[] args) {
        Holder holder = new Holder();
        int items = 5000;
        for (int i = 0; i < items; i++) {
            holder.store(i, i);
        }
    }
}

class Holder {
    private final Map<Integer, Integer> map = new HashMap<Integer, Integer>();

    public void store(Integer key, Integer value) {
        map.put(key, value);
    }
}

再快6倍:

javac Test.java && time java Test

real    0m0.096s
user    0m0.088s
sys     0m0.021s

这是否仅仅是复制Dictionary的代价,因为它被变异并存储在Holder实例中,导致Swift非常糟糕? 直接删除Holder并直接访问“ Dictionary会显示它是。

此代码:

import Foundation

var dictionary = Dictionary<Int, Int>()

let items = 5000

for (var i: Int = 0; i < 5000; i++) {
    dictionary[i] = i
}

显着更快:

$ xcrun swift -sdk $(xcrun --show-sdk-path --sdk macosx) -O3 NoHolder.swift && time ./NoHolder

real    0m0.011s
user    0m0.009s
sys     0m0.002s

$ xcrun swift -sdk $(xcrun --show-sdk-path --sdk macosx) -Ofast NoHolder.swift && time ./NoHolder

real    0m0.011s
user    0m0.007s
sys     0m0.003s

虽然它提供了(有希望的)有趣的数据点,但直接访问字典在我的情况下是不可能的。 除了目前的形式,我还有什么可以用Swift来接近这个级别的性能吗?


TL; DR它是Beta。

我认为现在的答案只是Swift处于测试阶段,工具处于测试阶段,还有很多优化尚未完成。 在Obj-C中复制你的“Holder”类例子表明,即使它在相同的-Ofast级别上也快-Ofast

@import Foundation;

@interface Holder : NSObject

@property NSMutableDictionary *dictionary;
- (void)storeValue:(NSInteger)value forKey:(NSString *)key;

@end

@implementation Holder

- (instancetype)init {
   self = [self initWithDict];
    return self;
}


- (instancetype)initWithDict {
    if (!self) {
        self = [super init];
        _dictionary = [NSMutableDictionary dictionary];
    }

    return self;
}

- (void)storeValue:(NSInteger)value forKey:(NSString *)key {
    [self.dictionary setValue:@(value) forKey:key];
}

@end

int main(int argc, const char * argv[]) {

    Holder *holder = [Holder new];

    for (NSInteger i = 0; i < 5000; i++) {
        [holder storeValue:i forKey:[NSString stringWithFormat:@"%ld", i]];
    }

}

Obj-C快速退出了大门。

time ./loop 

    real    0m0.013s
    user    0m0.006s
    sys     0m0.003s

与您提供的NoHolder示例相似的时间很好地反映了Obj-C编译器正在进行多少优化。

在Swift展会上看看-O3-Ofast水平的装配,在完成的安全检查量方面存在很大差异。 观察Obj-C程序集显示,它的执行量要少得多。 由于快速制作节目的关键是让它不需要做太多...

OS-X-Dos-Equis:~ joshwisenbaker$ wc -l objc.txt 
     159 objc.txt
OS-X-Dos-Equis:~ joshwisenbaker$ wc -l oFast.txt 
    3749 oFast.txt

(编辑:更新结束持有人类的结果。)

所以另一个有趣的问题是在类定义中使用@final修饰。 如果你知道你的类永远不会被分类,那就试试像这样添加关键字: @final class Holder

正如你所看到的,它也可以用相同的方式对性能进行标准化。

OS-X-Dos-Equis:~ joshwisenbaker$ swift -sdk $(xcrun --show-sdk-path --sdk macosx) -Ofast bench.swift && time ./bench

real    0m0.013s
user    0m0.007s
sys     0m0.003s

即使只使用-O3@final可以发挥魔力。

OS-X-Dos-Equis:~ joshwisenbaker$ swift -sdk $(xcrun --show-sdk-path --sdk macosx) -O3  bench.swift && time ./bench

real    0m0.015s
user    0m0.009s
sys 0m0.003s

再次,我认为你在性能上看到的差异可能低于目前编译时的优化级别。


直到Xcode 6更接近发布并且Apple禁用调试代码并完成优化器,为什么不简单地将您的var声明为NSMutableDictionary?

这是现场证明,速度非常快。

class Holder {
    var dictionary = NSMutableDictionary()
    func store(#key: Int, value: Int) {
        dictionary[key] = value
    }
}

您可以稍后在/ Dictionary获得相似或更好的性能时将其更改。

更新:

我在testPerformanceHolder()的单元测试中试过上面的代码,

使用-O3进行优化平均完成时间为0.013秒 - 比Java示例快7倍。


不幸的是我得到更糟的结果。

我修改了Java代码以避免启动计时,增加了循环次数以获得更多可重复计时,并检查了结果以防止JVM优化循环:

import java.util.Map;
import java.util.HashMap;

public class HolderTest {
  private static final int items = 1_000_000;

  public static void main(String[] args) {
    final long start = System.nanoTime();
    final Holder holder = new Holder();
    for (int i = 0; i < items; i++) {
      holder.store(i, i);
    }
    final long finish = System.nanoTime();
    System.out.println("time = " + (finish - start) / 1_000_000.0 + " ms, holder 0 = " + holder.map.get(0) + ", holder " + (items - 1) + " = " + holder.map.get(items - 1));
  }
}

class Holder {
  final Map<Integer, Integer> map = new HashMap<>();

  public void store(Integer key, Integer value) {
    map.put(key, value);
  }
}

同样的斯威夫特代码:

import Foundation

class Holder {
    var dictionary = Dictionary<Int, Int>()

    func store(#key: Int, value: Int) {
        dictionary[key] = value
    }
}

let start = CFAbsoluteTimeGetCurrent()
let holder = Holder()
let items = 1_000_000
for i in 0 ..< items {
    holder.store(key: i, value: i)
}
let finish = CFAbsoluteTimeGetCurrent()
println("time = ((finish - start) * 1000.0) ms, holder 0 = (holder.dictionary[0]), holder (items - 1) = (holder.dictionary[items - 1])")

我有300毫秒的Java和20秒(!)Swift :(

这是6.1。

更新1:

改为NSMutableDictionary给了更好的性能。

sunzero-ln:HolderTest lov080 $ swift -sdk $(xcrun --show-sdk -path --sdk macosx)-Ounchecked main.swift time = 647.060036659241 ms,持有人0 =可选(0),持有人999999 =可选(999999)

仍然比Java慢2倍,但要好得多!

更新2:

看起来,即使我要求 - )在Xcode中没有选中,我没有得到它(可能还需要其他一些设置,我也需要:():从命令行使用Swift字典的Swift版本给出:

sunzero-ln:HolderTest lov080 $ swift -sdk $(xcrun --show-sdk-path --sdk macosx)-Ounchecked main.swift time = 303.406000137329 ms,持有人0 =可选(0),持有人999999 =可选(999999)

IE和Java一样 - 欢呼:)

链接地址: http://www.djcxy.com/p/31675.html

上一篇: Swift's Dictionary is slow even with

下一篇: XCode 6 Playground Measuring Code Performance