我如何直接将本地R的流程传递给Amazon EC
我一直在考虑在EC2上运行R,但是我想知道在并行/群集计算中使用这种设置是怎样的。 我看了一下,但我一直无法找到这个教程。
基本上我想要做的是让R(Rstudio)在我的笔记本电脑上运行,并完成大部分工作,但是当我有一个很大的操作要运行时,明确地将它传递给AWS Slave实例以完成所有工作沉重的举重。
据我所知,雪/降雪包似乎是答案...但我不确定如何。
我正在使用http://bioconductor.org/help/bioconductor-cloud-ami/(ssh之一)上的教程让R运行。 本教程确实提到了paralell / cluster,但它似乎在不同的AWS实例之间。
任何帮助都会很棒。 干杯。
如果你只需要一个从机实例,我发现在实例上并行运行它是最简单的,而不是将你的PC作为主机。
您可以在PC上编写脚本,并将其推送到运行有R的多核服务器,然后使用并行的所有内核在该处运行它。
例如,将其上传到4核心AWS实例:
library(snowfall)
sfInit(parallel=TRUE,cpus=4,slaveOutfile="log.txt")
vars = c(1:100)
#send variables to all processors
sfExportAll()
#Run this in parallel
results = sfLapply(vars, exp)
#Stop parallel processing
sfStop()
#save results
save(results, file = "results.RData")
链接地址: http://www.djcxy.com/p/53423.html
上一篇: How can I directly pass a process from local R to an Amazon EC