我如何直接将本地R的流程传递给Amazon EC

我一直在考虑在EC2上运行R,但是我想知道在并行/群集计算中使用这种设置是怎样的。 我看了一下,但我一直无法找到这个教程。

基本上我想要做的是让R(Rstudio)在我的笔记本电脑上运行,并完成大部分工作,但是当我有一个很大的操作要运行时,明确地将它传递给AWS Slave实例以完成所有工作沉重的举重。

据我所知,雪/降雪包似乎是答案...但我不确定如何。

我正在使用http://bioconductor.org/help/bioconductor-cloud-ami/(ssh之一)上的教程让R运行。 本教程确实提到了paralell / cluster,但它似乎在不同的AWS实例之间。

任何帮助都会很棒。 干杯。


如果你只需要一个从机实例,我发现在实例上并行运行它是最简单的,而不是将你的PC作为主机。

您可以在PC上编写脚本,并将其推送到运行有R的多核服务器,然后使用并行的所有内核在该处运行它。

例如,将其上传到4核心AWS实例:

library(snowfall)
sfInit(parallel=TRUE,cpus=4,slaveOutfile="log.txt")

vars = c(1:100)

#send variables to all processors
sfExportAll()

#Run this in parallel
results = sfLapply(vars, exp)

#Stop parallel processing
sfStop()

#save results
save(results, file = "results.RData")
链接地址: http://www.djcxy.com/p/53423.html

上一篇: How can I directly pass a process from local R to an Amazon EC

下一篇: R connecting to EC2 instance for parallel processing