通过multiprocessing.pool.map传递kwargs

我想通过Pool.map()将关键字参数传递给我的工作函数。 搜索论坛时找不到这个清晰的例子。

示例代码:

import multiprocessing as mp

def worker((x,y), **kwargs):
    kwarg_test = kwargs.get('kwarg_test', False)
    print("kwarg_test = {}".format(kwarg_test))     
    if kwarg_test:
        print("Success")
    return x*y

def wrapper_process(**kwargs):
    jobs = []
    pool=mp.Pool(4)
    for i, n in enumerate(range(4)):
        jobs.append((n,i))
    pool.map(worker, jobs) #works
    pool.map(worker, jobs, kwargs) #how to do this?   

def main(**kwargs):
    worker((1,2),kwarg_test=True) #accepts kwargs
    wrapper_process(kwarg_test=True)

if __name__ == "__main__":    
    main()

输出:

kwarg_test = True
Success
kwarg_test = False
kwarg_test = False
kwarg_test = False
kwarg_test = False
TypeError: unsupported operand type(s) for //: 'int' and 'dict'

类型错误与解析multiprocessing.Pool或Queue中的参数有关,并且我尝试了其他几种语法,比如创建kwargs列表; [kwargs,kwargs,kwargs,kwargs],以及一些尝试将kwarg纳入工作列表,但没有运气。 我将multiprocessing.pool中的代码从map映射到map_async,并在我遇到生成器结构时task_batches = Pool._get_tasks(func, iterable, chunksize)在pool.py中task_batches = Pool._get_tasks(func, iterable, chunksize) 。 我很高兴今后能更多地了解这一点,但现在我只是想找出:

有没有简单的语法来允许kwargs和pool.map一起传递?


如果你想迭代其他参数,使用@ ArcturusB的答案。

如果你只是想通过它们,每次迭代都有相同的值,那么你可以这样做:

from functools import partial
pool.map(partial(worker, **kwargs), jobs)

部分'绑定'参数到一个函数。 旧版本的Python不能序列化部分对象。


multiprocessing.pool.Pool.map文档指出:

一个并行等价的map()内置函数( 尽管它只支持一个可迭代的参数 )。 它阻塞,直到结果准备就绪。

我们只能传递一个可迭代的参数。 故事的结局。 但是我们可以想到一个解决方法:定义worker_wrapper函数,它接受一个参数,将其解包为args和kwargs,并将它们传递给worker

def worker_wrapper(arg):
    args, kwargs = arg
    return worker(*args, **kwargs)

在你的wrapper_process ,你需要从jobs构建这个单一的参数(甚至直接构造作业)并调用worker_wrapper

arg = [(j, kwargs) for j in jobs]
pool.map(worker_wrapper, arg)

这是一个工作实现,尽可能地保持与原始代码的接近:

import multiprocessing as mp

def worker_wrapper(arg):
    args, kwargs = arg
    return worker(*args, **kwargs)

def worker(x, y, **kwargs):
    kwarg_test = kwargs.get('kwarg_test', False)
    # print("kwarg_test = {}".format(kwarg_test))     
    if kwarg_test:
        print("Success")
    else:
        print("Fail")
    return x*y

def wrapper_process(**kwargs):
    jobs = []
    pool=mp.Pool(4)
    for i, n in enumerate(range(4)):
        jobs.append((n,i))
    arg = [(j, kwargs) for j in jobs]
    pool.map(worker_wrapper, arg)

def main(**kwargs):
    print("=> calling `worker`")
    worker(1, 2,kwarg_test=True) #accepts kwargs
    print("=> no kwargs")
    wrapper_process() # no kwargs
    print("=> with `kwar_test=True`")
    wrapper_process(kwarg_test=True)

if __name__ == "__main__":    
    main()

哪个通过测试:

=> calling `worker`
Success
=> no kwargs
Fail
Fail
Fail
Fail
=> with `kwar_test=True`
Success
Success
Success
Success
链接地址: http://www.djcxy.com/p/18181.html

上一篇: passing kwargs with multiprocessing.pool.map

下一篇: Is it possible to alternate the use of *args and **kwargs?