megengine.distributed.Client

class Client(master_ip, port)[源代码]

分布式训练的分布式客户端。

参数
  • master_ip – 主节点的IP地址。

  • port – 获取主节点上RPC服务器的端口

方法

bcast_val(val, key, size)

check_is_grad(key)

检查 send/recv 是否需要梯度。

check_remote_tracer(key)

获取 send/recv 的tracer dict。

connect()

检查连接是否成功。

get_mm_server_port()

获取多个服务器的端口。

group_barrier(key, size)

等待通信组内所有成员的障碍点。

set_is_grad(key, is_grad)

用 key 来标记 send/recv 是需要梯度的。

set_remote_tracer(key, tracer_set)

为 send/recv 算子设置 tracer dict。

user_get(key)

跨进程获取用户定义的键值对。

user_pop(key)

Get user defined key-value pairs and delete the resources when the get is done

user_set(key, val)

跨进程设置用户定义的键值对。