Client

class Client(master_ip, port)[源代码]

分布式训练的分布式客户端。

参数
  • master_ip – 主节点的IP地址。

  • port – 获取主节点上RPC服务器的端口

check_is_grad(key)[源代码]

检查 send/recv 是否需要梯度。

参数

key – key to match send/recv op.

check_remote_tracer(key)[源代码]

获取 send/recv 的tracer dict。

参数

key – key to match send/recv op.

connect()[源代码]

检查连接是否成功。

get_mm_server_port()[源代码]

获取多个服务器的端口。

group_barrier(key, size)[源代码]

等待通信组内所有成员的障碍点。

参数
  • key – group key to match each other.

  • size – group size.

set_is_grad(key, is_grad)[源代码]

用 key 来标记 send/recv 是需要梯度的。

参数
  • key – key to match send/recv op.

  • is_grad – whether this op need grad.

set_remote_tracer(key, tracer_set)[源代码]

为 send/recv 算子设置 tracer dict。

参数
  • key – key to match send/recv op.

  • tracer_set – valid tracer set.

user_get(key)[源代码]

跨进程获取用户定义的键值对。

user_pop(key)[源代码]

Get user defined key-value pairs and delete the resources when the get is done

user_set(key, val)[源代码]

跨进程设置用户定义的键值对。