Accelerate 设置 rdzv_backend 的超时时间 | accelerate rdzv_backend timeout setting, rdzc_conf.


问题:

accelerate在启动rdzv时,默认的超时时间是900(or 1800?),无法满足多节点pending时的等待需求

解决方案:

accelerate launch [Other params] --rdav_conf timeout=86400 [Other params]

即可。

参考页面:

https://github.com/huggingface/accelerate/blob/main/docs/source/basic_tutorials/launch.md https://github.com/huggingface/accelerate/blob/main/src/accelerate/commands/launch.py#L333

声明:烈火灼冰|版权所有,违者必究|如未注明,均为原创|本网站采用BY-NC-SA协议进行授权

转载:转载请注明原文链接 - Accelerate 设置 rdzv_backend 的超时时间 | accelerate rdzv_backend timeout setting, rdzc_conf.


离离沐雪踏轻尘