Warning: Grad strides do not match bucket view strides. 可能影响DDP性能
1. transpose或permute造成内存不连续。
# before
output_tensor = in_tensor.transpose(1, 3)# after
output_tensor = in_tensor.transpose(1, 3).contiguous()
2. 切片操作造成内存不连续。
# before
input_tensor = input_tensor[:, :H, :W, :]#after
input_tensor = input_tensor[:, :H, :W, :].contiguous()
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
