任务失败该不该无限重试

任务有调用上游的一个接口,发生了异常,然后任务失败,上游恢复后在界面人工点击重试。
主管说要加个自动重试,直到上游恢复。如果上游一天都没恢复,岂不是要自动重试一天?
这种任务失败无限重试的合理吗?会有什么问题?

从设计上,无限重试是对资源的浪费。应当有个重试次数上限,来保证其他任务能接着执行。对于没有成功的任务,先记录下来,在接口正常的情况下,优先处理。

不知道你这个问题是否已经解决, 如果还没有解决的话:

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^

自动重试.. 间隔多久?.
频率低点,无限倒也无妨