当学习率设置得过大时,收敛过程将变得十分缓慢。而当学习率设置得过小时,梯度可能会在最小值附近来回震荡,甚至可能无法收敛。()

是 否

时间:2024-03-31 09:12:15

相似题目