Rprop Fix (#1421)

alinpahontu2912 · Ozan Aydin · web-flow · commit 3760ba3e97ca · 2024-12-23T10:26:12.000+01:00
* Rprop Fix

---------

Co-authored-by: Ozan Aydin &lt;148207261+ozanMSFT@users.noreply.github.com&gt;
diff --git a/src/TorchSharp/Optimizers/Rprop.cs b/src/TorchSharp/Optimizers/Rprop.cs
@@ -86,7 +86,7 @@ public class Rprop : OptimizerHelper
             /// <param name="min_step">Minimum allowed step size.</param>
             /// <param name="max_step">Maximum allowed step size.</param>
             /// <param name="maximize">Maximize the params based on the objective, instead of minimizing.</param>
-            public Rprop(IEnumerable<Parameter> parameters, double lr = 0.01, double etaminus = 0.5, double etaplus = 1.2, double min_step = 1e-6, double max_step = 50, bool maximize = false)
+            public Rprop(IEnumerable<Parameter> parameters, double lr = 1e-2, double etaminus = 0.5, double etaplus = 1.2, double min_step = 1e-6, double max_step = 50, bool maximize = false)
                 : this(new ParamGroup[] { new() { Parameters = parameters } }, lr, etaminus, etaplus, min_step, max_step, maximize)
             {
             }
@@ -156,10 +156,6 @@ public override Tensor step(Func<Tensor> closure = null)
 
                         state.step += 1;
 
-                        grad = (max_step != 0)
-                            ? grad.add(param, alpha: max_step)
-                            : grad.alias();
-
                         var sign = grad.mul(state.prev).sign();
                         sign[sign.gt(0)] = (Tensor)etaplus;
                         sign[sign.lt(0)] = (Tensor)etaminus;
diff --git a/test/TorchSharpTest/TestTraining.cs b/test/TorchSharpTest/TestTraining.cs
@@ -1170,7 +1170,7 @@ public void TrainingRprop()
 
             var loss = TrainLoop(seq, x, y, optimizer);
 
-            LossIsClose(229.68f, loss);
+            LossIsClose(77.279f, loss);
         }
 
 
@@ -1187,7 +1187,7 @@ public void TrainingRpropMax()
 
             var loss = TrainLoop(seq, x, y, optimizer, maximize:true);
 
-            LossIsClose(229.68f, -loss);
+            LossIsClose(77.279f, -loss);
         }
 
         [Fact]
@@ -1203,7 +1203,7 @@ public void TrainingRpropEtam()
 
             var loss = TrainLoop(seq, x, y, optimizer);
 
-            LossIsClose(201.417f, loss);
+            LossIsClose(171.12f, loss);
         }
 
         [Fact]
@@ -1219,7 +1219,7 @@ public void TrainingRpropEtap()
 
             var loss = TrainLoop(seq, x, y, optimizer);
 
-            LossIsClose(221.365f, loss);
+            LossIsClose(65.859f, loss);
         }
 
 
@@ -1240,7 +1240,7 @@ public void TrainingRpropParamGroups()
 
             var loss = TrainLoop(seq, x, y, optimizer);
 
-            LossIsClose(78.619f, loss);
+            LossIsClose(66.479f, loss);
         }
 
         /// <summary>

Original file line number	Diff line number	Diff line change
`@@ -1170,7 +1170,7 @@ public void TrainingRprop()`
`1170`	`1170`
`1171`	`1171`	`var loss = TrainLoop(seq, x, y, optimizer);`
`1172`	`1172`
`1173`		`- LossIsClose(229.68f, loss);`
	`1173`	`+ LossIsClose(77.279f, loss);`
`1174`	`1174`	`}`
`1175`	`1175`
`1176`	`1176`
`@@ -1187,7 +1187,7 @@ public void TrainingRpropMax()`
`1187`	`1187`
`1188`	`1188`	`var loss = TrainLoop(seq, x, y, optimizer, maximize:true);`
`1189`	`1189`
`1190`		`- LossIsClose(229.68f, -loss);`
	`1190`	`+ LossIsClose(77.279f, -loss);`
`1191`	`1191`	`}`
`1192`	`1192`
`1193`	`1193`	`[Fact]`
`@@ -1203,7 +1203,7 @@ public void TrainingRpropEtam()`
`1203`	`1203`
`1204`	`1204`	`var loss = TrainLoop(seq, x, y, optimizer);`
`1205`	`1205`
`1206`		`- LossIsClose(201.417f, loss);`
	`1206`	`+ LossIsClose(171.12f, loss);`
`1207`	`1207`	`}`
`1208`	`1208`
`1209`	`1209`	`[Fact]`
`@@ -1219,7 +1219,7 @@ public void TrainingRpropEtap()`
`1219`	`1219`
`1220`	`1220`	`var loss = TrainLoop(seq, x, y, optimizer);`
`1221`	`1221`
`1222`		`- LossIsClose(221.365f, loss);`
	`1222`	`+ LossIsClose(65.859f, loss);`
`1223`	`1223`	`}`
`1224`	`1224`
`1225`	`1225`
`@@ -1240,7 +1240,7 @@ public void TrainingRpropParamGroups()`
`1240`	`1240`
`1241`	`1241`	`var loss = TrainLoop(seq, x, y, optimizer);`
`1242`	`1242`
`1243`		`- LossIsClose(78.619f, loss);`
	`1243`	`+ LossIsClose(66.479f, loss);`
`1244`	`1244`	`}`
`1245`	`1245`
`1246`	`1246`	`/// <summary>`