PFCCLab
diff --git a/‎tester/accuracy.py‎
Lines changed: 64 additions & 40 deletions b/‎tester/accuracy.py‎
Lines changed: 64 additions & 40 deletions
@@ -52,7 +52,7 @@ def test(self):
                 print("gen_numpy_input failed")
                 return
         except Exception as err:
-            print("[numpy error]", self.api_config.config, "\n", str(err))
+            print(f"[numpy error] {self.api_config.config}\n{str(err)}")
             traceback.print_exc()
             write_to_log("numpy_error", self.api_config.config)
             return
@@ -121,7 +121,7 @@ def test(self):
 
             paddle.base.core.eager._for_test_check_cuda_error()
         except Exception as err:
-            print("[torch error]", self.api_config.config, "\n", str(err), flush=True)
+            print(f"[torch error] {self.api_config.config}\n{str(err)}", flush=True)
             traceback.print_exc()
             write_to_log("torch_error", self.api_config.config)
             if "CUDA error" in str(err) or "memory corruption" in str(err) or "CUDA out of memory" in str(err):
@@ -145,7 +145,7 @@ def test(self):
                 del inputs_list, result_outputs, result_outputs_grads
             except Exception as err:
                 if str(err).startswith("Too large tensor to get cached numpy: "):
-                    print("[numpy error]", self.api_config.config, "\n", str(err))
+                    print(f"[numpy error] {self.api_config.config}\n{str(err)}")
                     write_to_log("numpy_error", self.api_config.config)
                     return
                 print(str(err), flush=True)
@@ -154,7 +154,7 @@ def test(self):
             try:
                 paddle.base.core.eager._for_test_check_cuda_error()
             except Exception as err:
-                print("[torch error] backward", self.api_config.config, "\n", str(err), flush=True)
+                print(f"[torch error] backward {self.api_config.config}\n{str(err)}", flush=True)
                 write_to_log("torch_error", self.api_config.config)
                 raise
         else:
@@ -200,10 +200,10 @@ def process_torch_outputs(obj):
                 paddle_output = self.paddle_args[0] if len(self.paddle_args) > 0 else next(iter(self.paddle_kwargs.values()))
         except Exception as err:
             if self.should_ignore_paddle_error(str(err)):
-                print("[Pass]", self.api_config.config, flush=True)
+                print(f"[Pass] {self.api_config.config}", flush=True)
                 write_to_log("pass", self.api_config.config)
                 return
-            print("[paddle error]", self.api_config.config, "\n", str(err), flush=True)
+            print(f"[paddle error] {self.api_config.config}\n{str(err)}", flush=True)
             write_to_log("paddle_error", self.api_config.config)
             if "CUDA error" in str(err) or "memory corruption" in str(err):
                 raise err
@@ -214,14 +214,14 @@ def process_torch_outputs(obj):
         try:
             paddle.base.core.eager._for_test_check_cuda_error()
         except Exception as err:
-            print("[cuda error]", self.api_config.config, "\n", str(err), flush=True)
+            print(f"[cuda error] {self.api_config.config}\n{str(err)}", flush=True)
             write_to_log("paddle_error", self.api_config.config)
             raise
 
         paddle_output, torch_output = process_output(self.api_config, paddle_output, torch_output)
 
         self.is_backward = False
-        def compare_paddle_and_torch(paddle_tensor, torch_tensor) -> bool:
+        def compare_paddle_and_torch(paddle_tensor, torch_tensor, idx=0) -> bool:
             try:
                 # if paddle_tensor.dtype == paddle.bfloat16:
                 #     paddle_tensor = paddle.cast(paddle_tensor, dtype="float32")
@@ -231,13 +231,14 @@ def compare_paddle_and_torch(paddle_tensor, torch_tensor) -> bool:
                 self.torch_assert_accuracy(paddle_tensor, torch_tensor, atol=self.atol, rtol=self.rtol)
             except Exception as err:
                 if self.is_backward:
-                    print(f"[accuracy error] backward {self.api_config.config}\n{str(err)}", flush=True)
+                    print(f"[accuracy error] backward at {idx} {self.api_config.config}\n{str(err)}", flush=True)
                 else:
-                    print(f"[accuracy error] {self.api_config.config}\n{str(err)}", flush=True)
+                    print(f"[accuracy error] at {idx} {self.api_config.config}\n{str(err)}", flush=True)
                 write_to_log("accuracy_error", self.api_config.config)
                 return False
             return True
 
+        # Forward output check:
         if isinstance(paddle_output, paddle.Tensor):
             if isinstance(torch_output, torch.Tensor):
                 if not compare_paddle_and_torch(paddle_output, torch_output):
@@ -248,52 +249,65 @@ def compare_paddle_and_torch(paddle_tensor, torch_tensor) -> bool:
                     assert paddle_output.shape == [], "paddle_output shape is not []"
                     assert bool(paddle_output) == torch_output, f"paddle_output {bool(paddle_output)} is not equal to torch_output {torch_output}"
                 except Exception as err:
-                    print("[accuracy error]", self.api_config.config, "\n", str(err), flush=True)
+                    print(f"[not compare] {self.api_config.config}\n{str(err)}", flush=True)
                     write_to_log("accuracy_error", self.api_config.config)
                     return
             elif isinstance(torch_output, (torch.return_types.max, torch.return_types.min)):
                 torch_output = torch_output.values
                 if not compare_paddle_and_torch(paddle_output, torch_output):
                     return
             else:
-                print("[accuracy error]", self.api_config.config, "\n[output type diff error1], ", type(torch_output), flush=True)
+                print(
+                    f"[not compare] {self.api_config.config}\n"
+                    f"torch is {type(torch_output)} but paddle is {type(paddle_output)}",
+                    flush=True,
+                )
                 write_to_log("accuracy_error", self.api_config.config)
                 return
         elif isinstance(paddle_output, (list, tuple)):
             if not isinstance(torch_output, (list, tuple)):
-                print("[output type diff error]", self.api_config.config, flush=True)
+                print(f"[not compare] {self.api_config.config}\n"
+                      f"torch is {type(torch_output)} but paddle is {type(paddle_output)}",
+                      flush=True)
+                write_to_log("accuracy_error", self.api_config.config)
                 return
             paddle_output = list(paddle_output)
             torch_output = list(torch_output)
             if len(paddle_output) != len(torch_output):
-                print("[accuracy error]", self.api_config.config, "\n[output type diff error2], ", len(paddle_output), len(torch_output), flush=True)
+                print(f"[not compare] {self.api_config.config}\n"
+                      f"torch len is {len(torch_output)} but paddle len is {len(paddle_output)}",
+                      flush=True)
                 write_to_log("accuracy_error", self.api_config.config)
                 return
-            for paddle_item, torch_item in zip(paddle_output, torch_output):
+            for i, (paddle_item, torch_item) in enumerate(zip(paddle_output, torch_output)):
                 if isinstance(paddle_item, int) or self.api_config.api_name.endswith('tolist'):
                     self.np_assert_accuracy(numpy.array(paddle_item), numpy.array(torch_item), atol=self.atol, rtol=self.rtol)
                 # especially for paddle.vision.ops.distribute_fpn_proposals
                 elif isinstance(paddle_item, list) and isinstance(torch_item, list):
                     if any(isinstance(x, paddle.Tensor) for x in paddle_item) and any(isinstance(x, torch.Tensor) for x in torch_item):
                         for paddle_item_sub, torch_item_sub in zip(paddle_item, torch_item):
-                            if not compare_paddle_and_torch(paddle_item_sub, torch_item_sub):
+                            if not compare_paddle_and_torch(paddle_item_sub, torch_item_sub, i):
                                 return
                     else:
-                        print("[accuracy error]", self.api_config.config, "\n[output type diff error4]", flush=True)
+                        print(f"[not compare] at {i} {self.api_config.config}\n"
+                              f"torch is {type(torch_item)} but paddle is {type(paddle_item)}",
+                              flush=True)
                         write_to_log("accuracy_error", self.api_config.config)
                         return
-                elif not isinstance(paddle_item, paddle.Tensor):
-                    print("[not compare]", paddle_item, torch_item, flush=True)
-                    write_to_log("accuracy_error", self.api_config.config)
-                    return
-                elif not isinstance(torch_item, torch.Tensor):
-                    print("[accuracy error]", self.api_config.config, "\n[output type diff error3], ", type(torch_item), flush=True)
+                elif (paddle_item is None or not paddle_item._is_initialized()) and torch_item is None:
+                    pass
+                elif not isinstance(paddle_item, paddle.Tensor) or not isinstance(torch_item, torch.Tensor):
+                    print(f"[not compare] at {i} {self.api_config.config}\n"
+                          f"torch is {type(torch_item)} but paddle is {type(paddle_item)}",
+                          flush=True)
                     write_to_log("accuracy_error", self.api_config.config)
                     return
                 else:
-                    if not compare_paddle_and_torch(paddle_item, torch_item):
+                    if not compare_paddle_and_torch(paddle_item, torch_item, i):
                         return
 
+        # Forward check now pass.
+        # Then do paddle backward and backward result check.
         if torch_grad_success:
             self.is_backward = True
             try:
@@ -306,14 +320,14 @@ def compare_paddle_and_torch(paddle_tensor, torch_tensor) -> bool:
                 del inputs_list, result_outputs, result_outputs_grads
             except Exception as err:
                 if str(err).startswith("Too large tensor to get cached numpy: "):
-                    print("[numpy error]", self.api_config.config, "\n", str(err))
+                    print(f"[numpy error] backward {self.api_config.config}\n{str(err)}", flush=True)
                     write_to_log("numpy_error", self.api_config.config)
                     return
                 if self.should_ignore_paddle_error(str(err)):
-                    print("[Pass]", self.api_config.config, flush=True)
+                    print(f"[Pass] {self.api_config.config}", flush=True)
                     write_to_log("pass", self.api_config.config)
                     return
-                print("[paddle error] backward", self.api_config.config, "\n", str(err), flush=True)
+                print(f"[paddle error] backward {self.api_config.config}\n{str(err)}", flush=True)
                 write_to_log("paddle_error", self.api_config.config)
                 if "CUDA error" in str(err) or "memory corruption" in str(err):
                     raise err
@@ -324,46 +338,51 @@ def compare_paddle_and_torch(paddle_tensor, torch_tensor) -> bool:
             try:
                 paddle.base.core.eager._for_test_check_cuda_error()
             except Exception as err:
-                print("[cuda error] backward", self.api_config.config, "\n", str(err), flush=True)
+                print(f"[cuda error] backward {self.api_config.config}\n{str(err)}", flush=True)
                 write_to_log("paddle_error", self.api_config.config)
                 raise
 
             paddle_out_grads, torch_out_grads = process_grad_output(self.api_config, paddle_out_grads, torch_out_grads)
 
+            # Backward output check:
             if isinstance(paddle_out_grads, paddle.Tensor):
                 if isinstance(torch_out_grads, torch.Tensor):
                     if not compare_paddle_and_torch(paddle_out_grads, torch_out_grads):
                         return
                 else:
-                    print("[accuracy error] backward", self.api_config.config, "\n[output type diff error1], ", type(torch_out_grads), flush=True)
+                    print(f"[not compare] backward {self.api_config.config}\n"
+                          f"torch is {type(torch_out_grads)} but paddle is {type(paddle_out_grads)}", flush=True)
                     write_to_log("accuracy_error", self.api_config.config)
                     return
             elif isinstance(paddle_out_grads, (list, tuple)):
                 if not isinstance(torch_out_grads, (list, tuple)):
-                    print("[output type diff error]", self.api_config.config, flush=True)
+                    print(f"[not compare] backward {self.api_config.config}\n"
+                          f"torch is {type(torch_out_grads)} but paddle is {type(paddle_out_grads)}", flush=True)
+                    write_to_log("accuracy_error", self.api_config.config)
                     return
                 paddle_out_grads = list(paddle_out_grads)
                 torch_out_grads = list(torch_out_grads)
                 if len(paddle_out_grads) != len(torch_out_grads):
-                    print("[accuracy error] backward", self.api_config.config, "\n[output type diff error2], ", len(paddle_out_grads), len(torch_out_grads), flush=True)
+                    print(f"[not compare] backward {self.api_config.config}\n"
+                          f"torch len is {len(torch_out_grads)} but paddle len is {len(paddle_out_grads)}", flush=True)
                     write_to_log("accuracy_error", self.api_config.config)
                     return
-                for paddle_item, torch_item in zip(paddle_out_grads, torch_out_grads):
+                for i, (paddle_item, torch_item) in enumerate(zip(paddle_out_grads, torch_out_grads)):
                     if isinstance(paddle_item, int):
                         self.np_assert_accuracy(numpy.array(paddle_item), numpy.array(torch_item), atol=self.atol, rtol=self.rtol)
-                    elif not isinstance(paddle_item, paddle.Tensor):
-                        print("[not compare]", paddle_item, torch_item, flush=True)
-                        write_to_log("accuracy_error", self.api_config.config)
-                        return
-                    elif not isinstance(torch_item, torch.Tensor):
-                        print("[accuracy error] backward", self.api_config.config, "\n[output type diff error3], ", type(torch_out_grads[i]), flush=True)
+                    elif (paddle_item is None or not paddle_item._is_initialized()) and torch_item is None:
+                        pass
+                    elif not isinstance(paddle_item, paddle.Tensor) or not isinstance(torch_item, torch.Tensor):
+                        print(f"[not compare] backward at {i} {self.api_config.config}\n"
+                              f"torch is {type(torch_item)} but paddle is {type(paddle_item)}",
+                              flush=True)
                         write_to_log("accuracy_error", self.api_config.config)
                         return
                     else:
-                        if not compare_paddle_and_torch(paddle_item, torch_item):
+                        if not compare_paddle_and_torch(paddle_item, torch_item, i):
                             return
 
-        print("[Pass]", self.api_config.config, flush=True)
+        print(f"[Pass] {self.api_config.config}", flush=True)
         write_to_log("pass", self.api_config.config)
 
 
@@ -467,4 +486,9 @@ def process_grad_output(api_config, paddle_out_grads, torch_out_grads):
             if is_upper
             else torch.tril(torch_out_grads[1])
         )
+    elif api_config.api_name == "paddle.incubate.nn.functional.fused_rotary_position_embedding":
+        # Paddle only has 3 outputs/grads Q, K, V
+        valid_out_num = len([out for out in paddle_out_grads if out is not None])
+        paddle_out_grads = paddle_out_grads[:valid_out_num]
+        torch_out_grads = torch_out_grads[:valid_out_num]
     return paddle_out_grads, torch_out_grads