oracle
diff --git a/‎graalpython/com.oracle.graal.python.test/src/tests/test_unicodedata.py
Lines changed: 59 additions & 25 deletions b/‎graalpython/com.oracle.graal.python.test/src/tests/test_unicodedata.py
Lines changed: 59 additions & 25 deletions
diff --git a/‎graalpython/com.oracle.graal.python.test/src/tests/unittest_tags/test_ucn.txt
Lines changed: 0 additions & 2 deletions b/‎graalpython/com.oracle.graal.python.test/src/tests/unittest_tags/test_ucn.txt
Lines changed: 0 additions & 2 deletions
diff --git a/‎graalpython/com.oracle.graal.python.test/src/tests/unittest_tags/test_unicodedata.txt
Lines changed: 1 addition & 8 deletions b/‎graalpython/com.oracle.graal.python.test/src/tests/unittest_tags/test_unicodedata.txt
Lines changed: 1 addition & 8 deletions
diff --git a/‎graalpython/com.oracle.graal.python.test/src/tests/unittest_tags_bytecode_dsl/test_ucn.txt
Lines changed: 0 additions & 2 deletions b/‎graalpython/com.oracle.graal.python.test/src/tests/unittest_tags_bytecode_dsl/test_ucn.txt
Lines changed: 0 additions & 2 deletions
diff --git a/‎graalpython/com.oracle.graal.python.test/src/tests/unittest_tags_bytecode_dsl/test_unicodedata.txt
Lines changed: 0 additions & 8 deletions b/‎graalpython/com.oracle.graal.python.test/src/tests/unittest_tags_bytecode_dsl/test_unicodedata.txt
Lines changed: 0 additions & 8 deletions
@@ -1,4 +1,4 @@
-# Copyright (c) 2018, 2021, Oracle and/or its affiliates. All rights reserved.
+# Copyright (c) 2018, 2025, Oracle and/or its affiliates. All rights reserved.
 # DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
 #
 # The Universal Permissive License (UPL), Version 1.0
@@ -37,34 +37,68 @@
 # OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
 # SOFTWARE.
 
+import unicodedata
+import unittest
 
-def assert_raises(err, fn, *args, **kwargs):
-    raised = False
-    try:
-        fn(*args, **kwargs)
-    except err:
-        raised = True
-    assert raised
+class TestUnicodedata(unittest.TestCase):
 
+    def test_args_validation(self):
+        self.assertRaises(TypeError, unicodedata.category, None)
+        self.assertRaises(TypeError, unicodedata.bidirectional, None)
+        self.assertRaises(TypeError, unicodedata.name, None)
 
-def test_args_validation():
-    import unicodedata
-    assert_raises(TypeError, unicodedata.category, None)
-    assert_raises(TypeError, unicodedata.bidirectional, None)
-    assert_raises(TypeError, unicodedata.name, None)
 
+    def test_normalize(self):
+        self.assertRaises(TypeError, unicodedata.normalize)
+        self.assertRaises(ValueError, unicodedata.normalize, 'unknown', 'xx')
+        assert unicodedata.normalize('NFKC', '') == ''
 
-def test_normalize():
-    import unicodedata
-    assert_raises(TypeError, unicodedata.normalize)
-    assert_raises(ValueError, unicodedata.normalize, 'unknown', 'xx')
-    assert unicodedata.normalize('NFKC', '') == ''
 
+    def test_category(self):
+        assert unicodedata.category('\uFFFE') == 'Cn'
+        assert unicodedata.category('a') == 'Ll'
+        assert unicodedata.category('A') == 'Lu'
+        self.assertRaises(TypeError, unicodedata.category)
+        self.assertRaises(TypeError, unicodedata.category, 'xx')
 
-def test_category():
-    import unicodedata
-    assert unicodedata.category('\uFFFE') == 'Cn'
-    assert unicodedata.category('a') == 'Ll'
-    assert unicodedata.category('A') == 'Lu'
-    assert_raises(TypeError, unicodedata.category)
-    assert_raises(TypeError, unicodedata.category, 'xx')
+
+    def test_lookup(self):
+        unicode_name = "ARABIC SMALL HIGH LIGATURE ALEF WITH LAM WITH YEH"
+        self.assertEqual(unicodedata.lookup(unicode_name), "\u0616")
+
+        unicode_name_alias = "ARABIC SMALL HIGH LIGATURE ALEF WITH YEH BARREE"
+        self.assertEqual(unicodedata.lookup(unicode_name_alias), "\u0616")
+
+        with self.assertRaisesRegex(KeyError, "undefined character name 'wrong-name'"):
+            unicodedata.lookup("wrong-name")
+
+        with self.assertRaisesRegex(KeyError, "name too long"):
+            unicodedata.lookup("a" * 257)
+
+
+    def test_east_asian_width(self):
+        list = [1, 2, 3]
+        with self.assertRaisesRegex(TypeError, r"east_asian_width\(\) argument must be a unicode character, not list"):
+            unicodedata.east_asian_width(list)
+
+        multi_character_string = "abc"
+        with self.assertRaisesRegex(TypeError, r"east_asian_width\(\) argument must be a unicode character, not str"):
+            unicodedata.east_asian_width(multi_character_string)
+
+        empty_string = ""
+        with self.assertRaisesRegex(TypeError, r"east_asian_width\(\) argument must be a unicode character, not str"):
+            unicodedata.east_asian_width(empty_string)
+
+
+    def test_combining(self):
+        list = [1, 2, 3]
+        with self.assertRaisesRegex(TypeError, r"combining\(\) argument must be a unicode character, not list"):
+            unicodedata.combining(list)
+
+        multi_character_string = "abc"
+        with self.assertRaisesRegex(TypeError, r"combining\(\) argument must be a unicode character, not str"):
+            unicodedata.combining(multi_character_string)
+
+        empty_string = ""
+        with self.assertRaisesRegex(TypeError, r"combining\(\) argument must be a unicode character, not str"):
+            unicodedata.combining(empty_string)
@@ -6,7 +6,5 @@ test.test_ucn.UnicodeNamesTest.test_errors @ darwin-arm64,darwin-x86_64,linux-aa
 test.test_ucn.UnicodeNamesTest.test_general @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
 test.test_ucn.UnicodeNamesTest.test_hangul_syllables @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
 test.test_ucn.UnicodeNamesTest.test_misc_symbols @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
-test.test_ucn.UnicodeNamesTest.test_named_sequences_full @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
 test.test_ucn.UnicodeNamesTest.test_named_sequences_names_in_pua_range @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
-test.test_ucn.UnicodeNamesTest.test_named_sequences_sample @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
 test.test_ucn.UnicodeNamesTest.test_strict_error_handling @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
@@ -3,20 +3,13 @@ test.test_unicodedata.NormalizationTest.test_edge_cases @ darwin-arm64,darwin-x8
 test.test_unicodedata.NormalizationTest.test_normalization @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
 test.test_unicodedata.UnicodeFunctionsTest.test_category @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
 test.test_unicodedata.UnicodeFunctionsTest.test_combining @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
-test.test_unicodedata.UnicodeFunctionsTest.test_decimal @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
-test.test_unicodedata.UnicodeFunctionsTest.test_decomposition @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
-test.test_unicodedata.UnicodeFunctionsTest.test_digit @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
 test.test_unicodedata.UnicodeFunctionsTest.test_east_asian_width @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
 test.test_unicodedata.UnicodeFunctionsTest.test_east_asian_width_9_0_changes @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
 test.test_unicodedata.UnicodeFunctionsTest.test_east_asian_width_unassigned @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
 test.test_unicodedata.UnicodeFunctionsTest.test_issue10254 @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
 test.test_unicodedata.UnicodeFunctionsTest.test_issue29456 @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
-test.test_unicodedata.UnicodeFunctionsTest.test_mirrored @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
-test.test_unicodedata.UnicodeFunctionsTest.test_numeric @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
+test.test_unicodedata.UnicodeFunctionsTest.test_name_inverse_lookup @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
 test.test_unicodedata.UnicodeFunctionsTest.test_pr29 @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
 test.test_unicodedata.UnicodeMiscTest.test_bug_1704793 @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
 test.test_unicodedata.UnicodeMiscTest.test_bug_4971 @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
 test.test_unicodedata.UnicodeMiscTest.test_bug_5828 @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
-test.test_unicodedata.UnicodeMiscTest.test_decimal_numeric_consistent @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
-test.test_unicodedata.UnicodeMiscTest.test_digit_numeric_consistent @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
-test.test_unicodedata.UnicodeMiscTest.test_ucd_510 @ darwin-arm64,darwin-x86_64,linux-aarch64,linux-x86_64,win32-AMD64
@@ -6,7 +6,5 @@ test.test_ucn.UnicodeNamesTest.test_errors @ linux-x86_64
 test.test_ucn.UnicodeNamesTest.test_general @ linux-x86_64
 test.test_ucn.UnicodeNamesTest.test_hangul_syllables @ linux-x86_64
 test.test_ucn.UnicodeNamesTest.test_misc_symbols @ linux-x86_64
-test.test_ucn.UnicodeNamesTest.test_named_sequences_full @ linux-x86_64
 test.test_ucn.UnicodeNamesTest.test_named_sequences_names_in_pua_range @ linux-x86_64
-test.test_ucn.UnicodeNamesTest.test_named_sequences_sample @ linux-x86_64
 test.test_ucn.UnicodeNamesTest.test_strict_error_handling @ linux-x86_64
@@ -3,19 +3,11 @@ test.test_unicodedata.NormalizationTest.test_edge_cases @ linux-x86_64
 test.test_unicodedata.NormalizationTest.test_normalization @ linux-x86_64
 test.test_unicodedata.UnicodeFunctionsTest.test_category @ linux-x86_64
 test.test_unicodedata.UnicodeFunctionsTest.test_combining @ linux-x86_64
-test.test_unicodedata.UnicodeFunctionsTest.test_decimal @ linux-x86_64
-test.test_unicodedata.UnicodeFunctionsTest.test_decomposition @ linux-x86_64
-test.test_unicodedata.UnicodeFunctionsTest.test_digit @ linux-x86_64
 test.test_unicodedata.UnicodeFunctionsTest.test_east_asian_width @ linux-x86_64
 test.test_unicodedata.UnicodeFunctionsTest.test_east_asian_width_9_0_changes @ linux-x86_64
 test.test_unicodedata.UnicodeFunctionsTest.test_issue10254 @ linux-x86_64
 test.test_unicodedata.UnicodeFunctionsTest.test_issue29456 @ linux-x86_64
-test.test_unicodedata.UnicodeFunctionsTest.test_mirrored @ linux-x86_64
-test.test_unicodedata.UnicodeFunctionsTest.test_numeric @ linux-x86_64
 test.test_unicodedata.UnicodeFunctionsTest.test_pr29 @ linux-x86_64
 test.test_unicodedata.UnicodeMiscTest.test_bug_1704793 @ linux-x86_64
 test.test_unicodedata.UnicodeMiscTest.test_bug_4971 @ linux-x86_64
 test.test_unicodedata.UnicodeMiscTest.test_bug_5828 @ linux-x86_64
-test.test_unicodedata.UnicodeMiscTest.test_decimal_numeric_consistent @ linux-x86_64
-test.test_unicodedata.UnicodeMiscTest.test_digit_numeric_consistent @ linux-x86_64
-test.test_unicodedata.UnicodeMiscTest.test_ucd_510 @ linux-x86_64