From 8efdab1d6fe2d3a164b7dcc106ca62d86bdf184f Mon Sep 17 00:00:00 2001 From: Sarah Hoffmann Date: Thu, 11 Sep 2025 15:20:57 +0200 Subject: [PATCH] remove japanese variants Variants are only meant for word morphing which does not exist for Kanji. --- settings/icu-rules/variants-ja.yaml | 32 ----------------------------- settings/icu_tokenizer.yaml | 5 ----- 2 files changed, 37 deletions(-) delete mode 100644 settings/icu-rules/variants-ja.yaml diff --git a/settings/icu-rules/variants-ja.yaml b/settings/icu-rules/variants-ja.yaml deleted file mode 100644 index 72951d8c..00000000 --- a/settings/icu-rules/variants-ja.yaml +++ /dev/null @@ -1,32 +0,0 @@ -# Source: https://wiki.openstreetmap.org/wiki/Name_finder:Abbreviations#.E6.97.A5.E6.9C.AC.E8.AA.9E_.28Nihongo.29_-_Japanese -- lang: ja - words: - - ~中学校 |-> 中 - - ~大学 |-> 大 - - 独立行政法人~ -> 独 - - 学校法人~ -> 学 - - ~銀行 |-> 銀 - - ~合同会社 -> 合 - - 合同会社~ -> 合 - - ~合名会社 -> 名 - - 合名会社~ -> 名 - - ~合資会社 -> 資 - - 合資会社~ -> 資 - - 一般道道~ -> 一 - - 一般府道~ -> 一 - - 一般県道~ -> 一 - - 一般社団法人~ -> 一社 - - 一般都道~ -> 一 - - 一般財団法人~ -> 一財 - - 医療法人~ -> 医 - - ~株式会社 -> 株 - - 株式会社~ -> 株 - - 国立大学法人~ -> 大 - - 公立大学法人~ -> 大 - - ~高等学校 |-> 高 - - ~高等学校 |-> 高校 - - ~小学校 |-> 小 - - 主要地方道~ -> 主 - - 有限会社~ -> 有 - - ~有限会社 -> 有 - - 財団法人~ -> 財 diff --git a/settings/icu_tokenizer.yaml b/settings/icu_tokenizer.yaml index bb81f80b..45d21c2b 100644 --- a/settings/icu_tokenizer.yaml +++ b/settings/icu_tokenizer.yaml @@ -138,11 +138,6 @@ token-analysis: mode: variant-only variants: - !include icu-rules/variants-it.yaml - - id: ja - analyzer: generic - mode: variant-only - variants: - - !include icu-rules/variants-ja.yaml - id: mg analyzer: generic mode: variant-only -- 2.39.5