]> git.openstreetmap.org Git - nominatim.git/commit
contract duplicate spaces in transliteration string
authorSarah Hoffmann <lonvia@denofr.de>
Fri, 2 Dec 2022 09:15:02 +0000 (10:15 +0100)
committerSarah Hoffmann <lonvia@denofr.de>
Fri, 2 Dec 2022 09:15:02 +0000 (10:15 +0100)
commit0e186835b914074e1784ccce398a6eca3e78bfb7
tree594065ccfde9a4b0a1f95084a361791b1e70d917
parent45d13bc295dbe83940ae47aaa4ee3b9032a46df4
contract duplicate spaces in transliteration string

There are some pathological cases where an isolated letter may
be deleted because it is in itself meaningless. If this happens in
the middle of a sentence, then the transliteration contains two
consecutive spaces. Add a final rule to fix this.

See #2909.
settings/icu_tokenizer.yaml