1 -- SPDX-License-Identifier: GPL-2.0-only
 
   3 -- This file is part of Nominatim. (https://nominatim.org)
 
   5 -- Copyright (C) 2022 by the Nominatim developer community.
 
   6 -- For a full list of authors see the git log.
 
   8 -- Functions for interpreting wkipedia/wikidata tags and computing importance.
 
  10 DROP TYPE IF EXISTS wikipedia_article_match CASCADE;
 
  11 CREATE TYPE wikipedia_article_match as (
 
  17 DROP TYPE IF EXISTS place_importance CASCADE;
 
  18 CREATE TYPE place_importance as (
 
  24 -- See: http://stackoverflow.com/questions/6410088/how-can-i-mimic-the-php-urldecode-function-in-postgresql
 
  25 CREATE OR REPLACE FUNCTION decode_url_part(p varchar)
 
  28 SELECT convert_from(CAST(E'\\x' || array_to_string(ARRAY(
 
  29     SELECT CASE WHEN length(r.m[1]) = 1 THEN encode(convert_to(r.m[1], 'SQL_ASCII'), 'hex') ELSE substring(r.m[1] from 2 for 2) END
 
  30     FROM regexp_matches($1, '%[0-9a-f][0-9a-f]|.', 'gi') AS r(m)
 
  31 ), '') AS bytea), 'UTF8');
 
  33 LANGUAGE SQL IMMUTABLE STRICT;
 
  36 CREATE OR REPLACE FUNCTION catch_decode_url_part(p varchar)
 
  41   RETURN decode_url_part(p);
 
  43   WHEN others THEN return null;
 
  46 LANGUAGE plpgsql IMMUTABLE STRICT;
 
  49 CREATE OR REPLACE FUNCTION get_wikipedia_match(extratags HSTORE, country_code varchar(2))
 
  50   RETURNS wikipedia_article_match
 
  56   wiki_article_title TEXT;
 
  57   wiki_article_language TEXT;
 
  58   result wikipedia_article_match;
 
  60   langs := ARRAY['english','country','ar','bg','ca','cs','da','de','en','es','eo','eu','fa','fr','ko','hi','hr','id','it','he','lt','hu','ms','nl','ja','no','pl','pt','kk','ro','ru','sk','sl','sr','fi','sv','tr','uk','vi','vo','war','zh'];
 
  62   WHILE langs[i] IS NOT NULL LOOP
 
  63     wiki_article := extratags->(case when langs[i] in ('english','country') THEN 'wikipedia' ELSE 'wikipedia:'||langs[i] END);
 
  64     IF wiki_article is not null THEN
 
  65       wiki_article := regexp_replace(wiki_article,E'^(.*?)([a-z]{2,3}).wikipedia.org/wiki/',E'\\2:');
 
  66       wiki_article := regexp_replace(wiki_article,E'^(.*?)([a-z]{2,3}).wikipedia.org/w/index.php\\?title=',E'\\2:');
 
  67       wiki_article := regexp_replace(wiki_article,E'^(.*?)/([a-z]{2,3})/wiki/',E'\\2:');
 
  68       --wiki_article := regexp_replace(wiki_article,E'^(.*?)([a-z]{2,3})[=:]',E'\\2:');
 
  69       wiki_article := replace(wiki_article,' ','_');
 
  70       IF strpos(wiki_article, ':') IN (3,4) THEN
 
  71         wiki_article_language := lower(trim(split_part(wiki_article, ':', 1)));
 
  72         wiki_article_title := trim(substr(wiki_article, strpos(wiki_article, ':')+1));
 
  74         wiki_article_title := trim(wiki_article);
 
  75         wiki_article_language := CASE WHEN langs[i] = 'english' THEN 'en' WHEN langs[i] = 'country' THEN get_country_language_code(country_code) ELSE langs[i] END;
 
  78       select wikipedia_article.language,wikipedia_article.title,wikipedia_article.importance
 
  79         from wikipedia_article 
 
  80         where language = wiki_article_language and 
 
  81         (title = wiki_article_title OR title = catch_decode_url_part(wiki_article_title) OR title = replace(catch_decode_url_part(wiki_article_title),E'\\',''))
 
  83       select wikipedia_article.language,wikipedia_article.title,wikipedia_article.importance
 
  84         from wikipedia_redirect join wikipedia_article on (wikipedia_redirect.language = wikipedia_article.language and wikipedia_redirect.to_title = wikipedia_article.title)
 
  85         where wikipedia_redirect.language = wiki_article_language and 
 
  86         (from_title = wiki_article_title OR from_title = catch_decode_url_part(wiki_article_title) OR from_title = replace(catch_decode_url_part(wiki_article_title),E'\\',''))
 
  87       order by importance desc limit 1 INTO result;
 
  89       IF result.language is not null THEN
 
  98 LANGUAGE plpgsql STABLE;
 
 101 CREATE OR REPLACE FUNCTION compute_importance(extratags HSTORE,
 
 102                                               country_code varchar(2),
 
 103                                               rank_search SMALLINT,
 
 105   RETURNS place_importance
 
 109   result place_importance;
 
 110   osm_views_exists BIGINT;
 
 113   -- add importance by wikipedia article if the place has one
 
 115     SELECT * FROM get_wikipedia_match(extratags, country_code)
 
 116     WHERE language is not NULL
 
 118     result.importance := match.importance;
 
 119     result.wikipedia := match.language || ':' || match.title;
 
 123   -- Nothing? Then try with the wikidata tag.
 
 124   IF result.importance is null AND extratags ? 'wikidata' THEN
 
 125     FOR match IN SELECT * FROM wikipedia_article
 
 126                   WHERE wd_page_title = extratags->'wikidata'
 
 127                   ORDER BY language = 'en' DESC, langcount DESC LIMIT 1
 
 129       result.importance := match.importance;
 
 130       result.wikipedia := match.language || ':' || match.title;
 
 135   -- Still nothing? Fall back to a default.
 
 136   IF result.importance is null THEN
 
 137     result.importance := 0.75001 - (rank_search::float / 40);
 
 140 {% if 'secondary_importance' in db.tables %}
 
 142     SELECT ST_Value(rast, centroid) as importance
 
 143     FROM secondary_importance
 
 144     WHERE ST_Intersects(ST_ConvexHull(rast), centroid) LIMIT 1
 
 146     -- Secondary importance as tie breaker with 0.0001 weight.
 
 147     result.importance := result.importance + match.importance::float / 655350000;