]> git.openstreetmap.org Git - nominatim.git/blob - sql/functions.sql
Merge remote-tracking branch 'upstream/master'
[nominatim.git] / sql / functions.sql
1 --DROP TRIGGER IF EXISTS place_before_insert on placex;
2 --DROP TRIGGER IF EXISTS place_before_update on placex;
3 --CREATE TYPE addresscalculationtype AS (
4 --  word text,
5 --  score integer
6 --);
7
8 CREATE OR REPLACE FUNCTION getclasstypekey(c text, t text) RETURNS TEXT
9   AS $$
10 DECLARE
11 BEGIN
12   RETURN c||'|'||t;
13 END;
14 $$
15 LANGUAGE plpgsql IMMUTABLE;
16
17 CREATE OR REPLACE FUNCTION isbrokengeometry(place geometry) RETURNS BOOLEAN
18   AS $$
19 DECLARE
20   NEWgeometry geometry;
21 BEGIN
22   NEWgeometry := place;
23   IF ST_IsEmpty(NEWgeometry) OR NOT ST_IsValid(NEWgeometry) OR ST_X(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') OR ST_Y(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') THEN  
24     RETURN true;
25   END IF;
26   RETURN false;
27 END;
28 $$
29 LANGUAGE plpgsql IMMUTABLE;
30
31 CREATE OR REPLACE FUNCTION clean_geometry(place geometry) RETURNS geometry
32   AS $$
33 DECLARE
34   NEWgeometry geometry;
35 BEGIN
36   NEWgeometry := place;
37   IF ST_X(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') OR ST_Y(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') THEN  
38     NEWgeometry := ST_buffer(NEWgeometry,0);
39     IF ST_X(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') OR ST_Y(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') THEN  
40       RETURN ST_SetSRID(ST_Point(0,0),4326);
41     END IF;
42   END IF;
43   RETURN NEWgeometry;
44 END;
45 $$
46 LANGUAGE plpgsql IMMUTABLE;
47
48 CREATE OR REPLACE FUNCTION geometry_sector(partition INTEGER, place geometry) RETURNS INTEGER
49   AS $$
50 DECLARE
51   NEWgeometry geometry;
52 BEGIN
53 --  RAISE WARNING '%',place;
54   NEWgeometry := ST_PointOnSurface(place);
55 --  IF ST_IsEmpty(NEWgeometry) OR NOT ST_IsValid(NEWgeometry) OR ST_X(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') OR ST_Y(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') THEN  
56 --    NEWgeometry := ST_buffer(NEWgeometry,0);
57 --    IF ST_IsEmpty(NEWgeometry) OR NOT ST_IsValid(NEWgeometry) OR ST_X(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') OR ST_Y(ST_Centroid(NEWgeometry))::text in ('NaN','Infinity','-Infinity') THEN  
58 --      RETURN 0;
59 --    END IF;
60 --  END IF;
61   RETURN (partition*1000000) + (500-ST_X(NEWgeometry)::integer)*1000 + (500-ST_Y(NEWgeometry)::integer);
62 END;
63 $$
64 LANGUAGE plpgsql IMMUTABLE;
65
66 CREATE OR REPLACE FUNCTION transliteration(text) RETURNS text
67   AS '{modulepath}/nominatim.so', 'transliteration'
68 LANGUAGE c IMMUTABLE STRICT;
69
70 CREATE OR REPLACE FUNCTION gettokenstring(text) RETURNS text
71   AS '{modulepath}/nominatim.so', 'gettokenstring'
72 LANGUAGE c IMMUTABLE STRICT;
73
74 CREATE OR REPLACE FUNCTION make_standard_name(name TEXT) RETURNS TEXT
75   AS $$
76 DECLARE
77   o TEXT;
78 BEGIN
79   o := gettokenstring(transliteration(name));
80   RETURN trim(substr(o,1,length(o)));
81 END;
82 $$
83 LANGUAGE 'plpgsql' IMMUTABLE;
84
85 -- returns NULL if the word is too common
86 CREATE OR REPLACE FUNCTION getorcreate_word_id(lookup_word TEXT) 
87   RETURNS INTEGER
88   AS $$
89 DECLARE
90   lookup_token TEXT;
91   return_word_id INTEGER;
92   count INTEGER;
93 BEGIN
94   lookup_token := trim(lookup_word);
95   SELECT min(word_id), max(search_name_count) FROM word WHERE word_token = lookup_token and class is null and type is null into return_word_id, count;
96   IF return_word_id IS NULL THEN
97     return_word_id := nextval('seq_word');
98     INSERT INTO word VALUES (return_word_id, lookup_token, null, null, null, null, 0);
99   ELSE
100     IF count > get_maxwordfreq() THEN
101       return_word_id := NULL;
102     END IF;
103   END IF;
104   RETURN return_word_id;
105 END;
106 $$
107 LANGUAGE plpgsql;
108
109 CREATE OR REPLACE FUNCTION getorcreate_housenumber_id(lookup_word TEXT)
110   RETURNS INTEGER
111   AS $$
112 DECLARE
113   lookup_token TEXT;
114   return_word_id INTEGER;
115 BEGIN
116   lookup_token := ' '||trim(lookup_word);
117   SELECT min(word_id) FROM word WHERE word_token = lookup_token and class='place' and type='house' into return_word_id;
118   IF return_word_id IS NULL THEN
119     return_word_id := nextval('seq_word');
120     INSERT INTO word VALUES (return_word_id, lookup_token, null, 'place', 'house', null, 0);
121   END IF;
122   RETURN return_word_id;
123 END;
124 $$
125 LANGUAGE plpgsql;
126
127 CREATE OR REPLACE FUNCTION getorcreate_country(lookup_word TEXT, lookup_country_code varchar(2))
128   RETURNS INTEGER
129   AS $$
130 DECLARE
131   lookup_token TEXT;
132   return_word_id INTEGER;
133 BEGIN
134   lookup_token := ' '||trim(lookup_word);
135   SELECT min(word_id) FROM word WHERE word_token = lookup_token and country_code=lookup_country_code into return_word_id;
136   IF return_word_id IS NULL THEN
137     return_word_id := nextval('seq_word');
138     INSERT INTO word VALUES (return_word_id, lookup_token, null, null, null, lookup_country_code, 0);
139   END IF;
140   RETURN return_word_id;
141 END;
142 $$
143 LANGUAGE plpgsql;
144
145 CREATE OR REPLACE FUNCTION getorcreate_amenity(lookup_word TEXT, lookup_class text, lookup_type text)
146   RETURNS INTEGER
147   AS $$
148 DECLARE
149   lookup_token TEXT;
150   return_word_id INTEGER;
151 BEGIN
152   lookup_token := ' '||trim(lookup_word);
153   SELECT min(word_id) FROM word WHERE word_token = lookup_token and class=lookup_class and type = lookup_type into return_word_id;
154   IF return_word_id IS NULL THEN
155     return_word_id := nextval('seq_word');
156     INSERT INTO word VALUES (return_word_id, lookup_token, null, lookup_class, lookup_type, null, 0);
157   END IF;
158   RETURN return_word_id;
159 END;
160 $$
161 LANGUAGE plpgsql;
162
163 CREATE OR REPLACE FUNCTION getorcreate_tagpair(lookup_class text, lookup_type text)
164   RETURNS INTEGER
165   AS $$
166 DECLARE
167   lookup_token TEXT;
168   return_word_id INTEGER;
169 BEGIN
170   lookup_token := lookup_class||'='||lookup_type;
171   SELECT min(word_id) FROM word WHERE word_token = lookup_token into return_word_id;
172   IF return_word_id IS NULL THEN
173     return_word_id := nextval('seq_word');
174     INSERT INTO word VALUES (return_word_id, lookup_token, null, null, null, null, 0);
175   END IF;
176   RETURN return_word_id;
177 END;
178 $$
179 LANGUAGE plpgsql;
180
181 CREATE OR REPLACE FUNCTION get_tagpair(lookup_class text, lookup_type text)
182   RETURNS INTEGER
183   AS $$
184 DECLARE
185   lookup_token TEXT;
186   return_word_id INTEGER;
187 BEGIN
188   lookup_token := lookup_class||'='||lookup_type;
189   SELECT min(word_id) FROM word WHERE word_token = lookup_token into return_word_id;
190   RETURN return_word_id;
191 END;
192 $$
193 LANGUAGE plpgsql;
194
195 CREATE OR REPLACE FUNCTION getorcreate_amenityoperator(lookup_word TEXT, lookup_class text, lookup_type text, op text)
196   RETURNS INTEGER
197   AS $$
198 DECLARE
199   lookup_token TEXT;
200   return_word_id INTEGER;
201 BEGIN
202   lookup_token := ' '||trim(lookup_word);
203   SELECT min(word_id) FROM word WHERE word_token = lookup_token and class=lookup_class and type = lookup_type and operator = op into return_word_id;
204   IF return_word_id IS NULL THEN
205     return_word_id := nextval('seq_word');
206     INSERT INTO word VALUES (return_word_id, lookup_token, null, lookup_class, lookup_type, null, 0, op);
207   END IF;
208   RETURN return_word_id;
209 END;
210 $$
211 LANGUAGE plpgsql;
212
213 CREATE OR REPLACE FUNCTION getorcreate_name_id(lookup_word TEXT, src_word TEXT) 
214   RETURNS INTEGER
215   AS $$
216 DECLARE
217   lookup_token TEXT;
218   nospace_lookup_token TEXT;
219   return_word_id INTEGER;
220 BEGIN
221   lookup_token := ' '||trim(lookup_word);
222   SELECT min(word_id) FROM word WHERE word_token = lookup_token and class is null and type is null into return_word_id;
223   IF return_word_id IS NULL THEN
224     return_word_id := nextval('seq_word');
225     INSERT INTO word VALUES (return_word_id, lookup_token, src_word, null, null, null, 0);
226 --    nospace_lookup_token := replace(replace(lookup_token, '-',''), ' ','');
227 --    IF ' '||nospace_lookup_token != lookup_token THEN
228 --      INSERT INTO word VALUES (return_word_id, '-'||nospace_lookup_token, null, src_word, null, null, null, 0, null);
229 --    END IF;
230   END IF;
231   RETURN return_word_id;
232 END;
233 $$
234 LANGUAGE plpgsql;
235
236 CREATE OR REPLACE FUNCTION getorcreate_name_id(lookup_word TEXT) 
237   RETURNS INTEGER
238   AS $$
239 DECLARE
240 BEGIN
241   RETURN getorcreate_name_id(lookup_word, '');
242 END;
243 $$
244 LANGUAGE plpgsql;
245
246 CREATE OR REPLACE FUNCTION get_word_id(lookup_word TEXT) 
247   RETURNS INTEGER
248   AS $$
249 DECLARE
250   lookup_token TEXT;
251   return_word_id INTEGER;
252 BEGIN
253   lookup_token := trim(lookup_word);
254   SELECT min(word_id) FROM word WHERE word_token = lookup_token and class is null and type is null into return_word_id;
255   RETURN return_word_id;
256 END;
257 $$
258 LANGUAGE plpgsql IMMUTABLE;
259
260 CREATE OR REPLACE FUNCTION get_name_id(lookup_word TEXT) 
261   RETURNS INTEGER
262   AS $$
263 DECLARE
264   lookup_token TEXT;
265   return_word_id INTEGER;
266 BEGIN
267   lookup_token := ' '||trim(lookup_word);
268   SELECT min(word_id) FROM word WHERE word_token = lookup_token and class is null and type is null into return_word_id;
269   RETURN return_word_id;
270 END;
271 $$
272 LANGUAGE plpgsql IMMUTABLE;
273
274 CREATE OR REPLACE FUNCTION get_name_ids(lookup_word TEXT)
275   RETURNS INTEGER[]
276   AS $$
277 DECLARE
278   lookup_token TEXT;
279   return_word_ids INTEGER[];
280 BEGIN
281   lookup_token := ' '||trim(lookup_word);
282   SELECT array_agg(word_id) FROM word WHERE word_token = lookup_token and class is null and type is null into return_word_ids;
283   RETURN return_word_ids;
284 END;
285 $$
286 LANGUAGE plpgsql IMMUTABLE;
287
288 CREATE OR REPLACE FUNCTION array_merge(a INTEGER[], b INTEGER[])
289   RETURNS INTEGER[]
290   AS $$
291 DECLARE
292   i INTEGER;
293   r INTEGER[];
294 BEGIN
295   IF array_upper(a, 1) IS NULL THEN
296     RETURN b;
297   END IF;
298   IF array_upper(b, 1) IS NULL THEN
299     RETURN a;
300   END IF;
301   r := a;
302   FOR i IN 1..array_upper(b, 1) LOOP  
303     IF NOT (ARRAY[b[i]] <@ r) THEN
304       r := r || b[i];
305     END IF;
306   END LOOP;
307   RETURN r;
308 END;
309 $$
310 LANGUAGE plpgsql IMMUTABLE;
311
312 CREATE OR REPLACE FUNCTION create_country(src HSTORE, lookup_country_code varchar(2)) RETURNS VOID
313   AS $$
314 DECLARE
315   s TEXT;
316   w INTEGER;
317   words TEXT[];
318   item RECORD;
319   j INTEGER;
320 BEGIN
321   FOR item IN SELECT (each(src)).* LOOP
322
323     s := make_standard_name(item.value);
324     w := getorcreate_country(s, lookup_country_code);
325
326     words := regexp_split_to_array(item.value, E'[,;()]');
327     IF array_upper(words, 1) != 1 THEN
328       FOR j IN 1..array_upper(words, 1) LOOP
329         s := make_standard_name(words[j]);
330         IF s != '' THEN
331           w := getorcreate_country(s, lookup_country_code);
332         END IF;
333       END LOOP;
334     END IF;
335   END LOOP;
336 END;
337 $$
338 LANGUAGE plpgsql;
339
340 CREATE OR REPLACE FUNCTION make_keywords(src HSTORE) RETURNS INTEGER[]
341   AS $$
342 DECLARE
343   result INTEGER[];
344   s TEXT;
345   w INTEGER;
346   words TEXT[];
347   item RECORD;
348   j INTEGER;
349 BEGIN
350   result := '{}'::INTEGER[];
351
352   FOR item IN SELECT (each(src)).* LOOP
353
354     s := make_standard_name(item.value);
355
356     w := getorcreate_name_id(s, item.value);
357
358     IF not(ARRAY[w] <@ result) THEN
359       result := result || w;
360     END IF;
361
362     w := getorcreate_word_id(s);
363
364     IF w IS NOT NULL AND NOT (ARRAY[w] <@ result) THEN
365       result := result || w;
366     END IF;
367
368     words := string_to_array(s, ' ');
369     IF array_upper(words, 1) IS NOT NULL THEN
370       FOR j IN 1..array_upper(words, 1) LOOP
371         IF (words[j] != '') THEN
372           w = getorcreate_word_id(words[j]);
373           IF w IS NOT NULL AND NOT (ARRAY[w] <@ result) THEN
374             result := result || w;
375           END IF;
376         END IF;
377       END LOOP;
378     END IF;
379
380     words := regexp_split_to_array(item.value, E'[,;()]');
381     IF array_upper(words, 1) != 1 THEN
382       FOR j IN 1..array_upper(words, 1) LOOP
383         s := make_standard_name(words[j]);
384         IF s != '' THEN
385           w := getorcreate_word_id(s);
386           IF w IS NOT NULL AND NOT (ARRAY[w] <@ result) THEN
387             result := result || w;
388           END IF;
389         END IF;
390       END LOOP;
391     END IF;
392
393     s := regexp_replace(item.value, '市$', '');
394     IF s != item.value THEN
395       s := make_standard_name(s);
396       IF s != '' THEN
397         w := getorcreate_name_id(s, item.value);
398         IF NOT (ARRAY[w] <@ result) THEN
399           result := result || w;
400         END IF;
401       END IF;
402     END IF;
403
404   END LOOP;
405
406   RETURN result;
407 END;
408 $$
409 LANGUAGE plpgsql IMMUTABLE;
410
411 CREATE OR REPLACE FUNCTION make_keywords(src TEXT) RETURNS INTEGER[]
412   AS $$
413 DECLARE
414   result INTEGER[];
415   s TEXT;
416   w INTEGER;
417   words TEXT[];
418   i INTEGER;
419   j INTEGER;
420 BEGIN
421   result := '{}'::INTEGER[];
422
423   s := make_standard_name(src);
424   w := getorcreate_name_id(s, src);
425
426   IF NOT (ARRAY[w] <@ result) THEN
427     result := result || w;
428   END IF;
429
430   w := getorcreate_word_id(s);
431
432   IF w IS NOT NULL AND NOT (ARRAY[w] <@ result) THEN
433     result := result || w;
434   END IF;
435
436   words := string_to_array(s, ' ');
437   IF array_upper(words, 1) IS NOT NULL THEN
438     FOR j IN 1..array_upper(words, 1) LOOP
439       IF (words[j] != '') THEN
440         w = getorcreate_word_id(words[j]);
441         IF w IS NOT NULL AND NOT (ARRAY[w] <@ result) THEN
442           result := result || w;
443         END IF;
444       END IF;
445     END LOOP;
446   END IF;
447
448   words := regexp_split_to_array(src, E'[,;()]');
449   IF array_upper(words, 1) != 1 THEN
450     FOR j IN 1..array_upper(words, 1) LOOP
451       s := make_standard_name(words[j]);
452       IF s != '' THEN
453         w := getorcreate_word_id(s);
454         IF w IS NOT NULL AND NOT (ARRAY[w] <@ result) THEN
455           result := result || w;
456         END IF;
457       END IF;
458     END LOOP;
459   END IF;
460
461   s := regexp_replace(src, '市$', '');
462   IF s != src THEN
463     s := make_standard_name(s);
464     IF s != '' THEN
465       w := getorcreate_name_id(s, src);
466       IF NOT (ARRAY[w] <@ result) THEN
467         result := result || w;
468       END IF;
469     END IF;
470   END IF;
471
472   RETURN result;
473 END;
474 $$
475 LANGUAGE plpgsql IMMUTABLE;
476
477 CREATE OR REPLACE FUNCTION get_country_code(place geometry) RETURNS TEXT
478   AS $$
479 DECLARE
480   place_centre GEOMETRY;
481   nearcountry RECORD;
482 BEGIN
483   place_centre := ST_PointOnSurface(place);
484
485 --DEBUG: RAISE WARNING 'get_country_code, start: %', ST_AsText(place_centre);
486
487   -- Try for a OSM polygon
488   FOR nearcountry IN select country_code from location_area_country where country_code is not null and not isguess and st_covers(geometry, place_centre) limit 1
489   LOOP
490     RETURN nearcountry.country_code;
491   END LOOP;
492
493 --DEBUG: RAISE WARNING 'osm fallback: %', ST_AsText(place_centre);
494
495   -- Try for OSM fallback data
496   -- The order is to deal with places like HongKong that are 'states' within another polygon
497   FOR nearcountry IN select country_code from country_osm_grid where st_covers(geometry, place_centre) order by area asc limit 1
498   LOOP
499     RETURN nearcountry.country_code;
500   END LOOP;
501
502 --DEBUG: RAISE WARNING 'natural earth: %', ST_AsText(place_centre);
503
504   -- Natural earth data
505   FOR nearcountry IN select country_code from country_naturalearthdata where st_covers(geometry, place_centre) limit 1
506   LOOP
507     RETURN nearcountry.country_code;
508   END LOOP;
509
510 --DEBUG: RAISE WARNING 'near osm fallback: %', ST_AsText(place_centre);
511
512   -- 
513   FOR nearcountry IN select country_code from country_osm_grid where st_dwithin(geometry, place_centre, 0.5) order by st_distance(geometry, place_centre) asc, area asc limit 1
514   LOOP
515     RETURN nearcountry.country_code;
516   END LOOP;
517
518 --DEBUG: RAISE WARNING 'near natural earth: %', ST_AsText(place_centre);
519
520   -- Natural earth data 
521   FOR nearcountry IN select country_code from country_naturalearthdata where st_dwithin(geometry, place_centre, 0.5) limit 1
522   LOOP
523     RETURN nearcountry.country_code;
524   END LOOP;
525
526   RETURN NULL;
527 END;
528 $$
529 LANGUAGE plpgsql IMMUTABLE;
530
531 CREATE OR REPLACE FUNCTION get_country_language_code(search_country_code VARCHAR(2)) RETURNS TEXT
532   AS $$
533 DECLARE
534   nearcountry RECORD;
535 BEGIN
536   FOR nearcountry IN select distinct country_default_language_code from country_name where country_code = search_country_code limit 1
537   LOOP
538     RETURN lower(nearcountry.country_default_language_code);
539   END LOOP;
540   RETURN NULL;
541 END;
542 $$
543 LANGUAGE plpgsql IMMUTABLE;
544
545 CREATE OR REPLACE FUNCTION get_country_language_codes(search_country_code VARCHAR(2)) RETURNS TEXT[]
546   AS $$
547 DECLARE
548   nearcountry RECORD;
549 BEGIN
550   FOR nearcountry IN select country_default_language_codes from country_name where country_code = search_country_code limit 1
551   LOOP
552     RETURN lower(nearcountry.country_default_language_codes);
553   END LOOP;
554   RETURN NULL;
555 END;
556 $$
557 LANGUAGE plpgsql IMMUTABLE;
558
559 CREATE OR REPLACE FUNCTION get_partition(in_country_code VARCHAR(10)) RETURNS INTEGER
560   AS $$
561 DECLARE
562   nearcountry RECORD;
563 BEGIN
564   FOR nearcountry IN select partition from country_name where country_code = in_country_code
565   LOOP
566     RETURN nearcountry.partition;
567   END LOOP;
568   RETURN 0;
569 END;
570 $$
571 LANGUAGE plpgsql IMMUTABLE;
572
573 CREATE OR REPLACE FUNCTION delete_location(OLD_place_id BIGINT) RETURNS BOOLEAN
574   AS $$
575 DECLARE
576 BEGIN
577   DELETE FROM location_area where place_id = OLD_place_id;
578 -- TODO:location_area
579   RETURN true;
580 END;
581 $$
582 LANGUAGE plpgsql;
583
584 CREATE OR REPLACE FUNCTION add_location(
585     place_id BIGINT,
586     country_code varchar(2),
587     partition INTEGER,
588     keywords INTEGER[],
589     rank_search INTEGER,
590     rank_address INTEGER,
591     geometry GEOMETRY
592   ) 
593   RETURNS BOOLEAN
594   AS $$
595 DECLARE
596   locationid INTEGER;
597   isarea BOOLEAN;
598   centroid GEOMETRY;
599   diameter FLOAT;
600   x BOOLEAN;
601   splitGeom RECORD;
602   secgeo GEOMETRY;
603 BEGIN
604
605   IF rank_search > 25 THEN
606     RAISE EXCEPTION 'Adding location with rank > 25 (% rank %)', place_id, rank_search;
607   END IF;
608
609 --  RAISE WARNING 'Adding location with rank > 25 (% rank %)', place_id, rank_search;
610
611   x := deleteLocationArea(partition, place_id, rank_search);
612
613   isarea := false;
614   IF (ST_GeometryType(geometry) in ('ST_Polygon','ST_MultiPolygon') AND ST_IsValid(geometry)) THEN
615
616     isArea := true;
617     centroid := ST_Centroid(geometry);
618
619     FOR secgeo IN select split_geometry(geometry) AS geom LOOP
620       x := insertLocationAreaLarge(partition, place_id, country_code, keywords, rank_search, rank_address, false, centroid, secgeo);
621     END LOOP;
622
623   ELSEIF rank_search < 26 THEN
624
625     diameter := 0.02;
626     IF rank_address = 0 THEN
627       diameter := 0.02;
628     ELSEIF rank_search <= 14 THEN
629       diameter := 1.2;
630     ELSEIF rank_search <= 15 THEN
631       diameter := 1;
632     ELSEIF rank_search <= 16 THEN
633       diameter := 0.5;
634     ELSEIF rank_search <= 17 THEN
635       diameter := 0.2;
636     ELSEIF rank_search <= 21 THEN
637       diameter := 0.05;
638     ELSEIF rank_search = 25 THEN
639       diameter := 0.005;
640     END IF;
641
642 --    RAISE WARNING 'adding % diameter %', place_id, diameter;
643
644     secgeo := ST_Buffer(geometry, diameter);
645     x := insertLocationAreaLarge(partition, place_id, country_code, keywords, rank_search, rank_address, true, ST_Centroid(geometry), secgeo);
646
647   ELSE
648
649     -- ~ 20meters
650     secgeo := ST_Buffer(geometry, 0.0002);
651     x := insertLocationAreaRoadNear(partition, place_id, country_code, keywords, rank_search, rank_address, true, ST_Centroid(geometry), secgeo);
652
653     -- ~ 100meters
654     secgeo := ST_Buffer(geometry, 0.001);
655     x := insertLocationAreaRoadFar(partition, place_id, country_code, keywords, rank_search, rank_address, true, ST_Centroid(geometry), secgeo);
656
657   END IF;
658
659   RETURN true;
660 END;
661 $$
662 LANGUAGE plpgsql;
663
664 CREATE OR REPLACE FUNCTION update_location(
665     partition INTEGER,
666     place_id BIGINT,
667     place_country_code varchar(2),
668     name hstore,
669     rank_search INTEGER,
670     rank_address INTEGER,
671     geometry GEOMETRY
672   ) 
673   RETURNS BOOLEAN
674   AS $$
675 DECLARE
676   b BOOLEAN;
677 BEGIN
678   b := deleteLocationArea(partition, place_id, rank_search);
679 --  result := add_location(NEW.place_id, NEW.country_code, NEW.partition, name_vector, NEW.rank_search, NEW.rank_address, NEW.geometry);
680   RETURN add_location(place_id, place_country_code, name, rank_search, rank_address, geometry);
681 END;
682 $$
683 LANGUAGE plpgsql;
684
685 CREATE OR REPLACE FUNCTION search_name_add_words(parent_place_id BIGINT, to_add INTEGER[])
686   RETURNS BOOLEAN
687   AS $$
688 DECLARE
689   childplace RECORD;
690 BEGIN
691
692   IF #to_add = 0 THEN
693     RETURN true;
694   END IF;
695
696   -- this should just be an update, but it seems to do insane things to the index size (delete and insert doesn't)
697   FOR childplace IN select * from search_name,place_addressline 
698     where  address_place_id = parent_place_id
699       and search_name.place_id = place_addressline.place_id
700   LOOP
701     delete from search_name where place_id = childplace.place_id;
702     IF not (ARRAY[to_add] <@ childplace.nameaddress_vector) THEN
703       childplace.nameaddress_vector := childplace.nameaddress_vector || to_add;
704     END IF;
705     IF childplace.place_id = parent_place_id and not (ARRAY[to_add] <@ childplace.name_vector) THEN
706       childplace.name_vector := childplace.name_vector || to_add;
707     END IF;
708     insert into search_name (place_id, search_rank, address_rank, country_code, name_vector, nameaddress_vector, centroid) 
709       values (childplace.place_id, childplace.search_rank, childplace.address_rank, childplace.country_code, 
710         childplace.name_vector, childplace.nameaddress_vector, childplace.centroid);
711   END LOOP;
712
713   RETURN true;
714 END;
715 $$
716 LANGUAGE plpgsql;
717
718 CREATE OR REPLACE FUNCTION update_location_nameonly(partition INTEGER, OLD_place_id BIGINT, name hstore) RETURNS BOOLEAN
719   AS $$
720 DECLARE
721   newkeywords INTEGER[];
722   addedkeywords INTEGER[];
723   removedkeywords INTEGER[];
724 BEGIN
725
726   -- what has changed?
727   newkeywords := make_keywords(name);
728   select coalesce(newkeywords,'{}'::INTEGER[]) - coalesce(location_point.keywords,'{}'::INTEGER[]), 
729     coalesce(location_point.keywords,'{}'::INTEGER[]) - coalesce(newkeywords,'{}'::INTEGER[]) from location_point 
730     where place_id = OLD_place_id into addedkeywords, removedkeywords;
731
732 --  RAISE WARNING 'update_location_nameonly for %: new:% added:% removed:%', OLD_place_id, newkeywords, addedkeywords, removedkeywords;
733
734   IF #removedkeywords > 0 THEN
735     -- abort due to tokens removed
736     RETURN false;
737   END IF;
738   
739   IF #addedkeywords > 0 THEN
740     -- short circuit - no changes
741     RETURN true;
742   END IF;
743
744   UPDATE location_area set keywords = newkeywords where place_id = OLD_place_id;
745   RETURN search_name_add_words(OLD_place_id, addedkeywords);
746 END;
747 $$
748 LANGUAGE plpgsql;
749
750 -- find the parant road of an interpolation
751 CREATE OR REPLACE FUNCTION get_interpolation_parent(wayid BIGINT, street TEXT, place TEXT,
752                                                     partition INTEGER, centroid GEOMETRY, geom GEOMETRY)
753 RETURNS BIGINT AS $$
754 DECLARE
755   addr_street TEXT;
756   addr_place TEXT;
757   parent_place_id BIGINT;
758   address_street_word_ids INTEGER[];
759
760   waynodes BIGINT[];
761
762   location RECORD;
763 BEGIN
764   addr_street = street;
765   addr_place = place;
766
767   IF addr_street is null and addr_place is null THEN
768     select nodes from planet_osm_ways where id = wayid INTO waynodes;
769     FOR location IN SELECT placex.street, placex.addr_place from placex 
770                     where osm_type = 'N' and osm_id = ANY(waynodes)
771                           and (placex.street is not null or placex.addr_place is not null)
772                           and indexed_status < 100
773                     limit 1 LOOP
774       addr_street = location.street;
775       addr_place = location.addr_place;
776     END LOOP;
777   END IF;
778
779   IF addr_street IS NOT NULL THEN
780     address_street_word_ids := get_name_ids(make_standard_name(addr_street));
781     IF address_street_word_ids IS NOT NULL THEN
782       FOR location IN SELECT place_id from getNearestNamedRoadFeature(partition, centroid, address_street_word_ids) LOOP
783         parent_place_id := location.place_id;
784       END LOOP;
785     END IF;
786   END IF;
787
788   IF parent_place_id IS NULL AND addr_place IS NOT NULL THEN
789     address_street_word_ids := get_name_ids(make_standard_name(addr_place));
790     IF address_street_word_ids IS NOT NULL THEN
791       FOR location IN SELECT place_id from getNearestNamedPlaceFeature(partition, centroid, address_street_word_ids) LOOP
792         parent_place_id := location.place_id;
793       END LOOP;
794     END IF;
795   END IF;
796
797   IF parent_place_id is null THEN
798     FOR location IN SELECT place_id FROM placex
799         WHERE ST_DWithin(geom, placex.geometry, 0.001) and placex.rank_search = 26
800         ORDER BY (ST_distance(placex.geometry, ST_LineInterpolatePoint(geom,0))+
801                   ST_distance(placex.geometry, ST_LineInterpolatePoint(geom,0.5))+
802                   ST_distance(placex.geometry, ST_LineInterpolatePoint(geom,1))) ASC limit 1
803     LOOP
804       parent_place_id := location.place_id;
805     END LOOP;
806   END IF;
807
808   IF parent_place_id is null THEN
809     RETURN 0;
810   END IF;
811
812   RETURN parent_place_id;
813 END;
814 $$
815 LANGUAGE plpgsql;
816
817 CREATE OR REPLACE FUNCTION create_interpolation(wayid BIGINT, interpolationtype TEXT,
818                                                 parent_id BIGINT, partition INTEGER,
819                                                 country_code TEXT,  geometry_sector INTEGER,
820                                                 defpostalcode TEXT, geom GEOMETRY) RETURNS INTEGER
821   AS $$
822 DECLARE
823
824   newpoints INTEGER;
825   waynodes BIGINT[];
826   nodeid BIGINT;
827   prevnode RECORD;
828   nextnode RECORD;
829   startnumber INTEGER;
830   endnumber INTEGER;
831   stepsize INTEGER;
832   orginalstartnumber INTEGER;
833   originalnumberrange INTEGER;
834   housenum INTEGER;
835   linegeo GEOMETRY;
836   splitline GEOMETRY;
837   sectiongeo GEOMETRY;
838   pointgeo GEOMETRY;
839
840 BEGIN
841   delete from placex where osm_type = 'W' and osm_id = wayid
842                                           and class = 'place' and type = 'address';
843
844   IF interpolationtype = 'odd' OR interpolationtype = 'even' THEN
845     stepsize := 2;
846   ELSEIF interpolationtype = 'all' THEN
847     stepsize := 1;
848   ELSEIF interpolationtype ~ '^\d+$' THEN
849     stepsize := interpolationtype::INTEGER;
850   ELSE
851     RETURN 0;
852   END IF;
853
854   select nodes from planet_osm_ways where id = wayid INTO waynodes;
855
856   IF array_upper(waynodes, 1) IS NULL THEN
857     RETURN 0;
858   END IF;
859
860   linegeo := geom;
861   startnumber := NULL;
862   newpoints := 0;
863
864   FOR nodeidpos in 1..array_upper(waynodes, 1) LOOP
865
866     -- If there is a place of a type other than place/house, use that because
867     -- it is guaranteed to be the original node. For place/house types use the
868     -- one with the smallest id because the original node was created first.
869     -- Ignore all nodes marked for deletion. (Might happen when the type changes.)
870     select * from placex where osm_type = 'N' and osm_id = waynodes[nodeidpos]::BIGINT
871                                and indexed_status < 100
872                          order by (type = 'address'),place_id limit 1 INTO nextnode;
873     IF nextnode.place_id IS NOT NULL THEN
874
875         IF nodeidpos > 1 and nodeidpos < array_upper(waynodes, 1) THEN
876           -- Make sure that the point is actually on the line. That might
877           -- be a bit paranoid but ensures that the algorithm still works
878           -- should osm2pgsql attempt to repair geometries.
879           splitline := split_line_on_node(linegeo, nextnode.geometry);
880           sectiongeo := ST_GeometryN(splitline, 1);
881           linegeo := ST_GeometryN(splitline, 2);
882         ELSE
883           sectiongeo = linegeo;
884         END IF;
885         endnumber := substring(nextnode.housenumber,'[0-9]+')::integer;
886
887         IF startnumber IS NOT NULL AND endnumber IS NOT NULL
888            AND @(startnumber - endnumber) < 1000 AND startnumber != endnumber
889            AND ST_GeometryType(sectiongeo) = 'ST_LineString' THEN
890
891           IF (startnumber > endnumber) THEN
892             housenum := endnumber;
893             endnumber := startnumber;
894             startnumber := housenum;
895             sectiongeo := ST_Reverse(sectiongeo);
896           END IF;
897           orginalstartnumber := startnumber;
898           originalnumberrange := endnumber - startnumber;
899
900           startnumber := startnumber + stepsize;
901           -- correct for odd/even
902           IF (interpolationtype = 'odd' AND startnumber%2 = 0)
903              OR (interpolationtype = 'even' AND startnumber%2 = 1) THEN
904             startnumber := startnumber - 1;
905           END IF;
906           endnumber := endnumber - 1;
907
908           -- keep for compatibility with previous versions
909           delete from placex where osm_type = 'N' and osm_id = prevnode.osm_id
910                                and place_id != prevnode.place_id and class = 'place'
911                                and type = 'house';
912           FOR housenum IN startnumber..endnumber BY stepsize LOOP
913             pointgeo := ST_LineInterpolatePoint(sectiongeo, (housenum::float-orginalstartnumber::float)/originalnumberrange::float);
914             insert into placex (place_id, partition, osm_type, osm_id,
915                                 class, type, admin_level, housenumber,
916                                 postcode,
917                                 country_code, parent_place_id, rank_address, rank_search,
918                                 indexed_status, indexed_date, geometry_sector,
919                                 calculated_country_code, centroid, geometry)
920               values (nextval('seq_place'), partition, 'W', wayid,
921                       'place', 'address', prevnode.admin_level, housenum,
922                       coalesce(prevnode.postcode, defpostalcode),
923                       prevnode.country_code, parent_id, 30, 30,
924                       0, now(), geometry_sector, country_code,
925                       pointgeo, pointgeo);
926             newpoints := newpoints + 1;
927 --RAISE WARNING 'interpolation number % % ',prevnode.place_id,housenum;
928           END LOOP;
929         END IF;
930
931         -- early break if we are out of line string,
932         -- might happen when a line string loops back on itself
933         IF ST_GeometryType(linegeo) != 'ST_LineString' THEN
934             RETURN newpoints;
935         END IF;
936
937         startnumber := substring(nextnode.housenumber,'[0-9]+')::integer;
938         prevnode := nextnode;
939     END IF;
940   END LOOP;
941
942 --RAISE WARNING 'interpolation points % ',newpoints;
943
944   RETURN newpoints;
945 END;
946 $$
947 LANGUAGE plpgsql;
948
949 CREATE OR REPLACE FUNCTION placex_insert() RETURNS TRIGGER
950   AS $$
951 DECLARE
952   i INTEGER;
953   postcode TEXT;
954   result BOOLEAN;
955   country_code VARCHAR(2);
956   default_language VARCHAR(10);
957   diameter FLOAT;
958   classtable TEXT;
959 BEGIN
960   --DEBUG: RAISE WARNING '% %',NEW.osm_type,NEW.osm_id;
961
962   -- ignore interpolated addresses
963   IF NEW.class = 'place' and NEW.type = 'address' THEN
964     RETURN NEW;
965   END IF;
966
967   -- just block these
968   IF NEW.class in ('landuse','natural') and NEW.name is null THEN
969 --    RAISE WARNING 'empty landuse %',NEW.osm_id;
970     RETURN null;
971   END IF;
972
973   IF ST_IsEmpty(NEW.geometry) OR NOT ST_IsValid(NEW.geometry) OR ST_X(ST_Centroid(NEW.geometry))::text in ('NaN','Infinity','-Infinity') OR ST_Y(ST_Centroid(NEW.geometry))::text in ('NaN','Infinity','-Infinity') THEN  
974     -- block all invalid geometary - just not worth the risk.  seg faults are causing serious problems.
975     RAISE WARNING 'invalid geometry %',NEW.osm_id;
976     RETURN NULL;
977
978     -- Dead code
979     IF NEW.osm_type = 'R' THEN
980       -- invalid multipolygons can crash postgis, don't even bother to try!
981       RETURN NULL;
982     END IF;
983     NEW.geometry := ST_buffer(NEW.geometry,0);
984     IF ST_IsEmpty(NEW.geometry) OR NOT ST_IsValid(NEW.geometry) OR ST_X(ST_Centroid(NEW.geometry))::text in ('NaN','Infinity','-Infinity') OR ST_Y(ST_Centroid(NEW.geometry))::text in ('NaN','Infinity','-Infinity') THEN  
985       RAISE WARNING 'Invalid geometary, rejecting: % %', NEW.osm_type, NEW.osm_id;
986       RETURN NULL;
987     END IF;
988   END IF;
989
990   --DEBUG: RAISE WARNING '% % % %',NEW.osm_type,NEW.osm_id,NEW.class,NEW.type;
991
992   NEW.place_id := nextval('seq_place');
993   NEW.indexed_status := 1; --STATUS_NEW
994
995   NEW.calculated_country_code := lower(get_country_code(NEW.geometry));
996
997   NEW.partition := get_partition(NEW.calculated_country_code);
998   NEW.geometry_sector := geometry_sector(NEW.partition, NEW.geometry);
999
1000   -- copy 'name' to or from the default language (if there is a default language)
1001   IF NEW.name is not null AND array_upper(akeys(NEW.name),1) > 1 THEN
1002     default_language := get_country_language_code(NEW.calculated_country_code);
1003     IF default_language IS NOT NULL THEN
1004       IF NEW.name ? 'name' AND NOT NEW.name ? ('name:'||default_language) THEN
1005         NEW.name := NEW.name || hstore(('name:'||default_language), (NEW.name -> 'name'));
1006       ELSEIF NEW.name ? ('name:'||default_language) AND NOT NEW.name ? 'name' THEN
1007         NEW.name := NEW.name || hstore('name', (NEW.name -> ('name:'||default_language)));
1008       END IF;
1009     END IF;
1010   END IF;
1011
1012   IF NEW.admin_level > 15 THEN
1013     NEW.admin_level := 15;
1014   END IF;
1015
1016   IF NEW.housenumber IS NOT NULL THEN
1017     i := getorcreate_housenumber_id(make_standard_name(NEW.housenumber));
1018   END IF;
1019
1020   IF NEW.osm_type = 'X' THEN
1021     -- E'X'ternal records should already be in the right format so do nothing
1022   ELSE
1023     NEW.rank_search := 30;
1024     NEW.rank_address := NEW.rank_search;
1025
1026     -- By doing in postgres we have the country available to us - currently only used for postcode
1027     IF NEW.class in ('place','boundary') AND NEW.type in ('postcode','postal_code') THEN
1028
1029         IF NEW.postcode IS NULL THEN
1030             -- most likely just a part of a multipolygon postcode boundary, throw it away
1031             RETURN NULL;
1032         END IF;
1033
1034         NEW.name := hstore('ref', NEW.postcode);
1035
1036         IF NEW.calculated_country_code = 'gb' THEN
1037
1038           IF NEW.postcode ~ '^([A-Z][A-Z]?[0-9][0-9A-Z]? [0-9][A-Z][A-Z])$' THEN
1039             NEW.rank_search := 25;
1040             NEW.rank_address := 5;
1041           ELSEIF NEW.postcode ~ '^([A-Z][A-Z]?[0-9][0-9A-Z]? [0-9])$' THEN
1042             NEW.rank_search := 23;
1043             NEW.rank_address := 5;
1044           ELSEIF NEW.postcode ~ '^([A-Z][A-Z]?[0-9][0-9A-Z])$' THEN
1045             NEW.rank_search := 21;
1046             NEW.rank_address := 5;
1047           END IF;
1048
1049         ELSEIF NEW.calculated_country_code = 'sg' THEN
1050
1051           IF NEW.postcode ~ '^([0-9]{6})$' THEN
1052             NEW.rank_search := 25;
1053             NEW.rank_address := 11;
1054           END IF;
1055
1056         ELSEIF NEW.calculated_country_code = 'de' THEN
1057
1058           IF NEW.postcode ~ '^([0-9]{5})$' THEN
1059             NEW.rank_search := 21;
1060             NEW.rank_address := 11;
1061           END IF;
1062
1063         ELSE
1064           -- Guess at the postcode format and coverage (!)
1065           IF upper(NEW.postcode) ~ '^[A-Z0-9]{1,5}$' THEN -- Probably too short to be very local
1066             NEW.rank_search := 21;
1067             NEW.rank_address := 11;
1068           ELSE
1069             -- Does it look splitable into and area and local code?
1070             postcode := substring(upper(NEW.postcode) from '^([- :A-Z0-9]+)([- :][A-Z0-9]+)$');
1071
1072             IF postcode IS NOT NULL THEN
1073               NEW.rank_search := 25;
1074               NEW.rank_address := 11;
1075             ELSEIF NEW.postcode ~ '^[- :A-Z0-9]{6,}$' THEN
1076               NEW.rank_search := 21;
1077               NEW.rank_address := 11;
1078             END IF;
1079           END IF;
1080         END IF;
1081
1082     ELSEIF NEW.class = 'place' THEN
1083       IF NEW.type in ('continent') THEN
1084         NEW.rank_search := 2;
1085         NEW.rank_address := NEW.rank_search;
1086         NEW.calculated_country_code := NULL;
1087       ELSEIF NEW.type in ('sea') THEN
1088         NEW.rank_search := 2;
1089         NEW.rank_address := 0;
1090         NEW.calculated_country_code := NULL;
1091       ELSEIF NEW.type in ('country') THEN
1092         NEW.rank_search := 4;
1093         NEW.rank_address := NEW.rank_search;
1094       ELSEIF NEW.type in ('state') THEN
1095         NEW.rank_search := 8;
1096         NEW.rank_address := NEW.rank_search;
1097       ELSEIF NEW.type in ('region') THEN
1098         NEW.rank_search := 18; -- dropped from previous value of 10
1099         NEW.rank_address := 0; -- So badly miss-used that better to just drop it!
1100       ELSEIF NEW.type in ('county') THEN
1101         NEW.rank_search := 12;
1102         NEW.rank_address := NEW.rank_search;
1103       ELSEIF NEW.type in ('city') THEN
1104         NEW.rank_search := 16;
1105         NEW.rank_address := NEW.rank_search;
1106       ELSEIF NEW.type in ('island') THEN
1107         NEW.rank_search := 17;
1108         NEW.rank_address := 0;
1109       ELSEIF NEW.type in ('town') THEN
1110         NEW.rank_search := 18;
1111         NEW.rank_address := 16;
1112       ELSEIF NEW.type in ('village','hamlet','municipality','district','unincorporated_area','borough') THEN
1113         NEW.rank_search := 19;
1114         NEW.rank_address := 16;
1115       ELSEIF NEW.type in ('suburb','croft','subdivision','isolated_dwelling') THEN
1116         NEW.rank_search := 20;
1117         NEW.rank_address := NEW.rank_search;
1118       ELSEIF NEW.type in ('farm','locality','islet','mountain_pass') THEN
1119         NEW.rank_search := 20;
1120         NEW.rank_address := 0;
1121         -- Irish townlands, tagged as place=locality and locality=townland
1122         IF (NEW.extratags -> 'locality') = 'townland' THEN
1123           NEW.rank_address := 20;
1124         END IF;
1125       ELSEIF NEW.type in ('neighbourhood') THEN
1126         NEW.rank_search := 22;
1127         NEW.rank_address := 22;
1128       ELSEIF NEW.type in ('house','building') THEN
1129         NEW.rank_search := 30;
1130         NEW.rank_address := NEW.rank_search;
1131       ELSEIF NEW.type in ('houses') THEN
1132         -- can't guarantee all required nodes loaded yet due to caching in osm2pgsql
1133         NEW.rank_search := 28;
1134         NEW.rank_address := 0;
1135       END IF;
1136
1137     ELSEIF NEW.class = 'boundary' THEN
1138       IF ST_GeometryType(NEW.geometry) NOT IN ('ST_Polygon','ST_MultiPolygon') THEN
1139 --        RAISE WARNING 'invalid boundary %',NEW.osm_id;
1140         return NULL;
1141       END IF;
1142       NEW.rank_search := NEW.admin_level * 2;
1143       IF NEW.type = 'administrative' THEN
1144         NEW.rank_address := NEW.rank_search;
1145       ELSE
1146         NEW.rank_address := 0;
1147       END IF;
1148     ELSEIF NEW.class = 'landuse' AND ST_GeometryType(NEW.geometry) in ('ST_Polygon','ST_MultiPolygon') THEN
1149       NEW.rank_search := 22;
1150       IF NEW.type in ('residential', 'farm', 'farmyard', 'industrial', 'commercial', 'allotments', 'retail') THEN
1151         NEW.rank_address := NEW.rank_search;
1152       ELSE
1153         NEW.rank_address := 0;
1154       END IF;
1155     ELSEIF NEW.class = 'natural' and NEW.type in ('peak','volcano','mountain_range') THEN
1156       NEW.rank_search := 18;
1157       NEW.rank_address := 0;
1158     ELSEIF NEW.class = 'natural' and NEW.type = 'sea' THEN
1159       NEW.rank_search := 4;
1160       NEW.rank_address := NEW.rank_search;
1161     ELSEIF NEW.class = 'natural' and NEW.type in ('coastline') THEN
1162       RETURN NULL;
1163     -- any feature more than 5 square miles is probably worth indexing
1164     ELSEIF ST_GeometryType(NEW.geometry) in ('ST_Polygon','ST_MultiPolygon') AND ST_Area(NEW.geometry) > 0.1 THEN
1165       NEW.rank_search := 22;
1166       NEW.rank_address := 0;
1167     ELSEIF NEW.class = 'highway' AND NEW.name is NULL AND 
1168            NEW.type in ('service','cycleway','path','footway','steps','bridleway','track','byway','motorway_link','primary_link','trunk_link','secondary_link','tertiary_link') THEN
1169 --      RAISE WARNING 'unnamed minor feature %',NEW.osm_id;
1170       RETURN NULL;
1171     ELSEIF NEW.class = 'railway' AND NEW.type in ('rail') THEN
1172       RETURN NULL;
1173     ELSEIF NEW.class = 'waterway' AND NEW.name is NULL THEN
1174       RETURN NULL;
1175     ELSEIF NEW.class = 'waterway' THEN
1176       IF NEW.osm_type = 'R' THEN
1177         NEW.rank_search := 16;
1178       ELSE
1179         NEW.rank_search := 17;
1180       END IF;
1181       NEW.rank_address := 0;
1182     ELSEIF NEW.class = 'highway' AND NEW.osm_type != 'N' AND NEW.type in ('service','cycleway','path','footway','steps','bridleway','motorway_link','primary_link','trunk_link','secondary_link','tertiary_link') THEN
1183       NEW.rank_search := 27;
1184       NEW.rank_address := NEW.rank_search;
1185     ELSEIF NEW.class = 'highway' AND NEW.osm_type != 'N' THEN
1186       NEW.rank_search := 26;
1187       NEW.rank_address := NEW.rank_search;
1188     ELSEIF NEW.class = 'mountain_pass' THEN
1189         NEW.rank_search := 20;
1190         NEW.rank_address := 0;
1191     END IF;
1192
1193   END IF;
1194
1195   IF NEW.rank_search > 30 THEN
1196     NEW.rank_search := 30;
1197   END IF;
1198
1199   IF NEW.rank_address > 30 THEN
1200     NEW.rank_address := 30;
1201   END IF;
1202
1203   IF (NEW.extratags -> 'capital') = 'yes' THEN
1204     NEW.rank_search := NEW.rank_search - 1;
1205   END IF;
1206
1207   -- a country code make no sense below rank 4 (country)
1208   IF NEW.rank_search < 4 THEN
1209     NEW.calculated_country_code := NULL;
1210   END IF;
1211
1212 -- Block import below rank 22
1213 --  IF NEW.rank_search > 22 THEN
1214 --    RETURN NULL;
1215 --  END IF;
1216
1217   --DEBUG: RAISE WARNING 'placex_insert:END: % % % %',NEW.osm_type,NEW.osm_id,NEW.class,NEW.type;
1218
1219   RETURN NEW; -- @DIFFUPDATES@ The following is not needed until doing diff updates, and slows the main index process down
1220
1221   IF NEW.rank_address > 0 THEN
1222     IF (ST_GeometryType(NEW.geometry) in ('ST_Polygon','ST_MultiPolygon') AND ST_IsValid(NEW.geometry)) THEN
1223       -- Performance: We just can't handle re-indexing for country level changes
1224       IF st_area(NEW.geometry) < 1 THEN
1225         -- mark items within the geometry for re-indexing
1226   --    RAISE WARNING 'placex poly insert: % % % %',NEW.osm_type,NEW.osm_id,NEW.class,NEW.type;
1227
1228         -- work around bug in postgis, this may have been fixed in 2.0.0 (see http://trac.osgeo.org/postgis/ticket/547)
1229         update placex set indexed_status = 2 where (st_covers(NEW.geometry, placex.geometry) OR ST_Intersects(NEW.geometry, placex.geometry)) 
1230          AND rank_search > NEW.rank_search and indexed_status = 0 and ST_geometrytype(placex.geometry) = 'ST_Point' and (rank_search < 28 or name is not null or (NEW.rank_search >= 16 and addr_place is not null));
1231         update placex set indexed_status = 2 where (st_covers(NEW.geometry, placex.geometry) OR ST_Intersects(NEW.geometry, placex.geometry)) 
1232          AND rank_search > NEW.rank_search and indexed_status = 0 and ST_geometrytype(placex.geometry) != 'ST_Point' and (rank_search < 28 or name is not null or (NEW.rank_search >= 16 and addr_place is not null));
1233       END IF;
1234     ELSE
1235       -- mark nearby items for re-indexing, where 'nearby' depends on the features rank_search and is a complete guess :(
1236       diameter := 0;
1237       -- 16 = city, anything higher than city is effectively ignored (polygon required!)
1238       IF NEW.type='postcode' THEN
1239         diameter := 0.05;
1240       ELSEIF NEW.rank_search < 16 THEN
1241         diameter := 0;
1242       ELSEIF NEW.rank_search < 18 THEN
1243         diameter := 0.1;
1244       ELSEIF NEW.rank_search < 20 THEN
1245         diameter := 0.05;
1246       ELSEIF NEW.rank_search = 21 THEN
1247         diameter := 0.001;
1248       ELSEIF NEW.rank_search < 24 THEN
1249         diameter := 0.02;
1250       ELSEIF NEW.rank_search < 26 THEN
1251         diameter := 0.002; -- 100 to 200 meters
1252       ELSEIF NEW.rank_search < 28 THEN
1253         diameter := 0.001; -- 50 to 100 meters
1254       END IF;
1255       IF diameter > 0 THEN
1256   --      RAISE WARNING 'placex point insert: % % % % %',NEW.osm_type,NEW.osm_id,NEW.class,NEW.type,diameter;
1257         IF NEW.rank_search >= 26 THEN
1258           -- roads may cause reparenting for >27 rank places
1259           update placex set indexed_status = 2 where indexed_status = 0 and rank_search > NEW.rank_search and ST_DWithin(placex.geometry, NEW.geometry, diameter);
1260         ELSEIF NEW.rank_search >= 16 THEN
1261           -- up to rank 16, street-less addresses may need reparenting
1262           update placex set indexed_status = 2 where indexed_status = 0 and rank_search > NEW.rank_search and ST_DWithin(placex.geometry, NEW.geometry, diameter) and (rank_search < 28 or name is not null or addr_place is not null);
1263         ELSE
1264           -- for all other places the search terms may change as well
1265           update placex set indexed_status = 2 where indexed_status = 0 and rank_search > NEW.rank_search and ST_DWithin(placex.geometry, NEW.geometry, diameter) and (rank_search < 28 or name is not null);
1266         END IF;
1267       END IF;
1268     END IF;
1269   END IF;
1270
1271
1272    -- add to tables for special search
1273    -- Note: won't work on initial import because the classtype tables
1274    -- do not yet exist. It won't hurt either.
1275   classtable := 'place_classtype_' || NEW.class || '_' || NEW.type;
1276   SELECT count(*)>0 FROM pg_tables WHERE tablename = classtable and schemaname = current_schema() INTO result;
1277   IF result THEN
1278     EXECUTE 'INSERT INTO ' || classtable::regclass || ' (place_id, centroid) VALUES ($1,$2)' 
1279     USING NEW.place_id, ST_Centroid(NEW.geometry);
1280   END IF;
1281
1282
1283 --  IF NEW.rank_search < 26 THEN
1284 --    RAISE WARNING 'placex insert: % % % %',NEW.osm_type,NEW.osm_id,NEW.class,NEW.type;
1285 --  END IF;
1286
1287   RETURN NEW;
1288
1289 END;
1290 $$
1291 LANGUAGE plpgsql;
1292
1293 CREATE OR REPLACE FUNCTION placex_update() RETURNS 
1294 TRIGGER
1295   AS $$
1296 DECLARE
1297
1298   place_centroid GEOMETRY;
1299
1300   search_maxdistance FLOAT[];
1301   search_mindistance FLOAT[];
1302   address_havelevel BOOLEAN[];
1303
1304   i INTEGER;
1305   iMax FLOAT;
1306   location RECORD;
1307   way RECORD;
1308   relation RECORD;
1309   relation_members TEXT[];
1310   relMember RECORD;
1311   linkedplacex RECORD;
1312   search_diameter FLOAT;
1313   search_prevdiameter FLOAT;
1314   search_maxrank INTEGER;
1315   address_maxrank INTEGER;
1316   address_street_word_id INTEGER;
1317   address_street_word_ids INTEGER[];
1318   parent_place_id_rank BIGINT;
1319   
1320   isin TEXT[];
1321   isin_tokens INT[];
1322
1323   location_rank_search INTEGER;
1324   location_distance FLOAT;
1325   location_parent GEOMETRY;
1326   location_isaddress BOOLEAN;
1327   location_keywords INTEGER[];
1328
1329   tagpairid INTEGER;
1330
1331   default_language TEXT;
1332   name_vector INTEGER[];
1333   nameaddress_vector INTEGER[];
1334
1335   linked_node_id BIGINT;
1336
1337   result BOOLEAN;
1338 BEGIN
1339
1340   -- deferred delete
1341   IF OLD.indexed_status = 100 THEN
1342     --DEBUG: RAISE WARNING 'placex_update_delete % %',NEW.osm_type,NEW.osm_id;
1343     delete from placex where place_id = OLD.place_id;
1344     RETURN NULL;
1345   END IF;
1346
1347   IF NEW.indexed_status != 0 OR OLD.indexed_status = 0 THEN
1348     RETURN NEW;
1349   END IF;
1350
1351   -- ignore interpolated addresses
1352   IF NEW.class = 'place' and NEW.type = 'address' THEN
1353     RETURN NEW;
1354   END IF;
1355
1356   --DEBUG: RAISE WARNING 'placex_update % %',NEW.osm_type,NEW.osm_id;
1357
1358 --RAISE WARNING '%',NEW.place_id;
1359 --RAISE WARNING '%', NEW;
1360
1361   IF NEW.class = 'place' AND NEW.type = 'postcodearea' THEN
1362     -- Silently do nothing
1363     RETURN NEW;
1364   END IF;
1365
1366   -- TODO: this test is now redundant?
1367   IF OLD.indexed_status != 0 THEN
1368
1369     NEW.indexed_date = now();
1370
1371     result := deleteSearchName(NEW.partition, NEW.place_id);
1372     DELETE FROM place_addressline WHERE place_id = NEW.place_id;
1373     result := deleteRoad(NEW.partition, NEW.place_id);
1374     result := deleteLocationArea(NEW.partition, NEW.place_id, NEW.rank_search);
1375     UPDATE placex set linked_place_id = null where linked_place_id = NEW.place_id;
1376
1377     IF NEW.linked_place_id is not null THEN
1378       RETURN NEW;
1379     END IF;
1380
1381     -- Speed up searches - just use the centroid of the feature
1382     -- cheaper but less acurate
1383     place_centroid := ST_PointOnSurface(NEW.geometry);
1384     NEW.centroid := null;
1385
1386     -- recalculate country and partition
1387     IF NEW.rank_search = 4 THEN
1388       -- for countries, believe the mapped country code,
1389       -- so that we remain in the right partition if the boundaries
1390       -- suddenly expand.
1391       NEW.partition := get_partition(lower(NEW.country_code));
1392       IF NEW.partition = 0 THEN
1393         NEW.calculated_country_code := lower(get_country_code(place_centroid));
1394         NEW.partition := get_partition(NEW.calculated_country_code);
1395       ELSE
1396         NEW.calculated_country_code := lower(NEW.country_code);
1397       END IF;
1398     ELSE
1399       IF NEW.rank_search > 4 THEN
1400         --NEW.calculated_country_code := lower(get_country_code(NEW.geometry, NEW.country_code));
1401         NEW.calculated_country_code := lower(get_country_code(place_centroid));
1402       ELSE
1403         NEW.calculated_country_code := NULL;
1404       END IF;
1405       NEW.partition := get_partition(NEW.calculated_country_code);
1406     END IF;
1407     NEW.geometry_sector := geometry_sector(NEW.partition, place_centroid);
1408
1409     -- interpolations
1410     IF NEW.class = 'place' AND NEW.type = 'houses'THEN
1411       IF NEW.osm_type = 'W' and ST_GeometryType(NEW.geometry) = 'ST_LineString' THEN
1412         NEW.parent_place_id := get_interpolation_parent(NEW.osm_id, NEW.street, NEW.addr_place,
1413                                                         NEW.partition, place_centroid, NEW.geometry);
1414         i := create_interpolation(NEW.osm_id, NEW.housenumber, NEW.parent_place_id,
1415                                   NEW.partition, NEW.calculated_country_code,
1416                                   NEW.geometry_sector, NEW.postcode, NEW.geometry);
1417       END IF;
1418       RETURN NEW;
1419     END IF;
1420
1421     -- waterway ways are linked when they are part of a relation and have the same class/type
1422     IF NEW.osm_type = 'R' and NEW.class = 'waterway' THEN
1423         FOR relation_members IN select members from planet_osm_rels r where r.id = NEW.osm_id and r.parts != array[]::bigint[]
1424         LOOP
1425             FOR i IN 1..array_upper(relation_members, 1) BY 2 LOOP
1426                 IF relation_members[i+1] in ('', 'main_stream', 'side_stream') AND substring(relation_members[i],1,1) = 'w' THEN
1427                   --DEBUG: RAISE WARNING 'waterway parent %, child %/%', NEW.osm_id, i, relation.members[i];
1428                   FOR linked_node_id IN SELECT place_id FROM placex
1429                     WHERE osm_type = 'W' and osm_id = substring(relation_members[i],2,200)::bigint
1430                     and class = NEW.class and type = NEW.type
1431                     and ( relation_members[i+1] != 'side_stream' or NEW.name->'name' = name->'name')
1432                   LOOP
1433                     UPDATE placex SET linked_place_id = NEW.place_id WHERE place_id = linked_node_id;
1434                   END LOOP;
1435                 END IF;
1436             END LOOP;
1437         END LOOP;
1438     END IF;
1439
1440     -- Adding ourselves to the list simplifies address calculations later
1441     INSERT INTO place_addressline VALUES (NEW.place_id, NEW.place_id, true, true, 0, NEW.rank_address); 
1442
1443     -- What level are we searching from
1444     search_maxrank := NEW.rank_search;
1445
1446     -- Thought this wasn't needed but when we add new languages to the country_name table
1447     -- we need to update the existing names
1448     IF NEW.name is not null AND array_upper(akeys(NEW.name),1) > 1 THEN
1449       default_language := get_country_language_code(NEW.calculated_country_code);
1450       IF default_language IS NOT NULL THEN
1451         IF NEW.name ? 'name' AND NOT NEW.name ? ('name:'||default_language) THEN
1452           NEW.name := NEW.name || hstore(('name:'||default_language), (NEW.name -> 'name'));
1453         ELSEIF NEW.name ? ('name:'||default_language) AND NOT NEW.name ? 'name' THEN
1454           NEW.name := NEW.name || hstore('name', (NEW.name -> ('name:'||default_language)));
1455         END IF;
1456       END IF;
1457     END IF;
1458
1459     -- Initialise the name vector using our name
1460     name_vector := make_keywords(NEW.name);
1461     nameaddress_vector := '{}'::int[];
1462
1463     -- some tag combinations add a special id for search
1464     tagpairid := get_tagpair(NEW.class,NEW.type);
1465     IF tagpairid IS NOT NULL THEN
1466       name_vector := name_vector + tagpairid;
1467     END IF;
1468
1469     FOR i IN 1..28 LOOP
1470       address_havelevel[i] := false;
1471     END LOOP;
1472
1473     NEW.importance := null;
1474     select language||':'||title,importance from get_wikipedia_match(NEW.extratags, NEW.calculated_country_code) INTO NEW.wikipedia,NEW.importance;
1475     IF NEW.importance IS NULL THEN
1476       select language||':'||title,importance from wikipedia_article where osm_type = NEW.osm_type and osm_id = NEW.osm_id order by importance desc limit 1 INTO NEW.wikipedia,NEW.importance;
1477     END IF;
1478
1479 --RAISE WARNING 'before low level% %', NEW.place_id, NEW.rank_search;
1480
1481     -- For low level elements we inherit from our parent road
1482     IF (NEW.rank_search > 27 OR (NEW.type = 'postcode' AND NEW.rank_search = 25)) THEN
1483
1484 --RAISE WARNING 'finding street for %', NEW;
1485
1486       -- We won't get a better centroid, besides these places are too small to care
1487       NEW.centroid := place_centroid;
1488
1489       NEW.parent_place_id := null;
1490
1491       -- if we have a POI and there is no address information,
1492       -- see if we can get it from a surrounding building
1493       IF NEW.osm_type = 'N' AND NEW.street IS NULL AND NEW.addr_place IS NULL
1494          AND NEW.housenumber IS NULL THEN
1495         FOR location IN select * from placex where ST_Covers(geometry, place_centroid)
1496               and (housenumber is not null or street is not null or addr_place is not null)
1497               and rank_search > 28 AND ST_GeometryType(geometry) in ('ST_Polygon','ST_MultiPolygon')
1498               limit 1
1499         LOOP
1500           NEW.housenumber := location.housenumber;
1501           NEW.street := location.street;
1502           NEW.addr_place := location.addr_place;
1503         END LOOP;
1504       END IF;
1505
1506       -- We have to find our parent road.
1507       -- Copy data from linked items (points on ways, addr:street links, relations)
1508
1509       -- Is this object part of a relation?
1510         FOR relation IN select * from planet_osm_rels where parts @> ARRAY[NEW.osm_id] and members @> ARRAY[lower(NEW.osm_type)||NEW.osm_id]
1511         LOOP
1512           -- At the moment we only process one type of relation - associatedStreet
1513           IF relation.tags @> ARRAY['associatedStreet'] THEN
1514             FOR i IN 1..array_upper(relation.members, 1) BY 2 LOOP
1515               IF NEW.parent_place_id IS NULL AND relation.members[i+1] = 'street' THEN
1516 --RAISE WARNING 'node in relation %',relation;
1517                 SELECT place_id from placex where osm_type = 'W'
1518                   and osm_id = substring(relation.members[i],2,200)::bigint
1519                   and rank_search = 26 and name is not null INTO NEW.parent_place_id;
1520               END IF;
1521             END LOOP;
1522           END IF;
1523         END LOOP;
1524
1525
1526       -- Note that addr:street links can only be indexed once the street itself is indexed
1527        IF NEW.parent_place_id IS NULL AND NEW.street IS NOT NULL THEN
1528         address_street_word_ids := get_name_ids(make_standard_name(NEW.street));
1529         IF address_street_word_ids IS NOT NULL THEN
1530           FOR location IN SELECT * from getNearestNamedRoadFeature(NEW.partition, place_centroid, address_street_word_ids) LOOP
1531               NEW.parent_place_id := location.place_id;
1532           END LOOP;
1533         END IF;
1534       END IF;
1535
1536       IF NEW.parent_place_id IS NULL AND NEW.addr_place IS NOT NULL THEN
1537         address_street_word_ids := get_name_ids(make_standard_name(NEW.addr_place));
1538         IF address_street_word_ids IS NOT NULL THEN
1539           FOR location IN SELECT * from getNearestNamedPlaceFeature(NEW.partition, place_centroid, address_street_word_ids) LOOP
1540             NEW.parent_place_id := location.place_id;
1541           END LOOP;
1542         END IF;
1543       END IF;
1544
1545       IF NEW.parent_place_id IS NULL AND NEW.osm_type = 'N' THEN
1546
1547 --RAISE WARNING 'x1';
1548         -- Is this node part of a way?
1549         FOR location IN select p.* from placex p, planet_osm_ways w
1550            where p.osm_type = 'W' and p.rank_search >= 26
1551              and p.geometry && NEW.geometry and p.osm_id = w.id and NEW.osm_id = any(w.nodes)
1552         LOOP
1553 --RAISE WARNING '%', location;
1554           -- Way IS a road then we are on it - that must be our road
1555           IF location.rank_search = 26 AND NEW.parent_place_id IS NULL THEN
1556 --RAISE WARNING 'node in way that is a street %',location;
1557             NEW.parent_place_id := location.place_id;
1558           END IF;
1559
1560           -- If this way is a street interpolation line then it is probably as good as we are going to get
1561           IF NEW.parent_place_id IS NULL AND location.class = 'place' and location.type='houses' THEN
1562             NEW.parent_place_id := location.parent_place_id;
1563           END IF;
1564
1565           -- Is the WAY part of a relation
1566           IF NEW.parent_place_id IS NULL THEN
1567               FOR relation IN select * from planet_osm_rels where parts @> ARRAY[location.osm_id] and members @> ARRAY['w'||location.osm_id]
1568               LOOP
1569                 -- At the moment we only process one type of relation - associatedStreet
1570                 IF relation.tags @> ARRAY['associatedStreet'] AND array_upper(relation.members, 1) IS NOT NULL THEN
1571                   FOR i IN 1..array_upper(relation.members, 1) BY 2 LOOP
1572                     IF NEW.parent_place_id IS NULL AND relation.members[i+1] = 'street' THEN
1573     --RAISE WARNING 'node in way that is in a relation %',relation;
1574                       SELECT place_id from placex where osm_type='W' and osm_id = substring(relation.members[i],2,200)::bigint 
1575                         and rank_search = 26 and name is not null INTO NEW.parent_place_id;
1576                     END IF;
1577                   END LOOP;
1578                 END IF;
1579               END LOOP;
1580           END IF;
1581
1582           -- If the way mentions a street or place address, try that for parenting.
1583           IF NEW.parent_place_id IS NULL AND location.street IS NOT NULL THEN
1584             address_street_word_ids := get_name_ids(make_standard_name(location.street));
1585             IF address_street_word_ids IS NOT NULL THEN
1586               FOR linkedplacex IN SELECT place_id from getNearestNamedRoadFeature(NEW.partition, place_centroid, address_street_word_ids) LOOP
1587                   NEW.parent_place_id := linkedplacex.place_id;
1588               END LOOP;
1589             END IF;
1590           END IF;
1591
1592           IF NEW.parent_place_id IS NULL AND location.addr_place IS NOT NULL THEN
1593             address_street_word_ids := get_name_ids(make_standard_name(location.addr_place));
1594             IF address_street_word_ids IS NOT NULL THEN
1595               FOR linkedplacex IN SELECT place_id from getNearestNamedPlaceFeature(NEW.partition, place_centroid, address_street_word_ids) LOOP
1596                 NEW.parent_place_id := linkedplacex.place_id;
1597               END LOOP;
1598             END IF;
1599           END IF;
1600
1601         END LOOP;
1602
1603       END IF;
1604
1605 --RAISE WARNING 'x4 %',NEW.parent_place_id;
1606       -- Still nothing, just use the nearest road
1607       IF NEW.parent_place_id IS NULL THEN
1608         FOR location IN SELECT place_id FROM getNearestRoadFeature(NEW.partition, place_centroid) LOOP
1609           NEW.parent_place_id := location.place_id;
1610         END LOOP;
1611       END IF;
1612
1613 --return NEW;
1614 --RAISE WARNING 'x6 %',NEW.parent_place_id;
1615
1616       -- If we didn't find any road fallback to standard method
1617       IF NEW.parent_place_id IS NOT NULL THEN
1618
1619         -- Add the street to the address as zero distance to force to front of list
1620 --        INSERT INTO place_addressline VALUES (NEW.place_id, NEW.parent_place_id, true, true, 0, 26);
1621         address_havelevel[26] := true;
1622
1623         -- Import address details from parent, reclculating distance in process
1624 --        INSERT INTO place_addressline select NEW.place_id, x.address_place_id, x.fromarea, x.isaddress, ST_distance(NEW.geometry, placex.geometry), placex.rank_address
1625 --          from place_addressline as x join placex on (address_place_id = placex.place_id)
1626 --          where x.place_id = NEW.parent_place_id and x.address_place_id != NEW.parent_place_id;
1627
1628         -- Get the details of the parent road
1629         select * from search_name where place_id = NEW.parent_place_id INTO location;
1630         NEW.calculated_country_code := location.country_code;
1631
1632 --RAISE WARNING '%', NEW.name;
1633         -- If there is no name it isn't searchable, don't bother to create a search record
1634         IF NEW.name is NULL THEN
1635           return NEW;
1636         END IF;
1637
1638         -- Merge address from parent
1639         nameaddress_vector := array_merge(nameaddress_vector, location.nameaddress_vector);
1640         nameaddress_vector := array_merge(nameaddress_vector, location.name_vector);
1641 --return NEW;
1642         -- Performance, it would be more acurate to do all the rest of the import process but it takes too long
1643         -- Just be happy with inheriting from parent road only
1644
1645         IF NEW.rank_search <= 25 and NEW.rank_address > 0 THEN
1646           result := add_location(NEW.place_id, NEW.calculated_country_code, NEW.partition, name_vector, NEW.rank_search, NEW.rank_address, NEW.geometry);
1647         END IF;
1648
1649         result := insertSearchName(NEW.partition, NEW.place_id, NEW.calculated_country_code, name_vector, nameaddress_vector, NEW.rank_search, NEW.rank_address, NEW.importance, place_centroid, NEW.geometry);
1650
1651         return NEW;
1652       END IF;
1653
1654     END IF;
1655
1656 -- RAISE WARNING '  INDEXING Started:';
1657 -- RAISE WARNING '  INDEXING: %',NEW;
1658
1659     IF NEW.osm_type = 'R' AND NEW.rank_search < 26 THEN
1660
1661       -- see if we have any special relation members
1662       select members from planet_osm_rels where id = NEW.osm_id INTO relation_members;
1663
1664 -- RAISE WARNING 'get_osm_rel_members, label';
1665       IF relation_members IS NOT NULL THEN
1666         FOR relMember IN select get_osm_rel_members(relation_members,ARRAY['label']) as member LOOP
1667
1668           FOR linkedPlacex IN select * from placex where osm_type = upper(substring(relMember.member,1,1))::char(1) 
1669             and osm_id = substring(relMember.member,2,10000)::bigint order by rank_search desc limit 1 LOOP
1670
1671             -- If we don't already have one use this as the centre point of the geometry
1672             IF NEW.centroid IS NULL THEN
1673               NEW.centroid := coalesce(linkedPlacex.centroid,st_centroid(linkedPlacex.geometry));
1674             END IF;
1675
1676             -- merge in the label name, re-init word vector
1677             IF NOT linkedPlacex.name IS NULL THEN
1678               NEW.name := linkedPlacex.name || NEW.name;
1679               name_vector := array_merge(name_vector, make_keywords(linkedPlacex.name));
1680             END IF;
1681
1682             -- merge in extra tags
1683             NEW.extratags := hstore(linkedPlacex.class, linkedPlacex.type) || coalesce(linkedPlacex.extratags, ''::hstore) || coalesce(NEW.extratags, ''::hstore);
1684
1685             -- mark the linked place (excludes from search results)
1686             UPDATE placex set linked_place_id = NEW.place_id where place_id = linkedPlacex.place_id;
1687
1688             -- keep a note of the node id in case we need it for wikipedia in a bit
1689             linked_node_id := linkedPlacex.osm_id;
1690           END LOOP;
1691
1692         END LOOP;
1693
1694         IF NEW.centroid IS NULL THEN
1695
1696           FOR relMember IN select get_osm_rel_members(relation_members,ARRAY['admin_center','admin_centre']) as member LOOP
1697
1698             FOR linkedPlacex IN select * from placex where osm_type = upper(substring(relMember.member,1,1))::char(1) 
1699               and osm_id = substring(relMember.member,2,10000)::bigint order by rank_search desc limit 1 LOOP
1700
1701               -- For an admin centre we also want a name match - still not perfect, for example 'new york, new york'
1702               -- But that can be fixed by explicitly setting the label in the data
1703               IF make_standard_name(NEW.name->'name') = make_standard_name(linkedPlacex.name->'name') 
1704                 AND NEW.rank_address = linkedPlacex.rank_address THEN
1705
1706                 -- If we don't already have one use this as the centre point of the geometry
1707                 IF NEW.centroid IS NULL THEN
1708                   NEW.centroid := coalesce(linkedPlacex.centroid,st_centroid(linkedPlacex.geometry));
1709                 END IF;
1710
1711                 -- merge in the name, re-init word vector
1712                 IF NOT linkedPlacex.name IS NULL THEN
1713                   NEW.name := linkedPlacex.name || NEW.name;
1714                   name_vector := make_keywords(NEW.name);
1715                 END IF;
1716
1717                 -- merge in extra tags
1718                 NEW.extratags := hstore(linkedPlacex.class, linkedPlacex.type) || coalesce(linkedPlacex.extratags, ''::hstore) || coalesce(NEW.extratags, ''::hstore);
1719
1720                 -- mark the linked place (excludes from search results)
1721                 UPDATE placex set linked_place_id = NEW.place_id where place_id = linkedPlacex.place_id;
1722
1723                 -- keep a note of the node id in case we need it for wikipedia in a bit
1724                 linked_node_id := linkedPlacex.osm_id;
1725               END IF;
1726
1727             END LOOP;
1728
1729           END LOOP;
1730
1731         END IF;
1732       END IF;
1733
1734     END IF;
1735
1736     -- Name searches can be done for ways as well as relations
1737     IF NEW.osm_type in ('W','R') AND NEW.rank_search < 26 AND NEW.rank_address > 0 THEN
1738
1739       -- not found one yet? how about doing a name search
1740       IF NEW.centroid IS NULL AND (NEW.name->'name') is not null and make_standard_name(NEW.name->'name') != '' THEN
1741
1742         FOR linkedPlacex IN select placex.* from placex WHERE
1743           make_standard_name(name->'name') = make_standard_name(NEW.name->'name')
1744           AND placex.rank_address = NEW.rank_address
1745           AND placex.place_id != NEW.place_id
1746           AND placex.osm_type = 'N'::char(1) AND placex.rank_search < 26
1747           AND st_covers(NEW.geometry, placex.geometry)
1748         LOOP
1749
1750           -- If we don't already have one use this as the centre point of the geometry
1751           IF NEW.centroid IS NULL THEN
1752             NEW.centroid := coalesce(linkedPlacex.centroid,st_centroid(linkedPlacex.geometry));
1753           END IF;
1754
1755           -- merge in the name, re-init word vector
1756           NEW.name := linkedPlacex.name || NEW.name;
1757           name_vector := make_keywords(NEW.name);
1758
1759           -- merge in extra tags
1760           NEW.extratags := hstore(linkedPlacex.class, linkedPlacex.type) || coalesce(linkedPlacex.extratags, ''::hstore) || coalesce(NEW.extratags, ''::hstore);
1761
1762           -- mark the linked place (excludes from search results)
1763           UPDATE placex set linked_place_id = NEW.place_id where place_id = linkedPlacex.place_id;
1764
1765           -- keep a note of the node id in case we need it for wikipedia in a bit
1766           linked_node_id := linkedPlacex.osm_id;
1767         END LOOP;
1768       END IF;
1769
1770       IF NEW.centroid IS NOT NULL THEN
1771         place_centroid := NEW.centroid;
1772         -- Place might have had only a name tag before but has now received translations
1773         -- from the linked place. Make sure a name tag for the default language exists in
1774         -- this case. 
1775         IF NEW.name is not null AND array_upper(akeys(NEW.name),1) > 1 THEN
1776           default_language := get_country_language_code(NEW.calculated_country_code);
1777           IF default_language IS NOT NULL THEN
1778             IF NEW.name ? 'name' AND NOT NEW.name ? ('name:'||default_language) THEN
1779               NEW.name := NEW.name || hstore(('name:'||default_language), (NEW.name -> 'name'));
1780             ELSEIF NEW.name ? ('name:'||default_language) AND NOT NEW.name ? 'name' THEN
1781               NEW.name := NEW.name || hstore('name', (NEW.name -> ('name:'||default_language)));
1782             END IF;
1783           END IF;
1784         END IF;
1785       END IF;
1786
1787       -- Did we gain a wikipedia tag in the process? then we need to recalculate our importance
1788       IF NEW.importance is null THEN
1789         select language||':'||title,importance from get_wikipedia_match(NEW.extratags, NEW.calculated_country_code) INTO NEW.wikipedia,NEW.importance;
1790       END IF;
1791       -- Still null? how about looking it up by the node id
1792       IF NEW.importance IS NULL THEN
1793         select language||':'||title,importance from wikipedia_article where osm_type = 'N'::char(1) and osm_id = linked_node_id order by importance desc limit 1 INTO NEW.wikipedia,NEW.importance;
1794       END IF;
1795
1796     END IF;
1797
1798     -- make sure all names are in the word table
1799     IF NEW.admin_level = 2 AND NEW.class = 'boundary' AND NEW.type = 'administrative' AND NEW.country_code IS NOT NULL THEN
1800       perform create_country(NEW.name, lower(NEW.country_code));
1801     END IF;
1802
1803     NEW.parent_place_id = 0;
1804     parent_place_id_rank = 0;
1805
1806     -- convert isin to array of tokenids
1807     isin_tokens := '{}'::int[];
1808     IF NEW.isin IS NOT NULL THEN
1809       isin := regexp_split_to_array(NEW.isin, E'[;,]');
1810       IF array_upper(isin, 1) IS NOT NULL THEN
1811         FOR i IN 1..array_upper(isin, 1) LOOP
1812           address_street_word_id := get_name_id(make_standard_name(isin[i]));
1813           IF address_street_word_id IS NOT NULL AND NOT(ARRAY[address_street_word_id] <@ isin_tokens) THEN
1814             nameaddress_vector := array_merge(nameaddress_vector, ARRAY[address_street_word_id]);
1815             isin_tokens := isin_tokens || address_street_word_id;
1816           END IF;
1817
1818           -- merge word into address vector
1819           address_street_word_id := get_word_id(make_standard_name(isin[i]));
1820           IF address_street_word_id IS NOT NULL THEN
1821             nameaddress_vector := array_merge(nameaddress_vector, ARRAY[address_street_word_id]);
1822           END IF;
1823         END LOOP;
1824       END IF;
1825     END IF;
1826     IF NEW.postcode IS NOT NULL THEN
1827       isin := regexp_split_to_array(NEW.postcode, E'[;,]');
1828       IF array_upper(isin, 1) IS NOT NULL THEN
1829         FOR i IN 1..array_upper(isin, 1) LOOP
1830           address_street_word_id := get_name_id(make_standard_name(isin[i]));
1831           IF address_street_word_id IS NOT NULL AND NOT(ARRAY[address_street_word_id] <@ isin_tokens) THEN
1832             nameaddress_vector := array_merge(nameaddress_vector, ARRAY[address_street_word_id]);
1833             isin_tokens := isin_tokens || address_street_word_id;
1834           END IF;
1835
1836           -- merge into address vector
1837           address_street_word_id := get_word_id(make_standard_name(isin[i]));
1838           IF address_street_word_id IS NOT NULL THEN
1839             nameaddress_vector := array_merge(nameaddress_vector, ARRAY[address_street_word_id]);
1840           END IF;
1841         END LOOP;
1842       END IF;
1843     END IF;
1844
1845     -- for the USA we have an additional address table.  Merge in zip codes from there too
1846     IF NEW.rank_search = 26 AND NEW.calculated_country_code = 'us' THEN
1847       FOR location IN SELECT distinct postcode from location_property_tiger where parent_place_id = NEW.place_id LOOP
1848         address_street_word_id := get_name_id(make_standard_name(location.postcode));
1849         nameaddress_vector := array_merge(nameaddress_vector, ARRAY[address_street_word_id]);
1850         isin_tokens := isin_tokens || address_street_word_id;
1851
1852         -- also merge in the single word version
1853         address_street_word_id := get_word_id(make_standard_name(location.postcode));
1854         nameaddress_vector := array_merge(nameaddress_vector, ARRAY[address_street_word_id]);
1855       END LOOP;
1856     END IF;
1857
1858 -- RAISE WARNING 'ISIN: %', isin_tokens;
1859
1860     -- Process area matches
1861     location_rank_search := 0;
1862     location_distance := 0;
1863     location_parent := NULL;
1864     -- added ourself as address already
1865     address_havelevel[NEW.rank_address] := true;
1866     -- RAISE WARNING '  getNearFeatures(%,''%'',%,''%'')',NEW.partition, place_centroid, search_maxrank, isin_tokens;
1867     FOR location IN SELECT * from getNearFeatures(NEW.partition, place_centroid, search_maxrank, isin_tokens) LOOP
1868
1869 --RAISE WARNING '  AREA: %',location;
1870
1871       IF location.rank_address != location_rank_search THEN
1872         location_rank_search := location.rank_address;
1873         IF location.isguess THEN
1874           location_distance := location.distance * 1.5;
1875         ELSE
1876           IF location.rank_address <= 12 THEN
1877             -- for county and above, if we have an area consider that exact
1878             -- (It would be nice to relax the constraint for places close to
1879             --  the boundary but we'd need the exact geometry for that. Too
1880             --  expensive.)
1881             location_distance = 0;
1882           ELSE
1883             -- Below county level remain slightly fuzzy.
1884             location_distance := location.distance * 0.5;
1885           END IF;
1886         END IF;
1887       ELSE
1888         CONTINUE WHEN location.keywords <@ location_keywords;
1889       END IF;
1890
1891       IF location.distance < location_distance OR NOT location.isguess THEN
1892         location_keywords := location.keywords;
1893
1894         location_isaddress := NOT address_havelevel[location.rank_address];
1895         IF location_isaddress AND location.isguess AND location_parent IS NOT NULL THEN
1896             location_isaddress := ST_Contains(location_parent,location.centroid);
1897         END IF;
1898
1899         -- RAISE WARNING '% isaddress: %', location.place_id, location_isaddress;
1900         -- Add it to the list of search terms
1901         IF location.rank_search > 4 THEN
1902             nameaddress_vector := array_merge(nameaddress_vector, location.keywords::integer[]);
1903         END IF;
1904         INSERT INTO place_addressline VALUES (NEW.place_id, location.place_id, true, location_isaddress, location.distance, location.rank_address);
1905
1906         IF location_isaddress THEN
1907
1908           address_havelevel[location.rank_address] := true;
1909           IF NOT location.isguess THEN
1910             SELECT geometry FROM placex WHERE place_id = location.place_id INTO location_parent;
1911           END IF;
1912
1913           IF location.rank_address > parent_place_id_rank THEN
1914             NEW.parent_place_id = location.place_id;
1915             parent_place_id_rank = location.rank_address;
1916           END IF;
1917
1918         END IF;
1919
1920 --RAISE WARNING '  Terms: (%) %',location, nameaddress_vector;
1921
1922       END IF;
1923
1924     END LOOP;
1925
1926     -- try using the isin value to find parent places
1927     IF array_upper(isin_tokens, 1) IS NOT NULL THEN
1928       FOR i IN 1..array_upper(isin_tokens, 1) LOOP
1929 --RAISE WARNING '  getNearestNamedFeature: % % % %',NEW.partition, place_centroid, search_maxrank, isin_tokens[i];
1930         IF NOT ARRAY[isin_tokens[i]] <@ nameaddress_vector THEN
1931
1932           FOR location IN SELECT * from getNearestNamedFeature(NEW.partition, place_centroid, search_maxrank, isin_tokens[i]) LOOP
1933
1934   --RAISE WARNING '  ISIN: %',location;
1935
1936             IF location.rank_search > 4 THEN
1937                 nameaddress_vector := array_merge(nameaddress_vector, location.keywords::integer[]);
1938                 INSERT INTO place_addressline VALUES (NEW.place_id, location.place_id, false, NOT address_havelevel[location.rank_address], location.distance, location.rank_address);
1939                 address_havelevel[location.rank_address] := true;
1940
1941                 IF location.rank_address > parent_place_id_rank THEN
1942                   NEW.parent_place_id = location.place_id;
1943                   parent_place_id_rank = location.rank_address;
1944                 END IF;
1945             END IF;
1946           END LOOP;
1947
1948         END IF;
1949
1950       END LOOP;
1951     END IF;
1952
1953     -- for long ways we should add search terms for the entire length
1954     IF st_length(NEW.geometry) > 0.05 THEN
1955
1956       location_rank_search := 0;
1957       location_distance := 0;
1958
1959       FOR location IN SELECT * from getNearFeatures(NEW.partition, NEW.geometry, search_maxrank, isin_tokens) LOOP
1960
1961         IF location.rank_address != location_rank_search THEN
1962           location_rank_search := location.rank_address;
1963           location_distance := location.distance * 1.5;
1964         END IF;
1965
1966         IF location.rank_search > 4 AND location.distance < location_distance THEN
1967
1968           -- Add it to the list of search terms
1969           nameaddress_vector := array_merge(nameaddress_vector, location.keywords::integer[]);
1970           INSERT INTO place_addressline VALUES (NEW.place_id, location.place_id, true, false, location.distance, location.rank_address); 
1971
1972         END IF;
1973
1974       END LOOP;
1975
1976     END IF;
1977
1978     -- if we have a name add this to the name search table
1979     IF NEW.name IS NOT NULL THEN
1980
1981       IF NEW.rank_search <= 25 and NEW.rank_address > 0 THEN
1982         result := add_location(NEW.place_id, NEW.calculated_country_code, NEW.partition, name_vector, NEW.rank_search, NEW.rank_address, NEW.geometry);
1983       END IF;
1984
1985       IF NEW.rank_search between 26 and 27 and NEW.class = 'highway' THEN
1986         result := insertLocationRoad(NEW.partition, NEW.place_id, NEW.calculated_country_code, NEW.geometry);
1987       END IF;
1988
1989       result := insertSearchName(NEW.partition, NEW.place_id, NEW.calculated_country_code, name_vector, nameaddress_vector, NEW.rank_search, NEW.rank_address, NEW.importance, place_centroid, NEW.geometry);
1990
1991     END IF;
1992
1993     -- If we've not managed to pick up a better one - default centroid
1994     IF NEW.centroid IS NULL THEN
1995       NEW.centroid := place_centroid;
1996     END IF;
1997
1998   END IF;
1999
2000   RETURN NEW;
2001 END;
2002 $$
2003 LANGUAGE plpgsql;
2004
2005 CREATE OR REPLACE FUNCTION placex_delete() RETURNS TRIGGER
2006   AS $$
2007 DECLARE
2008   b BOOLEAN;
2009   classtable TEXT;
2010 BEGIN
2011   -- RAISE WARNING 'placex_delete % %',OLD.osm_type,OLD.osm_id;
2012
2013   update placex set linked_place_id = null, indexed_status = 2 where linked_place_id = OLD.place_id and indexed_status = 0;
2014   --DEBUG: RAISE WARNING 'placex_delete:01 % %',OLD.osm_type,OLD.osm_id;
2015   update placex set linked_place_id = null where linked_place_id = OLD.place_id;
2016   --DEBUG: RAISE WARNING 'placex_delete:02 % %',OLD.osm_type,OLD.osm_id;
2017
2018   IF OLD.rank_address < 30 THEN
2019
2020     -- mark everything linked to this place for re-indexing
2021     --DEBUG: RAISE WARNING 'placex_delete:03 % %',OLD.osm_type,OLD.osm_id;
2022     UPDATE placex set indexed_status = 2 from place_addressline where address_place_id = OLD.place_id 
2023       and placex.place_id = place_addressline.place_id and indexed_status = 0 and place_addressline.isaddress;
2024
2025     --DEBUG: RAISE WARNING 'placex_delete:04 % %',OLD.osm_type,OLD.osm_id;
2026     DELETE FROM place_addressline where address_place_id = OLD.place_id;
2027
2028     --DEBUG: RAISE WARNING 'placex_delete:05 % %',OLD.osm_type,OLD.osm_id;
2029     b := deleteRoad(OLD.partition, OLD.place_id);
2030
2031     --DEBUG: RAISE WARNING 'placex_delete:06 % %',OLD.osm_type,OLD.osm_id;
2032     update placex set indexed_status = 2 where parent_place_id = OLD.place_id and indexed_status = 0;
2033     --DEBUG: RAISE WARNING 'placex_delete:07 % %',OLD.osm_type,OLD.osm_id;
2034
2035   END IF;
2036
2037   --DEBUG: RAISE WARNING 'placex_delete:08 % %',OLD.osm_type,OLD.osm_id;
2038
2039   IF OLD.rank_address < 26 THEN
2040     b := deleteLocationArea(OLD.partition, OLD.place_id, OLD.rank_search);
2041   END IF;
2042
2043   --DEBUG: RAISE WARNING 'placex_delete:09 % %',OLD.osm_type,OLD.osm_id;
2044
2045   IF OLD.name is not null THEN
2046     b := deleteSearchName(OLD.partition, OLD.place_id);
2047   END IF;
2048
2049   --DEBUG: RAISE WARNING 'placex_delete:10 % %',OLD.osm_type,OLD.osm_id;
2050
2051   DELETE FROM place_addressline where place_id = OLD.place_id;
2052
2053   --DEBUG: RAISE WARNING 'placex_delete:11 % %',OLD.osm_type,OLD.osm_id;
2054
2055   -- remove from tables for special search
2056   classtable := 'place_classtype_' || OLD.class || '_' || OLD.type;
2057   SELECT count(*)>0 FROM pg_tables WHERE tablename = classtable and schemaname = current_schema() INTO b;
2058   IF b THEN
2059     EXECUTE 'DELETE FROM ' || classtable::regclass || ' WHERE place_id = $1' USING OLD.place_id;
2060   END IF;
2061
2062   --DEBUG: RAISE WARNING 'placex_delete:12 % %',OLD.osm_type,OLD.osm_id;
2063
2064   RETURN OLD;
2065
2066 END;
2067 $$
2068 LANGUAGE plpgsql;
2069
2070 CREATE OR REPLACE FUNCTION place_delete() RETURNS TRIGGER
2071   AS $$
2072 DECLARE
2073   has_rank BOOLEAN;
2074 BEGIN
2075
2076   --DEBUG: RAISE WARNING 'delete: % % % %',OLD.osm_type,OLD.osm_id,OLD.class,OLD.type;
2077
2078   -- deleting large polygons can have a massive effect on the system - require manual intervention to let them through
2079   IF st_area(OLD.geometry) > 2 and st_isvalid(OLD.geometry) THEN
2080     SELECT bool_or(not (rank_address = 0 or rank_address > 26)) as ranked FROM placex WHERE osm_type = OLD.osm_type and osm_id = OLD.osm_id and class = OLD.class and type = OLD.type INTO has_rank;
2081     IF has_rank THEN
2082       insert into import_polygon_delete values (OLD.osm_type,OLD.osm_id,OLD.class,OLD.type);
2083       RETURN NULL;
2084     END IF;
2085   END IF;
2086
2087   -- mark for delete
2088   UPDATE placex set indexed_status = 100 where osm_type = OLD.osm_type and osm_id = OLD.osm_id and class = OLD.class and type = OLD.type;
2089
2090   -- interpolations are special
2091   IF OLD.class = 'place' and OLD.type = 'houses' THEN
2092     UPDATE placex set indexed_status = 100 where osm_type = OLD.osm_type and osm_id = OLD.osm_id and class = 'place' and type = 'address';
2093   END IF;
2094
2095   RETURN OLD;
2096
2097 END;
2098 $$
2099 LANGUAGE plpgsql;
2100
2101 CREATE OR REPLACE FUNCTION place_insert() RETURNS TRIGGER
2102   AS $$
2103 DECLARE
2104   i INTEGER;
2105   existing RECORD;
2106   existingplacex RECORD;
2107   existinggeometry GEOMETRY;
2108   existingplace_id BIGINT;
2109   result BOOLEAN;
2110   partition INTEGER;
2111 BEGIN
2112
2113   --DEBUG: RAISE WARNING '-----------------------------------------------------------------------------------';
2114   --DEBUG: RAISE WARNING 'place_insert: % % % % %',NEW.osm_type,NEW.osm_id,NEW.class,NEW.type,st_area(NEW.geometry);
2115
2116   IF FALSE and NEW.osm_type = 'R' THEN
2117     select * from placex where osm_type = NEW.osm_type and osm_id = NEW.osm_id and class = NEW.class and type = NEW.type INTO existingplacex;
2118     --DEBUG: RAISE WARNING '%', existingplacex;
2119   END IF;
2120
2121   -- remove operator tag for most places, messes too much with search_name indexes
2122   IF NEW.class not in ('amenity', 'shop') THEN
2123     NEW.name := delete(NEW.name, 'operator');
2124   END IF;
2125
2126   -- Just block these - lots and pointless
2127   IF NEW.class in ('landuse','natural') and NEW.name is null THEN
2128     -- if the name tag was removed, older versions might still be lurking in the place table
2129     DELETE FROM place where osm_type = NEW.osm_type and osm_id = NEW.osm_id and class = NEW.class and type = NEW.type;
2130     RETURN null;
2131   END IF;
2132
2133   IF ST_IsEmpty(NEW.geometry) OR NOT ST_IsValid(NEW.geometry) OR ST_X(ST_Centroid(NEW.geometry))::text in ('NaN','Infinity','-Infinity') OR ST_Y(ST_Centroid(NEW.geometry))::text in ('NaN','Infinity','-Infinity') THEN  
2134     INSERT INTO import_polygon_error values (NEW.osm_type, NEW.osm_id, NEW.class, NEW.type, NEW.name, NEW.country_code, 
2135       now(), ST_IsValidReason(NEW.geometry), null, NEW.geometry);
2136 --    RAISE WARNING 'Invalid Geometry: % % % %',NEW.osm_type,NEW.osm_id,NEW.class,NEW.type;
2137     RETURN null;
2138   END IF;
2139
2140   -- Patch in additional country names
2141   IF NEW.admin_level = 2 AND NEW.type = 'administrative' AND NEW.country_code is not null THEN
2142     select coalesce(country_name.name || NEW.name,NEW.name) from country_name where country_name.country_code = lower(NEW.country_code) INTO NEW.name;
2143   END IF;
2144     
2145   -- Have we already done this place?
2146   select * from place where osm_type = NEW.osm_type and osm_id = NEW.osm_id and class = NEW.class and type = NEW.type INTO existing;
2147
2148   -- Get the existing place_id
2149   select * from placex where osm_type = NEW.osm_type and osm_id = NEW.osm_id and class = NEW.class and type = NEW.type INTO existingplacex;
2150
2151   -- Handle a place changing type by removing the old data
2152   -- My generated 'place' types are causing havok because they overlap with real keys
2153   -- TODO: move them to their own special purpose key/class to avoid collisions
2154   IF existing.osm_type IS NULL THEN
2155     DELETE FROM place where osm_type = NEW.osm_type and osm_id = NEW.osm_id and class = NEW.class;
2156   END IF;
2157
2158   --DEBUG: RAISE WARNING 'Existing: %',existing.osm_id;
2159   --DEBUG: RAISE WARNING 'Existing PlaceX: %',existingplacex.place_id;
2160
2161   -- Log and discard 
2162   IF existing.geometry is not null AND st_isvalid(existing.geometry) 
2163     AND st_area(existing.geometry) > 0.02
2164     AND ST_GeometryType(NEW.geometry) in ('ST_Polygon','ST_MultiPolygon')
2165     AND st_area(NEW.geometry) < st_area(existing.geometry)*0.5
2166     THEN
2167     INSERT INTO import_polygon_error values (NEW.osm_type, NEW.osm_id, NEW.class, NEW.type, NEW.name, NEW.country_code, now(), 
2168       'Area reduced from '||st_area(existing.geometry)||' to '||st_area(NEW.geometry), existing.geometry, NEW.geometry);
2169     RETURN null;
2170   END IF;
2171
2172   DELETE from import_polygon_error where osm_type = NEW.osm_type and osm_id = NEW.osm_id;
2173   DELETE from import_polygon_delete where osm_type = NEW.osm_type and osm_id = NEW.osm_id;
2174
2175   -- To paraphrase, if there isn't an existing item, OR if the admin level has changed
2176   IF existingplacex.osm_type IS NULL OR
2177     (coalesce(existingplacex.admin_level, 15) != coalesce(NEW.admin_level, 15) AND existingplacex.class = 'boundary' AND existingplacex.type = 'administrative')
2178   THEN
2179
2180     IF existingplacex.osm_type IS NOT NULL THEN
2181       -- sanity check: ignore admin_level changes on places with too many active children
2182       -- or we end up reindexing entire countries because somebody accidentally deleted admin_level
2183       --LIMIT INDEXING: SELECT count(*) FROM (SELECT 'a' FROM placex , place_addressline where address_place_id = existingplacex.place_id and placex.place_id = place_addressline.place_id and indexed_status = 0 and place_addressline.isaddress LIMIT 100001) sub INTO i;
2184       --LIMIT INDEXING: IF i > 100000 THEN
2185       --LIMIT INDEXING:  RETURN null;
2186       --LIMIT INDEXING: END IF;
2187     END IF;
2188
2189     IF existing.osm_type IS NOT NULL THEN
2190       -- pathological case caused by the triggerless copy into place during initial import
2191       -- force delete even for large areas, it will be reinserted later
2192       UPDATE place set geometry = ST_SetSRID(ST_Point(0,0), 4326) where osm_type = NEW.osm_type and osm_id = NEW.osm_id and class = NEW.class and type = NEW.type;
2193       DELETE from place where osm_type = NEW.osm_type and osm_id = NEW.osm_id and class = NEW.class and type = NEW.type;
2194     END IF;
2195
2196     -- No - process it as a new insertion (hopefully of low rank or it will be slow)
2197     insert into placex (osm_type, osm_id, class, type, name, admin_level, housenumber, 
2198       street, addr_place, isin, postcode, country_code, extratags, geometry)
2199       values (NEW.osm_type
2200         ,NEW.osm_id
2201         ,NEW.class
2202         ,NEW.type
2203         ,NEW.name
2204         ,NEW.admin_level
2205         ,NEW.housenumber
2206         ,NEW.street
2207         ,NEW.addr_place
2208         ,NEW.isin
2209         ,NEW.postcode
2210         ,NEW.country_code
2211         ,NEW.extratags
2212         ,NEW.geometry
2213         );
2214
2215     --DEBUG: RAISE WARNING 'insert done % % % % %',NEW.osm_type,NEW.osm_id,NEW.class,NEW.type,NEW.name;
2216
2217     RETURN NEW;
2218   END IF;
2219
2220   -- Various ways to do the update
2221
2222   -- Debug, what's changed?
2223   IF FALSE THEN
2224     IF coalesce(existing.name::text, '') != coalesce(NEW.name::text, '') THEN
2225       RAISE WARNING 'update details, name: % % % %',NEW.osm_type,NEW.osm_id,existing.name::text,NEW.name::text;
2226     END IF;
2227     IF coalesce(existing.housenumber, '') != coalesce(NEW.housenumber, '') THEN
2228       RAISE WARNING 'update details, housenumber: % % % %',NEW.osm_type,NEW.osm_id,existing.housenumber,NEW.housenumber;
2229     END IF;
2230     IF coalesce(existing.street, '') != coalesce(NEW.street, '') THEN
2231       RAISE WARNING 'update details, street: % % % %',NEW.osm_type,NEW.osm_id,existing.street,NEW.street;
2232     END IF;
2233     IF coalesce(existing.addr_place, '') != coalesce(NEW.addr_place, '') THEN
2234       RAISE WARNING 'update details, street: % % % %',NEW.osm_type,NEW.osm_id,existing.addr_place,NEW.addr_place;
2235     END IF;
2236     IF coalesce(existing.isin, '') != coalesce(NEW.isin, '') THEN
2237       RAISE WARNING 'update details, isin: % % % %',NEW.osm_type,NEW.osm_id,existing.isin,NEW.isin;
2238     END IF;
2239     IF coalesce(existing.postcode, '') != coalesce(NEW.postcode, '') THEN
2240       RAISE WARNING 'update details, postcode: % % % %',NEW.osm_type,NEW.osm_id,existing.postcode,NEW.postcode;
2241     END IF;
2242     IF coalesce(existing.country_code, '') != coalesce(NEW.country_code, '') THEN
2243       RAISE WARNING 'update details, country_code: % % % %',NEW.osm_type,NEW.osm_id,existing.country_code,NEW.country_code;
2244     END IF;
2245   END IF;
2246
2247   -- Special case for polygon shape changes because they tend to be large and we can be a bit clever about how we handle them
2248   IF existing.geometry::text != NEW.geometry::text 
2249      AND ST_GeometryType(existing.geometry) in ('ST_Polygon','ST_MultiPolygon')
2250      AND ST_GeometryType(NEW.geometry) in ('ST_Polygon','ST_MultiPolygon') 
2251      THEN 
2252
2253     -- Get the version of the geometry actually used (in placex table)
2254     select geometry from placex where osm_type = NEW.osm_type and osm_id = NEW.osm_id and class = NEW.class and type = NEW.type into existinggeometry;
2255
2256     -- Performance limit
2257     IF st_area(NEW.geometry) < 0.000000001 AND st_area(existinggeometry) < 1 THEN
2258
2259       -- re-index points that have moved in / out of the polygon, could be done as a single query but postgres gets the index usage wrong
2260       update placex set indexed_status = 2 where indexed_status = 0 and 
2261           (st_covers(NEW.geometry, placex.geometry) OR ST_Intersects(NEW.geometry, placex.geometry))
2262           AND NOT (st_covers(existinggeometry, placex.geometry) OR ST_Intersects(existinggeometry, placex.geometry))
2263           AND rank_search > existingplacex.rank_search AND (rank_search < 28 or name is not null);
2264
2265       update placex set indexed_status = 2 where indexed_status = 0 and 
2266           (st_covers(existinggeometry, placex.geometry) OR ST_Intersects(existinggeometry, placex.geometry))
2267           AND NOT (st_covers(NEW.geometry, placex.geometry) OR ST_Intersects(NEW.geometry, placex.geometry))
2268           AND rank_search > existingplacex.rank_search AND (rank_search < 28 or name is not null);
2269
2270     END IF;
2271
2272   END IF;
2273
2274   -- Special case - if we are just adding extra words we hack them into the search_name table rather than reindexing
2275   IF FALSE AND existingplacex.rank_search < 26
2276      AND coalesce(existing.housenumber, '') = coalesce(NEW.housenumber, '')
2277      AND coalesce(existing.street, '') = coalesce(NEW.street, '')
2278      AND coalesce(existing.addr_place, '') = coalesce(NEW.addr_place, '')
2279      AND coalesce(existing.isin, '') = coalesce(NEW.isin, '')
2280      AND coalesce(existing.postcode, '') = coalesce(NEW.postcode, '')
2281      AND coalesce(existing.country_code, '') = coalesce(NEW.country_code, '')
2282      AND coalesce(existing.name::text, '') != coalesce(NEW.name::text, '') 
2283      THEN
2284
2285     IF NOT update_location_nameonly(existingplacex.place_id, NEW.name) THEN
2286
2287       IF st_area(NEW.geometry) < 0.5 THEN
2288         UPDATE placex set indexed_status = 2 from place_addressline where address_place_id = existingplacex.place_id 
2289           and placex.place_id = place_addressline.place_id and indexed_status = 0
2290           and (rank_search < 28 or name is not null);
2291       END IF;
2292
2293     END IF;
2294   
2295   ELSE
2296
2297     -- Anything else has changed - reindex the lot
2298     IF coalesce(existing.name::text, '') != coalesce(NEW.name::text, '')
2299         OR coalesce(existing.housenumber, '') != coalesce(NEW.housenumber, '')
2300         OR coalesce(existing.street, '') != coalesce(NEW.street, '')
2301         OR coalesce(existing.addr_place, '') != coalesce(NEW.addr_place, '')
2302         OR coalesce(existing.isin, '') != coalesce(NEW.isin, '')
2303         OR coalesce(existing.postcode, '') != coalesce(NEW.postcode, '')
2304         OR coalesce(existing.country_code, '') != coalesce(NEW.country_code, '') THEN
2305
2306       -- performance, can't take the load of re-indexing a whole country / huge area
2307       IF st_area(NEW.geometry) < 0.5 THEN
2308 --        UPDATE placex set indexed_status = 2 from place_addressline where address_place_id = existingplacex.place_id 
2309 --          and placex.place_id = place_addressline.place_id and indexed_status = 0;
2310       END IF;
2311
2312     END IF;
2313
2314   END IF;
2315
2316   -- refuse to update multiplpoygons with too many objects, too much of a performance hit
2317   IF ST_NumGeometries(NEW.geometry) > 2000 THEN
2318     RAISE WARNING 'Dropping update of % % because of geometry complexity.', NEW.osm_type, NEW.osm_id;
2319     RETURN NULL;
2320   END IF;
2321
2322   IF coalesce(existing.name::text, '') != coalesce(NEW.name::text, '')
2323      OR coalesce(existing.extratags::text, '') != coalesce(NEW.extratags::text, '')
2324      OR coalesce(existing.housenumber, '') != coalesce(NEW.housenumber, '')
2325      OR coalesce(existing.street, '') != coalesce(NEW.street, '')
2326      OR coalesce(existing.addr_place, '') != coalesce(NEW.addr_place, '')
2327      OR coalesce(existing.isin, '') != coalesce(NEW.isin, '')
2328      OR coalesce(existing.postcode, '') != coalesce(NEW.postcode, '')
2329      OR coalesce(existing.country_code, '') != coalesce(NEW.country_code, '')
2330      OR coalesce(existing.admin_level, 15) != coalesce(NEW.admin_level, 15)
2331      OR existing.geometry::text != NEW.geometry::text
2332      THEN
2333
2334     update place set 
2335       name = NEW.name,
2336       housenumber  = NEW.housenumber,
2337       street = NEW.street,
2338       addr_place = NEW.addr_place,
2339       isin = NEW.isin,
2340       postcode = NEW.postcode,
2341       country_code = NEW.country_code,
2342       extratags = NEW.extratags,
2343       admin_level = NEW.admin_level,
2344       geometry = NEW.geometry
2345       where osm_type = NEW.osm_type and osm_id = NEW.osm_id and class = NEW.class and type = NEW.type;
2346
2347     IF NEW.class in ('place','boundary') AND NEW.type in ('postcode','postal_code') THEN
2348         IF NEW.postcode IS NULL THEN
2349             -- postcode was deleted, no longer retain in placex
2350             DELETE FROM placex where place_id = existingplacex.place_id;
2351             RETURN NULL;
2352         END IF;
2353
2354         NEW.name := hstore('ref', NEW.postcode);
2355     END IF;
2356
2357     update placex set 
2358       name = NEW.name,
2359       housenumber = NEW.housenumber,
2360       street = NEW.street,
2361       addr_place = NEW.addr_place,
2362       isin = NEW.isin,
2363       postcode = NEW.postcode,
2364       country_code = NEW.country_code,
2365       parent_place_id = null,
2366       extratags = NEW.extratags,
2367       admin_level = CASE WHEN NEW.admin_level > 15 THEN 15 ELSE NEW.admin_level END,
2368       indexed_status = 2,    
2369       geometry = NEW.geometry
2370       where place_id = existingplacex.place_id;
2371
2372   END IF;
2373
2374   -- for interpolations invalidate all nodes on the line
2375   IF NEW.class = 'place' and NEW.type = 'houses' and NEW.osm_type = 'W' THEN
2376     update placex p set indexed_status = 2 from planet_osm_ways w where w.id = NEW.osm_id and p.osm_type = 'N' and p.osm_id = any(w.nodes);
2377   END IF;
2378
2379   -- Abort the add (we modified the existing place instead)
2380   RETURN NULL;
2381
2382 END; 
2383 $$ LANGUAGE plpgsql;
2384
2385 CREATE OR REPLACE FUNCTION get_name_by_language(name hstore, languagepref TEXT[]) RETURNS TEXT
2386   AS $$
2387 DECLARE
2388   search TEXT[];
2389   found BOOLEAN;
2390 BEGIN
2391
2392   IF name is null THEN
2393     RETURN null;
2394   END IF;
2395
2396   search := languagepref;
2397
2398   FOR j IN 1..array_upper(search, 1) LOOP
2399     IF name ? search[j] AND trim(name->search[j]) != '' THEN
2400       return trim(name->search[j]);
2401     END IF;
2402   END LOOP;
2403
2404   -- anything will do as a fallback - just take the first name type thing there is
2405   search := avals(name);
2406   RETURN search[1];
2407 END;
2408 $$
2409 LANGUAGE plpgsql IMMUTABLE;
2410
2411
2412 CREATE OR REPLACE FUNCTION get_address_postcode(for_place_id BIGINT) RETURNS TEXT
2413   AS $$
2414 DECLARE
2415   result TEXT[];
2416   search TEXT[];
2417   for_postcode TEXT;
2418   found INTEGER;
2419   location RECORD;
2420 BEGIN
2421
2422   found := 1000;
2423   search := ARRAY['ref'];
2424   result := '{}';
2425
2426   select postcode from placex where place_id = for_place_id limit 1 into for_postcode;
2427
2428   FOR location IN 
2429     select rank_address,name,distance,length(name::text) as namelength 
2430       from place_addressline join placex on (address_place_id = placex.place_id) 
2431       where place_addressline.place_id = for_place_id and rank_address in (5,11)
2432       order by rank_address desc,rank_search desc,fromarea desc,distance asc,namelength desc
2433   LOOP
2434     IF array_upper(search, 1) IS NOT NULL AND array_upper(location.name, 1) IS NOT NULL THEN
2435       FOR j IN 1..array_upper(search, 1) LOOP
2436         FOR k IN 1..array_upper(location.name, 1) LOOP
2437           IF (found > location.rank_address AND location.name[k].key = search[j] AND location.name[k].value != '') AND NOT result @> ARRAY[trim(location.name[k].value)] AND (for_postcode IS NULL OR location.name[k].value ilike for_postcode||'%') THEN
2438             result[(100 - location.rank_address)] := trim(location.name[k].value);
2439             found := location.rank_address;
2440           END IF;
2441         END LOOP;
2442       END LOOP;
2443     END IF;
2444   END LOOP;
2445
2446   RETURN array_to_string(result,', ');
2447 END;
2448 $$
2449 LANGUAGE plpgsql;
2450
2451 CREATE OR REPLACE FUNCTION get_address_by_language(for_place_id BIGINT, languagepref TEXT[]) RETURNS TEXT
2452   AS $$
2453 DECLARE
2454   result TEXT[];
2455   currresult TEXT;
2456   prevresult TEXT;
2457   location RECORD;
2458 BEGIN
2459
2460   result := '{}';
2461   prevresult := '';
2462
2463   FOR location IN select * from get_addressdata(for_place_id) where isaddress order by rank_address desc LOOP
2464     currresult := trim(get_name_by_language(location.name, languagepref));
2465     IF currresult != prevresult AND currresult IS NOT NULL AND result[(100 - location.rank_address)] IS NULL THEN
2466       result[(100 - location.rank_address)] := trim(get_name_by_language(location.name, languagepref));
2467       prevresult := currresult;
2468     END IF;
2469   END LOOP;
2470
2471   RETURN array_to_string(result,', ');
2472 END;
2473 $$
2474 LANGUAGE plpgsql;
2475
2476 DROP TYPE IF EXISTS addressline CASCADE;
2477 create type addressline as (
2478   place_id BIGINT,
2479   osm_type CHAR(1),
2480   osm_id BIGINT,
2481   name HSTORE,
2482   class TEXT,
2483   type TEXT,
2484   admin_level INTEGER,
2485   fromarea BOOLEAN,  
2486   isaddress BOOLEAN,  
2487   rank_address INTEGER,
2488   distance FLOAT
2489 );
2490
2491 CREATE OR REPLACE FUNCTION get_addressdata(in_place_id BIGINT) RETURNS setof addressline 
2492   AS $$
2493 DECLARE
2494   for_place_id BIGINT;
2495   result TEXT[];
2496   search TEXT[];
2497   found INTEGER;
2498   location RECORD;
2499   countrylocation RECORD;
2500   searchcountrycode varchar(2);
2501   searchhousenumber TEXT;
2502   searchhousename HSTORE;
2503   searchrankaddress INTEGER;
2504   searchpostcode TEXT;
2505   searchclass TEXT;
2506   searchtype TEXT;
2507   countryname HSTORE;
2508   hadcountry BOOLEAN;
2509 BEGIN
2510
2511   select parent_place_id,'us', housenumber, 30, postcode, null, 'place', 'house' from location_property_tiger 
2512     WHERE place_id = in_place_id 
2513     INTO for_place_id,searchcountrycode, searchhousenumber, searchrankaddress, searchpostcode, searchhousename, searchclass, searchtype;
2514
2515   IF for_place_id IS NULL THEN
2516     select parent_place_id,'us', housenumber, 30, postcode, null, 'place', 'house' from location_property_aux
2517       WHERE place_id = in_place_id 
2518       INTO for_place_id,searchcountrycode, searchhousenumber, searchrankaddress, searchpostcode, searchhousename, searchclass, searchtype;
2519   END IF;
2520
2521   IF for_place_id IS NULL THEN
2522     select parent_place_id, calculated_country_code, housenumber, rank_search, postcode, name, class, type from placex 
2523       WHERE place_id = in_place_id and rank_address = 30 
2524       INTO for_place_id, searchcountrycode, searchhousenumber, searchrankaddress, searchpostcode, searchhousename, searchclass, searchtype;
2525   END IF;
2526
2527   IF for_place_id IS NULL THEN
2528     for_place_id := in_place_id;
2529     select calculated_country_code, housenumber, rank_search, postcode, null from placex where place_id = for_place_id 
2530       INTO searchcountrycode, searchhousenumber, searchrankaddress, searchpostcode, searchhousename;
2531   END IF;
2532
2533 --RAISE WARNING '% % % %',searchcountrycode, searchhousenumber, searchrankaddress, searchpostcode;
2534
2535   found := 1000;
2536   hadcountry := false;
2537   FOR location IN 
2538     select placex.place_id, osm_type, osm_id,
2539       CASE WHEN class = 'place' and type = 'postcode' THEN hstore('name', postcode) ELSE name END as name,
2540       class, type, admin_level, true as fromarea, true as isaddress,
2541       CASE WHEN rank_address = 0 THEN 100 WHEN rank_address = 11 THEN 5 ELSE rank_address END as rank_address,
2542       0 as distance, calculated_country_code, postcode
2543       from placex
2544       where place_id = for_place_id 
2545   LOOP
2546 --RAISE WARNING '%',location;
2547     IF searchcountrycode IS NULL AND location.calculated_country_code IS NOT NULL THEN
2548       searchcountrycode := location.calculated_country_code;
2549     END IF;
2550     IF searchpostcode IS NOT NULL and location.type = 'postcode' THEN
2551       location.isaddress := FALSE;
2552     END IF;
2553     IF searchpostcode IS NULL and location.postcode IS NOT NULL THEN
2554       searchpostcode := location.postcode;
2555     END IF;
2556     IF location.rank_address = 4 AND location.isaddress THEN
2557       hadcountry := true;
2558     END IF;
2559     IF location.rank_address < 4 AND NOT hadcountry THEN
2560       select name from country_name where country_code = searchcountrycode limit 1 INTO countryname;
2561       IF countryname IS NOT NULL THEN
2562         countrylocation := ROW(null, null, null, countryname, 'place', 'country', null, true, true, 4, 0)::addressline;
2563         RETURN NEXT countrylocation;
2564       END IF;
2565     END IF;
2566     countrylocation := ROW(location.place_id, location.osm_type, location.osm_id, location.name, location.class, 
2567                            location.type, location.admin_level, location.fromarea, location.isaddress, location.rank_address, 
2568                            location.distance)::addressline;
2569     RETURN NEXT countrylocation;
2570     found := location.rank_address;
2571   END LOOP;
2572
2573   FOR location IN 
2574     select placex.place_id, osm_type, osm_id,
2575       CASE WHEN class = 'place' and type = 'postcode' THEN hstore('name', postcode) ELSE name END as name,
2576       CASE WHEN extratags ? 'place' THEN 'place' ELSE class END as class,
2577       CASE WHEN extratags ? 'place' THEN extratags->'place' ELSE type END as type,
2578       admin_level, fromarea, isaddress,
2579       CASE WHEN address_place_id = for_place_id AND rank_address = 0 THEN 100 WHEN rank_address = 11 THEN 5 ELSE rank_address END as rank_address,
2580       distance,calculated_country_code,postcode
2581       from place_addressline join placex on (address_place_id = placex.place_id) 
2582       where place_addressline.place_id = for_place_id 
2583       and (cached_rank_address > 0 AND cached_rank_address < searchrankaddress)
2584       and address_place_id != for_place_id
2585       and (placex.calculated_country_code IS NULL OR searchcountrycode IS NULL OR placex.calculated_country_code = searchcountrycode)
2586       order by rank_address desc,isaddress desc,fromarea desc,distance asc,rank_search desc
2587   LOOP
2588 --RAISE WARNING '%',location;
2589     IF searchcountrycode IS NULL AND location.calculated_country_code IS NOT NULL THEN
2590       searchcountrycode := location.calculated_country_code;
2591     END IF;
2592     IF searchpostcode IS NOT NULL and location.type = 'postcode' THEN
2593       location.isaddress := FALSE;
2594     END IF;
2595     IF searchpostcode IS NULL and location.isaddress and location.type != 'postcode' and location.postcode IS NOT NULL THEN
2596       searchpostcode := location.postcode;
2597     END IF;
2598     IF location.rank_address = 4 AND location.isaddress THEN
2599       hadcountry := true;
2600     END IF;
2601     IF location.rank_address < 4 AND NOT hadcountry THEN
2602       select name from country_name where country_code = searchcountrycode limit 1 INTO countryname;
2603       IF countryname IS NOT NULL THEN
2604         countrylocation := ROW(null, null, null, countryname, 'place', 'country', null, true, true, 4, 0)::addressline;
2605         RETURN NEXT countrylocation;
2606       END IF;
2607     END IF;
2608     countrylocation := ROW(location.place_id, location.osm_type, location.osm_id, location.name, location.class, 
2609                            location.type, location.admin_level, location.fromarea, location.isaddress, location.rank_address, 
2610                            location.distance)::addressline;
2611     RETURN NEXT countrylocation;
2612     found := location.rank_address;
2613   END LOOP;
2614
2615   IF found > 4 THEN
2616     select name from country_name where country_code = searchcountrycode limit 1 INTO countryname;
2617 --RAISE WARNING '% % %',found,searchcountrycode,countryname;
2618     IF countryname IS NOT NULL THEN
2619       location := ROW(null, null, null, countryname, 'place', 'country', null, true, true, 4, 0)::addressline;
2620       RETURN NEXT location;
2621     END IF;
2622   END IF;
2623
2624   IF searchcountrycode IS NOT NULL THEN
2625     location := ROW(null, null, null, hstore('ref', searchcountrycode), 'place', 'country_code', null, true, false, 4, 0)::addressline;
2626     RETURN NEXT location;
2627   END IF;
2628
2629   IF searchhousename IS NOT NULL THEN
2630     location := ROW(in_place_id, null, null, searchhousename, searchclass, searchtype, null, true, true, 29, 0)::addressline;
2631 --    location := ROW(in_place_id, null, null, searchhousename, 'place', 'house_name', null, true, true, 29, 0)::addressline;
2632     RETURN NEXT location;
2633   END IF;
2634
2635   IF searchhousenumber IS NOT NULL THEN
2636     location := ROW(in_place_id, null, null, hstore('ref', searchhousenumber), 'place', 'house_number', null, true, true, 28, 0)::addressline;
2637     RETURN NEXT location;
2638   END IF;
2639
2640   IF searchpostcode IS NOT NULL THEN
2641     location := ROW(null, null, null, hstore('ref', searchpostcode), 'place', 'postcode', null, true, true, 5, 0)::addressline;
2642     RETURN NEXT location;
2643   END IF;
2644
2645   RETURN;
2646 END;
2647 $$
2648 LANGUAGE plpgsql;
2649
2650
2651 CREATE OR REPLACE FUNCTION update_place(search_place_id BIGINT) RETURNS BOOLEAN
2652   AS $$
2653 DECLARE
2654   numfeatures integer;
2655 BEGIN
2656   update placex set 
2657       name = place.name,
2658       housenumber = place.housenumber,
2659       street = place.street,
2660       addr_place = place.addr_place,
2661       isin = place.isin,
2662       postcode = place.postcode,
2663       country_code = place.country_code,
2664       parent_place_id = null
2665       from place
2666       where placex.place_id = search_place_id 
2667         and place.osm_type = placex.osm_type and place.osm_id = placex.osm_id
2668         and place.class = placex.class and place.type = placex.type;
2669   update placex set indexed_status = 2 where place_id = search_place_id;
2670   update placex set indexed_status = 0 where place_id = search_place_id;
2671   return true;
2672 END;
2673 $$
2674 LANGUAGE plpgsql;
2675
2676 CREATE OR REPLACE FUNCTION get_searchrank_label(rank INTEGER) RETURNS TEXT
2677   AS $$
2678 DECLARE
2679 BEGIN
2680   IF rank < 2 THEN
2681     RETURN 'Continent';
2682   ELSEIF rank < 4 THEN
2683     RETURN 'Sea';
2684   ELSEIF rank < 8 THEN
2685     RETURN 'Country';
2686   ELSEIF rank < 12 THEN
2687     RETURN 'State';
2688   ELSEIF rank < 16 THEN
2689     RETURN 'County';
2690   ELSEIF rank = 16 THEN
2691     RETURN 'City';
2692   ELSEIF rank = 17 THEN
2693     RETURN 'Town / Island';
2694   ELSEIF rank = 18 THEN
2695     RETURN 'Village / Hamlet';
2696   ELSEIF rank = 20 THEN
2697     RETURN 'Suburb';
2698   ELSEIF rank = 21 THEN
2699     RETURN 'Postcode Area';
2700   ELSEIF rank = 22 THEN
2701     RETURN 'Croft / Farm / Locality / Islet';
2702   ELSEIF rank = 23 THEN
2703     RETURN 'Postcode Area';
2704   ELSEIF rank = 25 THEN
2705     RETURN 'Postcode Point';
2706   ELSEIF rank = 26 THEN
2707     RETURN 'Street / Major Landmark';
2708   ELSEIF rank = 27 THEN
2709     RETURN 'Minory Street / Path';
2710   ELSEIF rank = 28 THEN
2711     RETURN 'House / Building';
2712   ELSE
2713     RETURN 'Other: '||rank;
2714   END IF;
2715   
2716 END;
2717 $$
2718 LANGUAGE plpgsql;
2719
2720 CREATE OR REPLACE FUNCTION get_addressrank_label(rank INTEGER) RETURNS TEXT
2721   AS $$
2722 DECLARE
2723 BEGIN
2724   IF rank = 0 THEN
2725     RETURN 'None';
2726   ELSEIF rank < 2 THEN
2727     RETURN 'Continent';
2728   ELSEIF rank < 4 THEN
2729     RETURN 'Sea';
2730   ELSEIF rank = 5 THEN
2731     RETURN 'Postcode';
2732   ELSEIF rank < 8 THEN
2733     RETURN 'Country';
2734   ELSEIF rank < 12 THEN
2735     RETURN 'State';
2736   ELSEIF rank < 16 THEN
2737     RETURN 'County';
2738   ELSEIF rank = 16 THEN
2739     RETURN 'City';
2740   ELSEIF rank = 17 THEN
2741     RETURN 'Town / Village / Hamlet';
2742   ELSEIF rank = 20 THEN
2743     RETURN 'Suburb';
2744   ELSEIF rank = 21 THEN
2745     RETURN 'Postcode Area';
2746   ELSEIF rank = 22 THEN
2747     RETURN 'Croft / Farm / Locality / Islet';
2748   ELSEIF rank = 23 THEN
2749     RETURN 'Postcode Area';
2750   ELSEIF rank = 25 THEN
2751     RETURN 'Postcode Point';
2752   ELSEIF rank = 26 THEN
2753     RETURN 'Street / Major Landmark';
2754   ELSEIF rank = 27 THEN
2755     RETURN 'Minory Street / Path';
2756   ELSEIF rank = 28 THEN
2757     RETURN 'House / Building';
2758   ELSE
2759     RETURN 'Other: '||rank;
2760   END IF;
2761   
2762 END;
2763 $$
2764 LANGUAGE plpgsql;
2765
2766 CREATE OR REPLACE FUNCTION get_word_suggestion(srcword TEXT) RETURNS TEXT
2767   AS $$
2768 DECLARE
2769   trigramtoken TEXT;
2770   result TEXT;
2771 BEGIN
2772
2773   trigramtoken := regexp_replace(make_standard_name(srcword),E'([^0-9])\\1+',E'\\1','g');
2774   SELECT word FROM word WHERE word_trigram like ' %' and word_trigram % trigramtoken ORDER BY similarity(word_trigram, trigramtoken) DESC, word limit 1 into result;
2775
2776   return result;
2777 END;
2778 $$
2779 LANGUAGE plpgsql;
2780
2781 CREATE OR REPLACE FUNCTION get_word_suggestions(srcword TEXT) RETURNS TEXT[]
2782   AS $$
2783 DECLARE
2784   trigramtoken TEXT;
2785   result TEXT[];
2786   r RECORD;
2787 BEGIN
2788
2789   trigramtoken := regexp_replace(make_standard_name(srcword),E'([^0-9])\\1+',E'\\1','g');
2790
2791   FOR r IN SELECT word,similarity(word_trigram, trigramtoken) as score FROM word 
2792     WHERE word_trigram like ' %' and word_trigram % trigramtoken ORDER BY similarity(word_trigram, trigramtoken) DESC, word limit 4
2793   LOOP
2794     result[coalesce(array_upper(result,1)+1,1)] := r.word;
2795   END LOOP;
2796
2797   return result;
2798 END;
2799 $$
2800 LANGUAGE plpgsql;
2801
2802 CREATE OR REPLACE FUNCTION aux_create_property(pointgeo GEOMETRY, in_housenumber TEXT, 
2803   in_street TEXT, in_isin TEXT, in_postcode TEXT, in_countrycode char(2)) RETURNS INTEGER
2804   AS $$
2805 DECLARE
2806
2807   newpoints INTEGER;
2808   place_centroid GEOMETRY;
2809   out_partition INTEGER;
2810   out_parent_place_id BIGINT;
2811   location RECORD;
2812   address_street_word_id INTEGER;  
2813   out_postcode TEXT;
2814
2815 BEGIN
2816
2817   place_centroid := ST_Centroid(pointgeo);
2818   out_partition := get_partition(in_countrycode);
2819   out_parent_place_id := null;
2820
2821   address_street_word_id := get_name_id(make_standard_name(in_street));
2822   IF address_street_word_id IS NOT NULL THEN
2823     FOR location IN SELECT * from getNearestNamedRoadFeature(out_partition, place_centroid, address_street_word_id) LOOP
2824       out_parent_place_id := location.place_id;
2825     END LOOP;
2826   END IF;
2827
2828   IF out_parent_place_id IS NULL THEN
2829     FOR location IN SELECT place_id FROM getNearestRoadFeature(out_partition, place_centroid) LOOP
2830       out_parent_place_id := location.place_id;
2831     END LOOP;    
2832   END IF;
2833
2834   out_postcode := in_postcode;
2835   IF out_postcode IS NULL THEN
2836     SELECT postcode from placex where place_id = out_parent_place_id INTO out_postcode;
2837   END IF;
2838   IF out_postcode IS NULL THEN
2839     out_postcode := getNearestPostcode(out_partition, place_centroid);
2840   END IF;
2841
2842   newpoints := 0;
2843   insert into location_property_aux (place_id, partition, parent_place_id, housenumber, postcode, centroid)
2844     values (nextval('seq_place'), out_partition, out_parent_place_id, in_housenumber, out_postcode, place_centroid);
2845   newpoints := newpoints + 1;
2846
2847   RETURN newpoints;
2848 END;
2849 $$
2850 LANGUAGE plpgsql;
2851
2852 CREATE OR REPLACE FUNCTION get_osm_rel_members(members TEXT[], member TEXT) RETURNS TEXT[]
2853   AS $$
2854 DECLARE
2855   result TEXT[];
2856   i INTEGER;
2857 BEGIN
2858
2859   FOR i IN 1..ARRAY_UPPER(members,1) BY 2 LOOP
2860     IF members[i+1] = member THEN
2861       result := result || members[i];
2862     END IF;
2863   END LOOP;
2864
2865   return result;
2866 END;
2867 $$
2868 LANGUAGE plpgsql;
2869
2870 CREATE OR REPLACE FUNCTION get_osm_rel_members(members TEXT[], memberLabels TEXT[]) RETURNS SETOF TEXT
2871   AS $$
2872 DECLARE
2873   i INTEGER;
2874 BEGIN
2875
2876   FOR i IN 1..ARRAY_UPPER(members,1) BY 2 LOOP
2877     IF members[i+1] = ANY(memberLabels) THEN
2878       RETURN NEXT members[i];
2879     END IF;
2880   END LOOP;
2881
2882   RETURN;
2883 END;
2884 $$
2885 LANGUAGE plpgsql;
2886
2887 -- See: http://stackoverflow.com/questions/6410088/how-can-i-mimic-the-php-urldecode-function-in-postgresql
2888 CREATE OR REPLACE FUNCTION decode_url_part(p varchar) RETURNS varchar 
2889   AS $$
2890 SELECT convert_from(CAST(E'\\x' || array_to_string(ARRAY(
2891     SELECT CASE WHEN length(r.m[1]) = 1 THEN encode(convert_to(r.m[1], 'SQL_ASCII'), 'hex') ELSE substring(r.m[1] from 2 for 2) END
2892     FROM regexp_matches($1, '%[0-9a-f][0-9a-f]|.', 'gi') AS r(m)
2893 ), '') AS bytea), 'UTF8');
2894 $$ 
2895 LANGUAGE SQL IMMUTABLE STRICT;
2896
2897 CREATE OR REPLACE FUNCTION catch_decode_url_part(p varchar) RETURNS varchar
2898   AS $$
2899 DECLARE
2900 BEGIN
2901   RETURN decode_url_part(p);
2902 EXCEPTION
2903   WHEN others THEN return null;
2904 END;
2905 $$
2906 LANGUAGE plpgsql IMMUTABLE;
2907
2908 DROP TYPE wikipedia_article_match CASCADE;
2909 create type wikipedia_article_match as (
2910   language TEXT,
2911   title TEXT,
2912   importance FLOAT
2913 );
2914
2915 CREATE OR REPLACE FUNCTION get_wikipedia_match(extratags HSTORE, country_code varchar(2)) RETURNS wikipedia_article_match
2916   AS $$
2917 DECLARE
2918   langs TEXT[];
2919   i INT;
2920   wiki_article TEXT;
2921   wiki_article_title TEXT;
2922   wiki_article_language TEXT;
2923   result wikipedia_article_match;
2924 BEGIN
2925   langs := ARRAY['english','country','ar','bg','ca','cs','da','de','en','es','eo','eu','fa','fr','ko','hi','hr','id','it','he','lt','hu','ms','nl','ja','no','pl','pt','kk','ro','ru','sk','sl','sr','fi','sv','tr','uk','vi','vo','war','zh'];
2926   i := 1;
2927   WHILE langs[i] IS NOT NULL LOOP
2928     wiki_article := extratags->(case when langs[i] in ('english','country') THEN 'wikipedia' ELSE 'wikipedia:'||langs[i] END);
2929     IF wiki_article is not null THEN
2930       wiki_article := regexp_replace(wiki_article,E'^(.*?)([a-z]{2,3}).wikipedia.org/wiki/',E'\\2:');
2931       wiki_article := regexp_replace(wiki_article,E'^(.*?)([a-z]{2,3}).wikipedia.org/w/index.php\\?title=',E'\\2:');
2932       wiki_article := regexp_replace(wiki_article,E'^(.*?)/([a-z]{2,3})/wiki/',E'\\2:');
2933       --wiki_article := regexp_replace(wiki_article,E'^(.*?)([a-z]{2,3})[=:]',E'\\2:');
2934       wiki_article := replace(wiki_article,' ','_');
2935       IF strpos(wiki_article, ':') IN (3,4) THEN
2936         wiki_article_language := lower(trim(split_part(wiki_article, ':', 1)));
2937         wiki_article_title := trim(substr(wiki_article, strpos(wiki_article, ':')+1));
2938       ELSE
2939         wiki_article_title := trim(wiki_article);
2940         wiki_article_language := CASE WHEN langs[i] = 'english' THEN 'en' WHEN langs[i] = 'country' THEN get_country_language_code(country_code) ELSE langs[i] END;
2941       END IF;
2942
2943       select wikipedia_article.language,wikipedia_article.title,wikipedia_article.importance
2944         from wikipedia_article 
2945         where language = wiki_article_language and 
2946         (title = wiki_article_title OR title = catch_decode_url_part(wiki_article_title) OR title = replace(catch_decode_url_part(wiki_article_title),E'\\',''))
2947       UNION ALL
2948       select wikipedia_article.language,wikipedia_article.title,wikipedia_article.importance
2949         from wikipedia_redirect join wikipedia_article on (wikipedia_redirect.language = wikipedia_article.language and wikipedia_redirect.to_title = wikipedia_article.title)
2950         where wikipedia_redirect.language = wiki_article_language and 
2951         (from_title = wiki_article_title OR from_title = catch_decode_url_part(wiki_article_title) OR from_title = replace(catch_decode_url_part(wiki_article_title),E'\\',''))
2952       order by importance desc limit 1 INTO result;
2953
2954       IF result.language is not null THEN
2955         return result;
2956       END IF;
2957     END IF;
2958     i := i + 1;
2959   END LOOP;
2960   RETURN NULL;
2961 END;
2962 $$
2963 LANGUAGE plpgsql;
2964
2965 CREATE OR REPLACE FUNCTION quad_split_geometry(geometry GEOMETRY, maxarea FLOAT, maxdepth INTEGER) 
2966   RETURNS SETOF GEOMETRY
2967   AS $$
2968 DECLARE
2969   xmin FLOAT;
2970   ymin FLOAT;
2971   xmax FLOAT;
2972   ymax FLOAT;
2973   xmid FLOAT;
2974   ymid FLOAT;
2975   secgeo GEOMETRY;
2976   secbox GEOMETRY;
2977   seg INTEGER;
2978   geo RECORD;
2979   area FLOAT;
2980   remainingdepth INTEGER;
2981   added INTEGER;
2982   
2983 BEGIN
2984
2985 --  RAISE WARNING 'quad_split_geometry: maxarea=%, depth=%',maxarea,maxdepth;
2986
2987   IF (ST_GeometryType(geometry) not in ('ST_Polygon','ST_MultiPolygon') OR NOT ST_IsValid(geometry)) THEN
2988     RETURN NEXT geometry;
2989     RETURN;
2990   END IF;
2991
2992   remainingdepth := maxdepth - 1;
2993   area := ST_AREA(geometry);
2994   IF remainingdepth < 1 OR area < maxarea THEN
2995     RETURN NEXT geometry;
2996     RETURN;
2997   END IF;
2998
2999   xmin := st_xmin(geometry);
3000   xmax := st_xmax(geometry);
3001   ymin := st_ymin(geometry);
3002   ymax := st_ymax(geometry);
3003   secbox := ST_SetSRID(ST_MakeBox2D(ST_Point(ymin,xmin),ST_Point(ymax,xmax)),4326);
3004
3005   -- if the geometry completely covers the box don't bother to slice any more
3006   IF ST_AREA(secbox) = area THEN
3007     RETURN NEXT geometry;
3008     RETURN;
3009   END IF;
3010
3011   xmid := (xmin+xmax)/2;
3012   ymid := (ymin+ymax)/2;
3013
3014   added := 0;
3015   FOR seg IN 1..4 LOOP
3016
3017     IF seg = 1 THEN
3018       secbox := ST_SetSRID(ST_MakeBox2D(ST_Point(xmin,ymin),ST_Point(xmid,ymid)),4326);
3019     END IF;
3020     IF seg = 2 THEN
3021       secbox := ST_SetSRID(ST_MakeBox2D(ST_Point(xmin,ymid),ST_Point(xmid,ymax)),4326);
3022     END IF;
3023     IF seg = 3 THEN
3024       secbox := ST_SetSRID(ST_MakeBox2D(ST_Point(xmid,ymin),ST_Point(xmax,ymid)),4326);
3025     END IF;
3026     IF seg = 4 THEN
3027       secbox := ST_SetSRID(ST_MakeBox2D(ST_Point(xmid,ymid),ST_Point(xmax,ymax)),4326);
3028     END IF;
3029
3030     IF st_intersects(geometry, secbox) THEN
3031       secgeo := st_intersection(geometry, secbox);
3032       IF NOT ST_IsEmpty(secgeo) AND ST_GeometryType(secgeo) in ('ST_Polygon','ST_MultiPolygon') THEN
3033         FOR geo IN select quad_split_geometry(secgeo, maxarea, remainingdepth) as geom LOOP
3034           IF NOT ST_IsEmpty(geo.geom) AND ST_GeometryType(geo.geom) in ('ST_Polygon','ST_MultiPolygon') THEN
3035             added := added + 1;
3036             RETURN NEXT geo.geom;
3037           END IF;
3038         END LOOP;
3039       END IF;
3040     END IF;
3041   END LOOP;
3042
3043   RETURN;
3044 END;
3045 $$
3046 LANGUAGE plpgsql;
3047
3048 CREATE OR REPLACE FUNCTION split_geometry(geometry GEOMETRY) 
3049   RETURNS SETOF GEOMETRY
3050   AS $$
3051 DECLARE
3052   geo RECORD;
3053 BEGIN
3054   -- 10000000000 is ~~ 1x1 degree
3055   FOR geo IN select quad_split_geometry(geometry, 0.25, 20) as geom LOOP
3056     RETURN NEXT geo.geom;
3057   END LOOP;
3058   RETURN;
3059 END;
3060 $$
3061 LANGUAGE plpgsql;
3062
3063
3064 CREATE OR REPLACE FUNCTION place_force_delete(placeid BIGINT) RETURNS BOOLEAN
3065   AS $$
3066 DECLARE
3067     osmid BIGINT;
3068     osmtype character(1);
3069     pclass text;
3070     ptype text;
3071 BEGIN
3072   SELECT osm_type, osm_id, class, type FROM placex WHERE place_id = placeid INTO osmtype, osmid, pclass, ptype;
3073   DELETE FROM import_polygon_delete where osm_type = osmtype and osm_id = osmid and class = pclass and type = ptype;
3074   DELETE FROM import_polygon_error where osm_type = osmtype and osm_id = osmid and class = pclass and type = ptype;
3075   -- force delete from place/placex by making it a very small geometry
3076   UPDATE place set geometry = ST_SetSRID(ST_Point(0,0), 4326) where osm_type = osmtype and osm_id = osmid and class = pclass and type = ptype;
3077   DELETE FROM place where osm_type = osmtype and osm_id = osmid and class = pclass and type = ptype;
3078
3079   RETURN TRUE;
3080 END;
3081 $$
3082 LANGUAGE plpgsql;
3083
3084 CREATE OR REPLACE FUNCTION place_force_update(placeid BIGINT) RETURNS BOOLEAN
3085   AS $$
3086 DECLARE
3087   placegeom GEOMETRY;
3088   geom GEOMETRY;
3089   diameter FLOAT;
3090   rank INTEGER;
3091 BEGIN
3092   UPDATE placex SET indexed_status = 2 WHERE place_id = placeid;
3093   SELECT geometry, rank_search FROM placex WHERE place_id = placeid INTO placegeom, rank;
3094   IF placegeom IS NOT NULL AND ST_IsValid(placegeom) THEN
3095     IF ST_GeometryType(placegeom) in ('ST_Polygon','ST_MultiPolygon') THEN
3096       FOR geom IN select split_geometry(placegeom) FROM placex WHERE place_id = placeid LOOP
3097         update placex set indexed_status = 2 where (st_covers(geom, placex.geometry) OR ST_Intersects(geom, placex.geometry)) 
3098         AND rank_search > rank and indexed_status = 0 and ST_geometrytype(placex.geometry) = 'ST_Point' and (rank_search < 28 or name is not null or (rank >= 16 and addr_place is not null));
3099         update placex set indexed_status = 2 where (st_covers(geom, placex.geometry) OR ST_Intersects(geom, placex.geometry)) 
3100         AND rank_search > rank and indexed_status = 0 and ST_geometrytype(placex.geometry) != 'ST_Point' and (rank_search < 28 or name is not null or (rank >= 16 and addr_place is not null));
3101       END LOOP;
3102     ELSE
3103         diameter := 0;
3104         IF rank = 11 THEN
3105           diameter := 0.05;
3106         ELSEIF rank < 18 THEN
3107           diameter := 0.1;
3108         ELSEIF rank < 20 THEN
3109           diameter := 0.05;
3110         ELSEIF rank = 21 THEN
3111           diameter := 0.001;
3112         ELSEIF rank < 24 THEN
3113           diameter := 0.02;
3114         ELSEIF rank < 26 THEN
3115           diameter := 0.002; -- 100 to 200 meters
3116         ELSEIF rank < 28 THEN
3117           diameter := 0.001; -- 50 to 100 meters
3118         END IF;
3119         IF diameter > 0 THEN
3120           IF rank >= 26 THEN
3121             -- roads may cause reparenting for >27 rank places
3122             update placex set indexed_status = 2 where indexed_status = 0 and rank_search > rank and ST_DWithin(placex.geometry, placegeom, diameter);
3123           ELSEIF rank >= 16 THEN
3124             -- up to rank 16, street-less addresses may need reparenting
3125             update placex set indexed_status = 2 where indexed_status = 0 and rank_search > rank and ST_DWithin(placex.geometry, placegeom, diameter) and (rank_search < 28 or name is not null or addr_place is not null);
3126           ELSE
3127             -- for all other places the search terms may change as well
3128             update placex set indexed_status = 2 where indexed_status = 0 and rank_search > rank and ST_DWithin(placex.geometry, placegeom, diameter) and (rank_search < 28 or name is not null);
3129           END IF;
3130         END IF;
3131     END IF;
3132     RETURN TRUE;
3133   END IF;
3134
3135   RETURN FALSE;
3136 END;
3137 $$
3138 LANGUAGE plpgsql;