]> git.openstreetmap.org Git - nominatim.git/blob - docs/admin/Migration.md
force inclusion of extratags used directly by Nominatim
[nominatim.git] / docs / admin / Migration.md
1 # Database Migrations
2
3 Nominatim offers automatic migrations for versions 4.3+. Please follow
4 the following steps:
5
6 * Stop any updates that are potentially running
7 * Update the backend: `pip install -U nominatim-db`
8 * Go to your project directory and run `nominatim admin --migrate`
9 * Update the frontend: `pip install -U nominatim-api`
10 * (optionally) Restart updates
11
12 Below you find additional migrations and hints about other structural and
13 breaking changes. **Please read them before running the migration.**
14
15 !!! note
16     If you are migrating from a version <4.3, you need to install 4.3
17     and migrate to 4.3 first. Then you can migrate to the current
18     version. It is strongly recommended to do a reimport instead.
19
20 ## 5.1.0 -> 5.2.0
21
22 ### Lua import style: required extratags removed
23
24 Tags that are required by Nominatim as extratags are now always included
25 independent of what is defined in the style. The line
26
27     flex.add_for_extratags('required')
28
29 is no longer required in custom styles and will throw an error. Simply
30 remove the line from your style.
31
32 ## 4.5.0 -> 5.0.0
33
34 ### PHP frontend removed
35
36 The PHP frontend has been completely removed. Please switch to the Python
37 frontend.
38
39 Without the PHP code, the `nominatim refresh --website` command is no longer
40 needed. It currently omits a warning and does otherwise nothing. It will be
41 removed in later versions of Nominatim. So make sure you remove it from your
42 scripts.
43
44 ### CMake building removed
45
46 Nominatim can now only be installed via pip. Please follow the installation
47 instructions for the current version to change to pip.
48
49 ### osm2pgsql no longer vendored in
50
51 Nominatim no longer ships its own version of osm2pgsql. Please install a
52 stock version of osm2pgsql from your distribution. See the
53 [installation instruction for osm2pgsql](https://osm2pgsql.org/doc/install.html)
54 for details. A minimum version of 1.8 is required. The current stable versions
55 of Ubuntu and Debian already ship with an appropriate versions. For older
56 installation, you may have to compile a newer osm2pgsql yourself.
57
58 ### Legacy tokenizer removed
59
60 The `legacy` tokenizer is no longer enabled. This tokenizer has been superseded
61 by the `ICU` tokenizer a long time ago. In the unlikely case that your database
62 still uses the `legacy` tokenizer, you must reimport your database.
63
64 ### osm2pgsql style overhauled
65
66 There are some fundamental changes to how customized osm2pgsql styles should
67 be written. The changes are mostly backwards compatible, i.e. custom styles
68 should still work with the new implementation. The only exception is a
69 customization of the `process_tags()` function. This function is no longer
70 considered public and neither are the helper functions used in it.
71 They currently still work but will be removed at some point. If you have
72 been making changes to `process_tags`, please review your style and try
73 to switch to the new convenience functions.
74
75 For more information on the changes, see the
76 [pull request](https://github.com/osm-search/Nominatim/pull/3615)
77 and read the new
78 [customization documentation](https://nominatim.org/release-docs/latest/customize/Import-Styles/).
79
80 ## 4.4.0 -> 4.5.0
81
82 ### New structure for Python packages
83
84 The nominatim Python package has been split into `nominatim-db` and `nominatim-api`.
85 Any imports need to be adapted accordingly.
86
87 If you are running the Python frontend, change the server module from
88 `nominatim.server.falcon.server` to `nominatim_api.server.falcon.server`.
89
90 If you are using the Nominatim library, all imports need to be changed
91 from `nominatim.api.<module>` to `nominatim_api.<module>`.
92
93 If you have written custom tokenizers or sanitizers, the appropriate modules
94 are now found in `nominatim_db`.
95
96 ## 4.2.0 -> 4.3.0
97
98 ### New indexes for reverse lookup
99
100 The reverse lookup algorithm has changed slightly to improve performance.
101 This change needs a different index in the database. The required index
102 will be automatically build during migration. Until the new index is available
103 performance of the /reverse endpoint is significantly reduced. You should
104 therefore either remove traffic from the machine before attempting a
105 version update or create the index manually **before** starting the update
106 using the following SQL:
107
108 ```sql
109 CREATE INDEX IF NOT EXISTS idx_placex_geometry_reverse_lookupPlaceNode
110   ON placex USING gist (ST_Buffer(geometry, reverse_place_diameter(rank_search)))
111   WHERE rank_address between 4 and 25 AND type != 'postcode'
112     AND name is not null AND linked_place_id is null AND osm_type = 'N';
113 ```
114
115 ## 4.0.0 -> 4.1.0
116
117 ### ICU tokenizer is the new default
118
119 Nominatim now installs the [ICU tokenizer](../customize/Tokenizers.md#icu-tokenizer)
120 by default. This only has an effect on newly installed databases. When
121 updating older databases, it keeps its installed tokenizer. If you still
122 run with the legacy tokenizer, make sure to compile Nominatim with the
123 PostgreSQL module, see [Installation](Installation.md#building-nominatim).
124
125 ### geocodejson output changed
126
127 The `type` field of the geocodejson output has changed. It now contains
128 the address class of the object instead of the value of the OSM tag. If
129 your client has used the `type` field, switch them to read `osm_value`
130 instead.
131
132 ## 3.7.0 -> 4.0.0
133
134 ### NOMINATIM_PHRASE_CONFIG removed
135
136 Custom blacklist configurations for special phrases now need to be handed
137 with the `--config` parameter to `nominatim special-phrases`. Alternatively
138 you can put your custom configuration in the project directory in a file
139 named `phrase-settings.json`.
140
141 Version 3.8 also removes the automatic converter for the php format of
142 the configuration in older versions. If you are updating from Nominatim < 3.7
143 and still work with a custom `phrase-settings.php`, you need to manually
144 convert it into a json format.
145
146 ### PHP utils removed
147
148 The old PHP utils have now been removed completely. You need to switch to
149 the appropriate functions of the nominatim  command line tool. See
150 [Introducing `nominatim` command line tool](#introducing-nominatim-command-line-tool)
151 below.
152
153 ## 3.6.0 -> 3.7.0
154
155 ### New format and name of configuration file
156
157 The configuration for an import is now saved in a `.env` file in the project
158 directory. This file follows the dotenv format. For more information, see
159 the [installation chapter](Import.md#configuration-setup-in-env).
160
161 To migrate to the new system, create a new project directory, add the `.env`
162 file and port your custom configuration from `settings/local.php`. Most
163 settings are named similar and only have received a `NOMINATIM_` prefix.
164 Use the default settings in `settings/env.defaults` as a reference.
165
166 ### New location for data files
167
168 External data files for Wikipedia importance, postcodes etc. are no longer
169 expected to reside in the source tree by default. Instead they will be searched
170 in the project directory. If you have an automated setup script you must
171 either adapt the download location or explicitly set the location of the
172 files to the old place in your `.env`.
173
174 ### Introducing `nominatim` command line tool
175
176 The various php utilities have been replaced with a single `nominatim`
177 command line tool. Make sure to adapt any scripts. There is no direct 1:1
178 matching between the old utilities and the commands of nominatim CLI. The
179 following list gives you a list of nominatim sub-commands that contain
180 functionality of each script:
181
182 * ./utils/setup.php: `import`, `freeze`, `refresh`
183 * ./utils/update.php: `replication`, `add-data`, `index`, `refresh`
184 * ./utils/specialphrases.php: `special-phrases`
185 * ./utils/check_import_finished.php: `admin`
186 * ./utils/warm.php: `admin`
187 * ./utils/export.php: `export`
188
189 Try `nominatim <command> --help` for more information about each subcommand.
190
191 `./utils/query.php` no longer exists in its old form. `nominatim search`
192 provides a replacement but returns different output.
193
194 ### Switch to normalized house numbers
195
196 The housenumber column in the placex table uses now normalized version.
197 The automatic migration step will convert the column but this may take a
198 very long time. It is advisable to take the machine offline while doing that.
199
200 ## 3.5.0 -> 3.6.0
201
202 ### Change of layout of search_name_* tables
203
204 The table need a different index for nearest place lookup. Recreate the
205 indexes using the following shell script:
206
207 ```bash
208 for table in `psql -d nominatim -c "SELECT tablename FROM pg_tables WHERE tablename LIKE 'search_name_%'" -tA | grep -v search_name_blank`;
209 do
210     psql -d nominatim -c "DROP INDEX idx_${table}_centroid_place; CREATE INDEX idx_${table}_centroid_place ON ${table} USING gist (centroid) WHERE ((address_rank >= 2) AND (address_rank <= 25)); DROP INDEX idx_${table}_centroid_street; CREATE INDEX idx_${table}_centroid_street ON ${table} USING gist (centroid) WHERE ((address_rank >= 26) AND (address_rank <= 27))";
211 done
212 ```
213
214 ### Removal of html output
215
216 The debugging UI is no longer directly provided with Nominatim. Instead we
217 now provide a simple Javascript application. Please refer to
218 [Setting up the Nominatim UI](Setup-Nominatim-UI.md) for details on how to
219 set up the UI.
220
221 The icons served together with the API responses have been moved to the
222 nominatim-ui project as well. If you want to keep the `icon` field in the
223 response, you need to set `CONST_MapIcon_URL` to the URL of the `/mapicon`
224 directory of nominatim-ui.
225
226 ### Change order during indexing
227
228 When reindexing places during updates, there is now a different order used
229 which needs a different database index. Create it with the following SQL command:
230
231 ```sql
232 CREATE INDEX idx_placex_pendingsector_rank_address
233   ON placex
234   USING BTREE (rank_address, geometry_sector)
235   WHERE indexed_status > 0;
236 ```
237
238 You can then drop the old index with:
239
240 ```sql
241 DROP INDEX idx_placex_pendingsector;
242 ```
243
244 ### Unused index
245
246 This index has been unused ever since the query using it was changed two years ago. Saves about 12GB on a planet installation.
247
248 ```sql
249 DROP INDEX idx_placex_geometry_reverse_lookupPoint;
250 ```
251
252 ### Switching to dotenv
253
254 As part of the work changing the configuration format, the configuration for
255 the website is now using a separate configuration file. To create the
256 configuration file, run the following command after updating:
257
258 ```sh
259 ./utils/setup.php --setup-website
260 ```
261
262 ### Update SQL code
263
264 To update the SQL code to the leatest version run:
265
266 ```
267 ./utils/setup.php --create-functions --enable-diff-updates --create-partition-functions
268 ```
269
270 ## 3.4.0 -> 3.5.0
271
272 ### New Wikipedia/Wikidata importance tables
273
274 The `wikipedia_*` tables have a new format that also includes references to
275 Wikidata. You need to update the computation functions and the tables as
276 follows:
277
278   * download the new Wikipedia tables as described in the import section
279   * reimport the tables: `./utils/setup.php --import-wikipedia-articles`
280   * update the functions: `./utils/setup.php --create-functions --enable-diff-updates`
281   * create a new lookup index:
282 ```sql
283 CREATE INDEX idx_placex_wikidata
284   ON placex
285   USING BTREE ((extratags -> 'wikidata'))
286   WHERE extratags ? 'wikidata'
287     AND class = 'place'
288     AND osm_type = 'N'
289     AND rank_search < 26;
290 ```
291   * compute importance: `./utils/update.php --recompute-importance`
292
293 The last step takes about 10 hours on the full planet.
294
295 Remove one function (it will be recreated in the next step):
296
297 ```sql
298 DROP FUNCTION create_country(hstore,character varying);
299 ```
300
301 Finally, update all SQL functions:
302
303 ```sh
304 ./utils/setup.php --create-functions --enable-diff-updates --create-partition-functions
305 ```
306
307 ## 3.3.0 -> 3.4.0
308
309 ### Reorganisation of location_area_country table
310
311 The table `location_area_country` has been optimized. You need to switch to the
312 new format when you run updates. While updates are disabled, run the following
313 SQL commands:
314
315 ```sql
316 CREATE TABLE location_area_country_new AS
317   SELECT place_id, country_code, geometry FROM location_area_country;
318 DROP TABLE location_area_country;
319 ALTER TABLE location_area_country_new RENAME TO location_area_country;
320 CREATE INDEX idx_location_area_country_geometry ON location_area_country USING GIST (geometry);
321 CREATE INDEX idx_location_area_country_place_id ON location_area_country USING BTREE (place_id);
322 ```
323
324 Finally, update all SQL functions:
325
326 ```sh
327 ./utils/setup.php --create-functions --enable-diff-updates --create-partition-functions
328 ```
329
330 ## 3.2.0 -> 3.3.0
331
332 ### New database connection string (DSN) format
333
334 Previously database connection setting (`CONST_Database_DSN` in `settings/*.php`) had the format
335
336    * (simple) `pgsql://@/nominatim`
337    * (complex) `pgsql://johndoe:secret@machine1.domain.com:1234/db1`
338
339 The new format is
340
341    * (simple) `pgsql:dbname=nominatim`
342    * (complex) `pgsql:dbname=db1;host=machine1.domain.com;port=1234;user=johndoe;password=secret`
343
344 ### Natural Earth country boundaries no longer needed as fallback
345
346 ```sql
347 DROP TABLE country_naturalearthdata;
348 ```
349
350 Finally, update all SQL functions:
351
352 ```sh
353 ./utils/setup.php --create-functions --enable-diff-updates --create-partition-functions
354 ```
355
356 ### Configurable Address Levels
357
358 The new configurable address levels require a new table. Create it with the
359 following command:
360
361 ```sh
362 ./utils/update.php --update-address-levels
363 ```
364
365 ## 3.1.0 -> 3.2.0
366
367 ### New reverse algorithm
368
369 The reverse algorithm has changed and requires new indexes. Run the following
370 SQL statements to create the indexes:
371
372 ```sql
373 CREATE INDEX idx_placex_geometry_reverse_lookupPoint
374   ON placex
375   USING gist (geometry)
376   WHERE (name IS NOT null or housenumber IS NOT null or rank_address BETWEEN 26 AND 27)
377     AND class NOT IN ('railway','tunnel','bridge','man_made')
378     AND rank_address >= 26
379     AND indexed_status = 0
380     AND linked_place_id IS null;
381 CREATE INDEX idx_placex_geometry_reverse_lookupPolygon
382   ON placex USING gist (geometry)
383   WHERE St_GeometryType(geometry) in ('ST_Polygon', 'ST_MultiPolygon')
384     AND rank_address between 4 and 25
385     AND type != 'postcode'
386     AND name is not null
387     AND indexed_status = 0
388     AND linked_place_id is null;
389 CREATE INDEX idx_placex_geometry_reverse_placeNode
390   ON placex USING gist (geometry)
391   WHERE osm_type = 'N'
392     AND rank_search between 5 and 25
393     AND class = 'place'
394     AND type != 'postcode'
395     AND name is not null
396     AND indexed_status = 0
397     AND linked_place_id is null;
398 ```
399
400 You also need to grant the website user access to the `country_osm_grid` table:
401
402 ```sql
403 GRANT SELECT ON table country_osm_grid to "www-user";
404 ```
405
406 Replace the `www-user` with the user name of your website server if necessary.
407
408 You can now drop the unused indexes:
409
410 ```sql
411 DROP INDEX idx_placex_reverse_geometry;
412 ```
413
414 Finally, update all SQL functions:
415
416 ```sh
417 ./utils/setup.php --create-functions --enable-diff-updates --create-partition-functions
418 ```
419
420 ## 3.0.0 -> 3.1.0
421
422 ### Postcode Table
423
424 A new separate table for artificially computed postcode centroids was introduced.
425 Migration to the new format is possible but **not recommended**.
426
427 Create postcode table and indexes, running the following SQL statements:
428
429 ```sql
430 CREATE TABLE location_postcode
431   (place_id BIGINT, parent_place_id BIGINT, rank_search SMALLINT,
432    rank_address SMALLINT, indexed_status SMALLINT, indexed_date TIMESTAMP,
433    country_code varchar(2), postcode TEXT,
434    geometry GEOMETRY(Geometry, 4326));
435 CREATE INDEX idx_postcode_geometry ON location_postcode USING GIST (geometry);
436 CREATE UNIQUE INDEX idx_postcode_id ON location_postcode USING BTREE (place_id);
437 CREATE INDEX idx_postcode_postcode ON location_postcode USING BTREE (postcode);
438 GRANT SELECT ON location_postcode TO "www-data";
439 DROP TYPE IF EXISTS nearfeaturecentr CASCADE;
440 CREATE TYPE nearfeaturecentr AS (
441   place_id BIGINT,
442   keywords int[],
443   rank_address smallint,
444   rank_search smallint,
445   distance float,
446   isguess boolean,
447   postcode TEXT,
448   centroid GEOMETRY
449 );
450 ```
451
452 Add postcode column to `location_area` tables with SQL statement:
453
454 ```sql
455 ALTER TABLE location_area ADD COLUMN postcode TEXT;
456 ```
457
458 Then reimport the functions:
459
460 ```sh
461 ./utils/setup.php --create-functions --enable-diff-updates --create-partition-functions
462 ```
463
464 Create appropriate triggers with SQL:
465
466 ```sql
467 CREATE TRIGGER location_postcode_before_update BEFORE UPDATE ON location_postcode
468     FOR EACH ROW EXECUTE PROCEDURE postcode_update();
469 ```
470
471 Finally populate the postcode table (will take a while):
472
473 ```sh
474 ./utils/setup.php --calculate-postcodes --index --index-noanalyse
475 ```
476
477 This will create a working database. You may also delete the old artificial
478 postcodes now. Note that this may be expensive and is not absolutely necessary.
479 The following SQL statement will remove them:
480
481 ```sql
482 DELETE FROM place_addressline a USING placex p
483  WHERE a.address_place_id = p.place_id and p.osm_type = 'P';
484 ALTER TABLE placex DISABLE TRIGGER USER;
485 DELETE FROM placex WHERE osm_type = 'P';
486 ALTER TABLE placex ENABLE TRIGGER USER;
487 ```