]> git.openstreetmap.org Git - nominatim.git/blob - docs/admin/Migration.md
Merge pull request #4049 from Itz-Agasta/uv
[nominatim.git] / docs / admin / Migration.md
1 # Database Migrations
2
3 Nominatim offers automatic migrations for versions 4.3+. Please follow
4 the following steps:
5
6 * Stop any updates that are potentially running
7 * Update the backend: `pip install -U nominatim-db`
8 * Go to your project directory and run `nominatim admin --migrate`
9 * Update the frontend: `pip install -U nominatim-api`
10 * (optionally) Restart updates
11
12 Below you find additional migrations and hints about other structural and
13 breaking changes. **Please read them before running the migration.**
14
15 !!! note
16     If you are migrating from a version <4.3, you need to install 4.3
17     and migrate to 4.3 first. Then you can migrate to the current
18     version. It is strongly recommended to do a reimport instead.
19
20 ## 5.2.0 -> 5.3.0
21
22 #### Expensive table migrations
23
24 This version introduces new tables for postcodes, interpolations and
25 associatedStreet relations. Migration is possible but will take a bit
26 longer. It is recommended to take Nominatim offline while migrating to 5.3.
27
28 ## 5.1.0 -> 5.2.0
29
30 ### Lua import style: required extratags removed
31
32 Tags that are required by Nominatim as extratags are now always included
33 independent of what is defined in the style. The line
34
35     flex.add_for_extratags('required')
36
37 is no longer required in custom styles and will throw an error. Simply
38 remove the line from your style.
39
40 ## 4.5.0 -> 5.0.0
41
42 ### PHP frontend removed
43
44 The PHP frontend has been completely removed. Please switch to the Python
45 frontend.
46
47 Without the PHP code, the `nominatim refresh --website` command is no longer
48 needed. It currently omits a warning and does otherwise nothing. It will be
49 removed in later versions of Nominatim. So make sure you remove it from your
50 scripts.
51
52 ### CMake building removed
53
54 Nominatim can now only be installed via pip. Please follow the installation
55 instructions for the current version to change to pip.
56
57 ### osm2pgsql no longer vendored in
58
59 Nominatim no longer ships its own version of osm2pgsql. Please install a
60 stock version of osm2pgsql from your distribution. See the
61 [installation instruction for osm2pgsql](https://osm2pgsql.org/doc/install.html)
62 for details. A minimum version of 1.8 is required. The current stable versions
63 of Ubuntu and Debian already ship with an appropriate versions. For older
64 installations, you may have to compile a newer osm2pgsql yourself.
65
66 ### Legacy tokenizer removed
67
68 The `legacy` tokenizer is no longer enabled. This tokenizer has been superseded
69 by the `ICU` tokenizer a long time ago. In the unlikely case that your database
70 still uses the `legacy` tokenizer, you must reimport your database.
71
72 ### osm2pgsql style overhauled
73
74 There are some fundamental changes to how customized osm2pgsql styles should
75 be written. The changes are mostly backwards compatible, i.e. custom styles
76 should still work with the new implementation. The only exception is a
77 customization of the `process_tags()` function. This function is no longer
78 considered public and neither are the helper functions used in it.
79 They currently still work but will be removed at some point. If you have
80 been making changes to `process_tags`, please review your style and try
81 to switch to the new convenience functions.
82
83 For more information on the changes, see the
84 [pull request](https://github.com/osm-search/Nominatim/pull/3615)
85 and read the new
86 [customization documentation](https://nominatim.org/release-docs/latest/customize/Import-Styles/).
87
88 ## 4.4.0 -> 4.5.0
89
90 ### New structure for Python packages
91
92 The nominatim Python package has been split into `nominatim-db` and `nominatim-api`.
93 Any imports need to be adapted accordingly.
94
95 If you are running the Python frontend, change the server module from
96 `nominatim.server.falcon.server` to `nominatim_api.server.falcon.server`.
97
98 If you are using the Nominatim library, all imports need to be changed
99 from `nominatim.api.<module>` to `nominatim_api.<module>`.
100
101 If you have written custom tokenizers or sanitizers, the appropriate modules
102 are now found in `nominatim_db`.
103
104 ## 4.2.0 -> 4.3.0
105
106 ### New indexes for reverse lookup
107
108 The reverse lookup algorithm has changed slightly to improve performance.
109 This change needs a different index in the database. The required index
110 will be automatically build during migration. Until the new index is available
111 performance of the /reverse endpoint is significantly reduced. You should
112 therefore either remove traffic from the machine before attempting a
113 version update or create the index manually **before** starting the update
114 using the following SQL:
115
116 ```sql
117 CREATE INDEX IF NOT EXISTS idx_placex_geometry_reverse_lookupPlaceNode
118   ON placex USING gist (ST_Buffer(geometry, reverse_place_diameter(rank_search)))
119   WHERE rank_address between 4 and 25 AND type != 'postcode'
120     AND name is not null AND linked_place_id is null AND osm_type = 'N';
121 ```
122
123 ## 4.0.0 -> 4.1.0
124
125 ### ICU tokenizer is the new default
126
127 Nominatim now installs the [ICU tokenizer](../customize/Tokenizers.md#icu-tokenizer)
128 by default. This only has an effect on newly installed databases. When
129 updating older databases, it keeps its installed tokenizer. If you still
130 run with the legacy tokenizer, make sure to compile Nominatim with the
131 PostgreSQL module, see [Installation](Installation.md#building-nominatim).
132
133 ### geocodejson output changed
134
135 The `type` field of the geocodejson output has changed. It now contains
136 the address class of the object instead of the value of the OSM tag. If
137 your client has used the `type` field, switch them to read `osm_value`
138 instead.
139
140 ## 3.7.0 -> 4.0.0
141
142 ### NOMINATIM_PHRASE_CONFIG removed
143
144 Custom blacklist configurations for special phrases now need to be handed
145 with the `--config` parameter to `nominatim special-phrases`. Alternatively
146 you can put your custom configuration in the project directory in a file
147 named `phrase-settings.json`.
148
149 Version 3.8 also removes the automatic converter for the php format of
150 the configuration in older versions. If you are updating from Nominatim < 3.7
151 and still work with a custom `phrase-settings.php`, you need to manually
152 convert it into a json format.
153
154 ### PHP utils removed
155
156 The old PHP utils have now been removed completely. You need to switch to
157 the appropriate functions of the nominatim  command line tool. See
158 [Introducing `nominatim` command line tool](#introducing-nominatim-command-line-tool)
159 below.
160
161 ## 3.6.0 -> 3.7.0
162
163 ### New format and name of configuration file
164
165 The configuration for an import is now saved in a `.env` file in the project
166 directory. This file follows the dotenv format. For more information, see
167 the [installation chapter](Import.md#configuration-setup-in-env).
168
169 To migrate to the new system, create a new project directory, add the `.env`
170 file and port your custom configuration from `settings/local.php`. Most
171 settings are named similar and only have received a `NOMINATIM_` prefix.
172 Use the default settings in `settings/env.defaults` as a reference.
173
174 ### New location for data files
175
176 External data files for Wikipedia importance, postcodes etc. are no longer
177 expected to reside in the source tree by default. Instead they will be searched
178 in the project directory. If you have an automated setup script you must
179 either adapt the download location or explicitly set the location of the
180 files to the old place in your `.env`.
181
182 ### Introducing `nominatim` command line tool
183
184 The various php utilities have been replaced with a single `nominatim`
185 command line tool. Make sure to adapt any scripts. There is no direct 1:1
186 matching between the old utilities and the commands of nominatim CLI. The
187 following list gives you a list of nominatim sub-commands that contain
188 functionality of each script:
189
190 * ./utils/setup.php: `import`, `freeze`, `refresh`
191 * ./utils/update.php: `replication`, `add-data`, `index`, `refresh`
192 * ./utils/specialphrases.php: `special-phrases`
193 * ./utils/check_import_finished.php: `admin`
194 * ./utils/warm.php: `admin`
195 * ./utils/export.php: `export`
196
197 Try `nominatim <command> --help` for more information about each subcommand.
198
199 `./utils/query.php` no longer exists in its old form. `nominatim search`
200 provides a replacement but returns different output.
201
202 ### Switch to normalized house numbers
203
204 The housenumber column in the placex table uses now normalized version.
205 The automatic migration step will convert the column but this may take a
206 very long time. It is advisable to take the machine offline while doing that.
207
208 ## 3.5.0 -> 3.6.0
209
210 ### Change of layout of search_name_* tables
211
212 The table need a different index for nearest place lookup. Recreate the
213 indexes using the following shell script:
214
215 ```bash
216 for table in `psql -d nominatim -c "SELECT tablename FROM pg_tables WHERE tablename LIKE 'search_name_%'" -tA | grep -v search_name_blank`;
217 do
218     psql -d nominatim -c "DROP INDEX idx_${table}_centroid_place; CREATE INDEX idx_${table}_centroid_place ON ${table} USING gist (centroid) WHERE ((address_rank >= 2) AND (address_rank <= 25)); DROP INDEX idx_${table}_centroid_street; CREATE INDEX idx_${table}_centroid_street ON ${table} USING gist (centroid) WHERE ((address_rank >= 26) AND (address_rank <= 27))";
219 done
220 ```
221
222 ### Removal of html output
223
224 The debugging UI is no longer directly provided with Nominatim. Instead we
225 now provide a simple Javascript application. Please refer to
226 [Setting up the Nominatim UI](Setup-Nominatim-UI.md) for details on how to
227 set up the UI.
228
229 The icons served together with the API responses have been moved to the
230 nominatim-ui project as well. If you want to keep the `icon` field in the
231 response, you need to set `CONST_MapIcon_URL` to the URL of the `/mapicon`
232 directory of nominatim-ui.
233
234 ### Change order during indexing
235
236 When reindexing places during updates, there is now a different order used
237 which needs a different database index. Create it with the following SQL command:
238
239 ```sql
240 CREATE INDEX idx_placex_pendingsector_rank_address
241   ON placex
242   USING BTREE (rank_address, geometry_sector)
243   WHERE indexed_status > 0;
244 ```
245
246 You can then drop the old index with:
247
248 ```sql
249 DROP INDEX idx_placex_pendingsector;
250 ```
251
252 ### Unused index
253
254 This index has been unused ever since the query using it was changed two years ago. Saves about 12GB on a planet installation.
255
256 ```sql
257 DROP INDEX idx_placex_geometry_reverse_lookupPoint;
258 ```
259
260 ### Switching to dotenv
261
262 As part of the work changing the configuration format, the configuration for
263 the website is now using a separate configuration file. To create the
264 configuration file, run the following command after updating:
265
266 ```sh
267 ./utils/setup.php --setup-website
268 ```
269
270 ### Update SQL code
271
272 To update the SQL code to the leatest version run:
273
274 ```
275 ./utils/setup.php --create-functions --enable-diff-updates --create-partition-functions
276 ```
277
278 ## 3.4.0 -> 3.5.0
279
280 ### New Wikipedia/Wikidata importance tables
281
282 The `wikipedia_*` tables have a new format that also includes references to
283 Wikidata. You need to update the computation functions and the tables as
284 follows:
285
286   * download the new Wikipedia tables as described in the import section
287   * reimport the tables: `./utils/setup.php --import-wikipedia-articles`
288   * update the functions: `./utils/setup.php --create-functions --enable-diff-updates`
289   * create a new lookup index:
290 ```sql
291 CREATE INDEX idx_placex_wikidata
292   ON placex
293   USING BTREE ((extratags -> 'wikidata'))
294   WHERE extratags ? 'wikidata'
295     AND class = 'place'
296     AND osm_type = 'N'
297     AND rank_search < 26;
298 ```
299   * compute importance: `./utils/update.php --recompute-importance`
300
301 The last step takes about 10 hours on the full planet.
302
303 Remove one function (it will be recreated in the next step):
304
305 ```sql
306 DROP FUNCTION create_country(hstore,character varying);
307 ```
308
309 Finally, update all SQL functions:
310
311 ```sh
312 ./utils/setup.php --create-functions --enable-diff-updates --create-partition-functions
313 ```
314
315 ## 3.3.0 -> 3.4.0
316
317 ### Reorganisation of location_area_country table
318
319 The table `location_area_country` has been optimized. You need to switch to the
320 new format when you run updates. While updates are disabled, run the following
321 SQL commands:
322
323 ```sql
324 CREATE TABLE location_area_country_new AS
325   SELECT place_id, country_code, geometry FROM location_area_country;
326 DROP TABLE location_area_country;
327 ALTER TABLE location_area_country_new RENAME TO location_area_country;
328 CREATE INDEX idx_location_area_country_geometry ON location_area_country USING GIST (geometry);
329 CREATE INDEX idx_location_area_country_place_id ON location_area_country USING BTREE (place_id);
330 ```
331
332 Finally, update all SQL functions:
333
334 ```sh
335 ./utils/setup.php --create-functions --enable-diff-updates --create-partition-functions
336 ```
337
338 ## 3.2.0 -> 3.3.0
339
340 ### New database connection string (DSN) format
341
342 Previously database connection setting (`CONST_Database_DSN` in `settings/*.php`) had the format
343
344    * (simple) `pgsql://@/nominatim`
345    * (complex) `pgsql://johndoe:secret@machine1.domain.com:1234/db1`
346
347 The new format is
348
349    * (simple) `pgsql:dbname=nominatim`
350    * (complex) `pgsql:dbname=db1;host=machine1.domain.com;port=1234;user=johndoe;password=secret`
351
352 ### Natural Earth country boundaries no longer needed as fallback
353
354 ```sql
355 DROP TABLE country_naturalearthdata;
356 ```
357
358 Finally, update all SQL functions:
359
360 ```sh
361 ./utils/setup.php --create-functions --enable-diff-updates --create-partition-functions
362 ```
363
364 ### Configurable Address Levels
365
366 The new configurable address levels require a new table. Create it with the
367 following command:
368
369 ```sh
370 ./utils/update.php --update-address-levels
371 ```
372
373 ## 3.1.0 -> 3.2.0
374
375 ### New reverse algorithm
376
377 The reverse algorithm has changed and requires new indexes. Run the following
378 SQL statements to create the indexes:
379
380 ```sql
381 CREATE INDEX idx_placex_geometry_reverse_lookupPoint
382   ON placex
383   USING gist (geometry)
384   WHERE (name IS NOT null or housenumber IS NOT null or rank_address BETWEEN 26 AND 27)
385     AND class NOT IN ('railway','tunnel','bridge','man_made')
386     AND rank_address >= 26
387     AND indexed_status = 0
388     AND linked_place_id IS null;
389 CREATE INDEX idx_placex_geometry_reverse_lookupPolygon
390   ON placex USING gist (geometry)
391   WHERE St_GeometryType(geometry) in ('ST_Polygon', 'ST_MultiPolygon')
392     AND rank_address between 4 and 25
393     AND type != 'postcode'
394     AND name is not null
395     AND indexed_status = 0
396     AND linked_place_id is null;
397 CREATE INDEX idx_placex_geometry_reverse_placeNode
398   ON placex USING gist (geometry)
399   WHERE osm_type = 'N'
400     AND rank_search between 5 and 25
401     AND class = 'place'
402     AND type != 'postcode'
403     AND name is not null
404     AND indexed_status = 0
405     AND linked_place_id is null;
406 ```
407
408 You also need to grant the website user access to the `country_osm_grid` table:
409
410 ```sql
411 GRANT SELECT ON table country_osm_grid to "www-user";
412 ```
413
414 Replace the `www-user` with the user name of your website server if necessary.
415
416 You can now drop the unused indexes:
417
418 ```sql
419 DROP INDEX idx_placex_reverse_geometry;
420 ```
421
422 Finally, update all SQL functions:
423
424 ```sh
425 ./utils/setup.php --create-functions --enable-diff-updates --create-partition-functions
426 ```
427
428 ## 3.0.0 -> 3.1.0
429
430 ### Postcode Table
431
432 A new separate table for artificially computed postcode centroids was introduced.
433 Migration to the new format is possible but **not recommended**.
434
435 Create postcode table and indexes, running the following SQL statements:
436
437 ```sql
438 CREATE TABLE location_postcode
439   (place_id BIGINT, parent_place_id BIGINT, rank_search SMALLINT,
440    rank_address SMALLINT, indexed_status SMALLINT, indexed_date TIMESTAMP,
441    country_code varchar(2), postcode TEXT,
442    geometry GEOMETRY(Geometry, 4326));
443 CREATE INDEX idx_postcode_geometry ON location_postcode USING GIST (geometry);
444 CREATE UNIQUE INDEX idx_postcode_id ON location_postcode USING BTREE (place_id);
445 CREATE INDEX idx_postcode_postcode ON location_postcode USING BTREE (postcode);
446 GRANT SELECT ON location_postcode TO "www-data";
447 DROP TYPE IF EXISTS nearfeaturecentr CASCADE;
448 CREATE TYPE nearfeaturecentr AS (
449   place_id BIGINT,
450   keywords int[],
451   rank_address smallint,
452   rank_search smallint,
453   distance float,
454   isguess boolean,
455   postcode TEXT,
456   centroid GEOMETRY
457 );
458 ```
459
460 Add postcode column to `location_area` tables with SQL statement:
461
462 ```sql
463 ALTER TABLE location_area ADD COLUMN postcode TEXT;
464 ```
465
466 Then reimport the functions:
467
468 ```sh
469 ./utils/setup.php --create-functions --enable-diff-updates --create-partition-functions
470 ```
471
472 Create appropriate triggers with SQL:
473
474 ```sql
475 CREATE TRIGGER location_postcode_before_update BEFORE UPDATE ON location_postcode
476     FOR EACH ROW EXECUTE PROCEDURE postcode_update();
477 ```
478
479 Finally populate the postcode table (will take a while):
480
481 ```sh
482 ./utils/setup.php --calculate-postcodes --index --index-noanalyse
483 ```
484
485 This will create a working database. You may also delete the old artificial
486 postcodes now. Note that this may be expensive and is not absolutely necessary.
487 The following SQL statement will remove them:
488
489 ```sql
490 DELETE FROM place_addressline a USING placex p
491  WHERE a.address_place_id = p.place_id and p.osm_type = 'P';
492 ALTER TABLE placex DISABLE TRIGGER USER;
493 DELETE FROM placex WHERE osm_type = 'P';
494 ALTER TABLE placex ENABLE TRIGGER USER;
495 ```