]> git.openstreetmap.org Git - nominatim.git/blob - lib/setup/SetupClass.php
setup: escape arguments when executing shell commands (psql, createdb)
[nominatim.git] / lib / setup / SetupClass.php
1 <?php
2
3 namespace Nominatim\Setup;
4
5 require_once(CONST_BasePath.'/lib/setup/AddressLevelParser.php');
6
7 class SetupFunctions
8 {
9     protected $iCacheMemory;
10     protected $iInstances;
11     protected $sModulePath;
12     protected $aDSNInfo;
13     protected $bVerbose;
14     protected $sIgnoreErrors;
15     protected $bEnableDiffUpdates;
16     protected $bEnableDebugStatements;
17     protected $bNoPartitions;
18     protected $oDB = null;
19
20     public function __construct(array $aCMDResult)
21     {
22         // by default, use all but one processor, but never more than 15.
23         $this->iInstances = isset($aCMDResult['threads'])
24             ? $aCMDResult['threads']
25             : (min(16, getProcessorCount()) - 1);
26
27         if ($this->iInstances < 1) {
28             $this->iInstances = 1;
29             warn('resetting threads to '.$this->iInstances);
30         }
31
32         // Assume we can steal all the cache memory in the box (unless told otherwise)
33         if (isset($aCMDResult['osm2pgsql-cache'])) {
34             $this->iCacheMemory = $aCMDResult['osm2pgsql-cache'];
35         } else {
36             $this->iCacheMemory = getCacheMemoryMB();
37         }
38
39         $this->sModulePath = CONST_Database_Module_Path;
40         info('module path: ' . $this->sModulePath);
41
42         // parse database string
43         $this->aDSNInfo = \Nominatim\DB::parseDSN(CONST_Database_DSN);
44         if (!isset($this->aDSNInfo['port'])) {
45             $this->aDSNInfo['port'] = 5432;
46         }
47
48         // setting member variables based on command line options stored in $aCMDResult
49         $this->bVerbose = $aCMDResult['verbose'];
50
51         //setting default values which are not set by the update.php array
52         if (isset($aCMDResult['ignore-errors'])) {
53             $this->sIgnoreErrors = $aCMDResult['ignore-errors'];
54         } else {
55             $this->sIgnoreErrors = false;
56         }
57         if (isset($aCMDResult['enable-debug-statements'])) {
58             $this->bEnableDebugStatements = $aCMDResult['enable-debug-statements'];
59         } else {
60             $this->bEnableDebugStatements = false;
61         }
62         if (isset($aCMDResult['no-partitions'])) {
63             $this->bNoPartitions = $aCMDResult['no-partitions'];
64         } else {
65             $this->bNoPartitions = false;
66         }
67         if (isset($aCMDResult['enable-diff-updates'])) {
68             $this->bEnableDiffUpdates = $aCMDResult['enable-diff-updates'];
69         } else {
70             $this->bEnableDiffUpdates = false;
71         }
72     }
73
74     public function createDB()
75     {
76         info('Create DB');
77         $oDB = new \Nominatim\DB;
78
79         if ($oDB->databaseExists()) {
80             fail('database already exists ('.CONST_Database_DSN.')');
81         }
82
83         $sCreateDBCmd = 'createdb -E UTF-8'
84             .' -p '.escapeshellarg($this->aDSNInfo['port'])
85             .' '.escapeshellarg($this->aDSNInfo['database']);
86         if (isset($this->aDSNInfo['username'])) {
87             $sCreateDBCmd .= ' -U '.escapeshellarg($this->aDSNInfo['username']);
88         }
89
90         if (isset($this->aDSNInfo['hostspec'])) {
91             $sCreateDBCmd .= ' -h '.escapeshellarg($this->aDSNInfo['hostspec']);
92         }
93
94         $result = $this->runWithPgEnv($sCreateDBCmd);
95         if ($result != 0) fail('Error executing external command: '.$sCreateDBCmd);
96     }
97
98     public function connect()
99     {
100         $this->oDB = new \Nominatim\DB();
101         $this->oDB->connect();
102     }
103
104     public function setupDB()
105     {
106         info('Setup DB');
107
108         $fPostgresVersion = $this->oDB->getPostgresVersion();
109         echo 'Postgres version found: '.$fPostgresVersion."\n";
110
111         if ($fPostgresVersion < 9.03) {
112             fail('Minimum supported version of Postgresql is 9.3.');
113         }
114
115         $this->pgsqlRunScript('CREATE EXTENSION IF NOT EXISTS hstore');
116         $this->pgsqlRunScript('CREATE EXTENSION IF NOT EXISTS postgis');
117
118         $fPostgisVersion = $this->oDB->getPostgisVersion();
119         echo 'Postgis version found: '.$fPostgisVersion."\n";
120
121         if ($fPostgisVersion < 2.2) {
122             echo "Minimum required Postgis version 2.2\n";
123             exit(1);
124         }
125
126         $i = $this->oDB->getOne("select count(*) from pg_user where usename = '".CONST_Database_Web_User."'");
127         if ($i == 0) {
128             echo "\nERROR: Web user '".CONST_Database_Web_User."' does not exist. Create it with:\n";
129             echo "\n          createuser ".CONST_Database_Web_User."\n\n";
130             exit(1);
131         }
132
133         // Try accessing the C module, so we know early if something is wrong
134         checkModulePresence(); // raises exception on failure
135
136         if (!file_exists(CONST_ExtraDataPath.'/country_osm_grid.sql.gz')) {
137             echo 'Error: you need to download the country_osm_grid first:';
138             echo "\n    wget -O ".CONST_ExtraDataPath."/country_osm_grid.sql.gz https://www.nominatim.org/data/country_grid.sql.gz\n";
139             exit(1);
140         }
141         $this->pgsqlRunScriptFile(CONST_BasePath.'/data/country_name.sql');
142         $this->pgsqlRunScriptFile(CONST_BasePath.'/data/country_osm_grid.sql.gz');
143         $this->pgsqlRunScriptFile(CONST_BasePath.'/data/gb_postcode_table.sql');
144         $this->pgsqlRunScriptFile(CONST_BasePath.'/data/us_postcode_table.sql');
145
146         $sPostcodeFilename = CONST_BasePath.'/data/gb_postcode_data.sql.gz';
147         if (file_exists($sPostcodeFilename)) {
148             $this->pgsqlRunScriptFile($sPostcodeFilename);
149         } else {
150             warn('optional external GB postcode table file ('.$sPostcodeFilename.') not found. Skipping.');
151         }
152
153         $sPostcodeFilename = CONST_BasePath.'/data/us_postcode_data.sql.gz';
154         if (file_exists($sPostcodeFilename)) {
155             $this->pgsqlRunScriptFile($sPostcodeFilename);
156         } else {
157             warn('optional external US postcode table file ('.$sPostcodeFilename.') not found. Skipping.');
158         }
159
160         if ($this->bNoPartitions) {
161             $this->pgsqlRunScript('update country_name set partition = 0');
162         }
163
164         // the following will be needed by createFunctions later but
165         // is only defined in the subsequently called createTables
166         // Create dummies here that will be overwritten by the proper
167         // versions in create-tables.
168         $this->pgsqlRunScript('CREATE TABLE IF NOT EXISTS place_boundingbox ()');
169         $this->pgsqlRunScript('CREATE TYPE wikipedia_article_match AS ()', false);
170     }
171
172     public function importData($sOSMFile)
173     {
174         info('Import data');
175
176         $osm2pgsql = CONST_Osm2pgsql_Binary;
177         if (!file_exists($osm2pgsql)) {
178             echo "Check CONST_Osm2pgsql_Binary in your local settings file.\n";
179             echo "Normally you should not need to set this manually.\n";
180             fail("osm2pgsql not found in '$osm2pgsql'");
181         }
182
183         $osm2pgsql .= ' -S '.escapeshellarg(CONST_Import_Style);
184
185         if (!is_null(CONST_Osm2pgsql_Flatnode_File) && CONST_Osm2pgsql_Flatnode_File) {
186             $osm2pgsql .= ' --flat-nodes '.escapeshellarg(CONST_Osm2pgsql_Flatnode_File);
187         }
188
189         if (CONST_Tablespace_Osm2pgsql_Data)
190             $osm2pgsql .= ' --tablespace-slim-data '.escapeshellarg(CONST_Tablespace_Osm2pgsql_Data);
191         if (CONST_Tablespace_Osm2pgsql_Index)
192             $osm2pgsql .= ' --tablespace-slim-index '.escapeshellarg(CONST_Tablespace_Osm2pgsql_Index);
193         if (CONST_Tablespace_Place_Data)
194             $osm2pgsql .= ' --tablespace-main-data '.escapeshellarg(CONST_Tablespace_Place_Data);
195         if (CONST_Tablespace_Place_Index)
196             $osm2pgsql .= ' --tablespace-main-index '.escapeshellarg(CONST_Tablespace_Place_Index);
197         $osm2pgsql .= ' -lsc -O gazetteer --hstore --number-processes 1';
198         $osm2pgsql .= ' -C '.escapeshellarg($this->iCacheMemory);
199         $osm2pgsql .= ' -P '.escapeshellarg($this->aDSNInfo['port']);
200         if (isset($this->aDSNInfo['username'])) {
201             $osm2pgsql .= ' -U '.escapeshellarg($this->aDSNInfo['username']);
202         }
203         if (isset($this->aDSNInfo['hostspec'])) {
204             $osm2pgsql .= ' -H '.escapeshellarg($this->aDSNInfo['hostspec']);
205         }
206         $osm2pgsql .= ' -d '.escapeshellarg($this->aDSNInfo['database']).' '.escapeshellarg($sOSMFile);
207
208         $this->runWithPgEnv($osm2pgsql);
209
210         if (!$this->sIgnoreErrors && !$this->oDB->getRow('select * from place limit 1')) {
211             fail('No Data');
212         }
213     }
214
215     public function createFunctions()
216     {
217         info('Create Functions');
218
219         // Try accessing the C module, so we know early if something is wrong
220         checkModulePresence(); // raises exception on failure
221
222         $this->createSqlFunctions();
223     }
224
225     public function createTables($bReverseOnly = false)
226     {
227         info('Create Tables');
228
229         $sTemplate = file_get_contents(CONST_BasePath.'/sql/tables.sql');
230         $sTemplate = str_replace('{www-user}', CONST_Database_Web_User, $sTemplate);
231         $sTemplate = $this->replaceTablespace(
232             '{ts:address-data}',
233             CONST_Tablespace_Address_Data,
234             $sTemplate
235         );
236         $sTemplate = $this->replaceTablespace(
237             '{ts:address-index}',
238             CONST_Tablespace_Address_Index,
239             $sTemplate
240         );
241         $sTemplate = $this->replaceTablespace(
242             '{ts:search-data}',
243             CONST_Tablespace_Search_Data,
244             $sTemplate
245         );
246         $sTemplate = $this->replaceTablespace(
247             '{ts:search-index}',
248             CONST_Tablespace_Search_Index,
249             $sTemplate
250         );
251         $sTemplate = $this->replaceTablespace(
252             '{ts:aux-data}',
253             CONST_Tablespace_Aux_Data,
254             $sTemplate
255         );
256         $sTemplate = $this->replaceTablespace(
257             '{ts:aux-index}',
258             CONST_Tablespace_Aux_Index,
259             $sTemplate
260         );
261
262         $this->pgsqlRunScript($sTemplate, false);
263
264         if ($bReverseOnly) {
265             $this->pgExec('DROP TABLE search_name');
266         }
267
268         $oAlParser = new AddressLevelParser(CONST_Address_Level_Config);
269         $oAlParser->createTable($this->oDB, 'address_levels');
270     }
271
272     public function createPartitionTables()
273     {
274         info('Create Partition Tables');
275
276         $sTemplate = file_get_contents(CONST_BasePath.'/sql/partition-tables.src.sql');
277         $sTemplate = $this->replaceTablespace(
278             '{ts:address-data}',
279             CONST_Tablespace_Address_Data,
280             $sTemplate
281         );
282
283         $sTemplate = $this->replaceTablespace(
284             '{ts:address-index}',
285             CONST_Tablespace_Address_Index,
286             $sTemplate
287         );
288
289         $sTemplate = $this->replaceTablespace(
290             '{ts:search-data}',
291             CONST_Tablespace_Search_Data,
292             $sTemplate
293         );
294
295         $sTemplate = $this->replaceTablespace(
296             '{ts:search-index}',
297             CONST_Tablespace_Search_Index,
298             $sTemplate
299         );
300
301         $sTemplate = $this->replaceTablespace(
302             '{ts:aux-data}',
303             CONST_Tablespace_Aux_Data,
304             $sTemplate
305         );
306
307         $sTemplate = $this->replaceTablespace(
308             '{ts:aux-index}',
309             CONST_Tablespace_Aux_Index,
310             $sTemplate
311         );
312
313         $this->pgsqlRunPartitionScript($sTemplate);
314     }
315
316     public function createPartitionFunctions()
317     {
318         info('Create Partition Functions');
319
320         $sTemplate = file_get_contents(CONST_BasePath.'/sql/partition-functions.src.sql');
321         $this->pgsqlRunPartitionScript($sTemplate);
322     }
323
324     public function importWikipediaArticles()
325     {
326         $sWikiArticlesFile = CONST_Wikipedia_Data_Path.'/wikipedia_article.sql.bin';
327         $sWikiRedirectsFile = CONST_Wikipedia_Data_Path.'/wikipedia_redirect.sql.bin';
328         if (file_exists($sWikiArticlesFile)) {
329             info('Importing wikipedia articles');
330             $this->pgsqlRunDropAndRestore($sWikiArticlesFile);
331         } else {
332             warn('wikipedia article dump file not found - places will have default importance');
333         }
334         if (file_exists($sWikiRedirectsFile)) {
335             info('Importing wikipedia redirects');
336             $this->pgsqlRunDropAndRestore($sWikiRedirectsFile);
337         } else {
338             warn('wikipedia redirect dump file not found - some place importance values may be missing');
339         }
340     }
341
342     public function loadData($bDisableTokenPrecalc)
343     {
344         info('Drop old Data');
345
346         $this->pgExec('TRUNCATE word');
347         echo '.';
348         $this->pgExec('TRUNCATE placex');
349         echo '.';
350         $this->pgExec('TRUNCATE location_property_osmline');
351         echo '.';
352         $this->pgExec('TRUNCATE place_addressline');
353         echo '.';
354         $this->pgExec('TRUNCATE place_boundingbox');
355         echo '.';
356         $this->pgExec('TRUNCATE location_area');
357         echo '.';
358         if (!$this->dbReverseOnly()) {
359             $this->pgExec('TRUNCATE search_name');
360             echo '.';
361         }
362         $this->pgExec('TRUNCATE search_name_blank');
363         echo '.';
364         $this->pgExec('DROP SEQUENCE seq_place');
365         echo '.';
366         $this->pgExec('CREATE SEQUENCE seq_place start 100000');
367         echo '.';
368
369         $sSQL = 'select distinct partition from country_name';
370         $aPartitions = $this->oDB->getCol($sSQL);
371
372         if (!$this->bNoPartitions) $aPartitions[] = 0;
373         foreach ($aPartitions as $sPartition) {
374             $this->pgExec('TRUNCATE location_road_'.$sPartition);
375             echo '.';
376         }
377
378         // used by getorcreate_word_id to ignore frequent partial words
379         $sSQL = 'CREATE OR REPLACE FUNCTION get_maxwordfreq() RETURNS integer AS ';
380         $sSQL .= '$$ SELECT '.CONST_Max_Word_Frequency.' as maxwordfreq; $$ LANGUAGE SQL IMMUTABLE';
381         $this->pgExec($sSQL);
382         echo ".\n";
383
384         // pre-create the word list
385         if (!$bDisableTokenPrecalc) {
386             info('Loading word list');
387             $this->pgsqlRunScriptFile(CONST_BasePath.'/data/words.sql');
388         }
389
390         info('Load Data');
391         $sColumns = 'osm_type, osm_id, class, type, name, admin_level, address, extratags, geometry';
392
393         $aDBInstances = array();
394         $iLoadThreads = max(1, $this->iInstances - 1);
395         for ($i = 0; $i < $iLoadThreads; $i++) {
396             // https://secure.php.net/manual/en/function.pg-connect.php
397             $DSN = CONST_Database_DSN;
398             $DSN = preg_replace('/^pgsql:/', '', $DSN);
399             $DSN = preg_replace('/;/', ' ', $DSN);
400             $aDBInstances[$i] = pg_connect($DSN, PGSQL_CONNECT_FORCE_NEW);
401             pg_ping($aDBInstances[$i]);
402         }
403
404         for ($i = 0; $i < $iLoadThreads; $i++) {
405             $sSQL = "INSERT INTO placex ($sColumns) SELECT $sColumns FROM place WHERE osm_id % $iLoadThreads = $i";
406             $sSQL .= " and not (class='place' and type='houses' and osm_type='W'";
407             $sSQL .= "          and ST_GeometryType(geometry) = 'ST_LineString')";
408             $sSQL .= ' and ST_IsValid(geometry)';
409             if ($this->bVerbose) echo "$sSQL\n";
410             if (!pg_send_query($aDBInstances[$i], $sSQL)) {
411                 fail(pg_last_error($aDBInstances[$i]));
412             }
413         }
414
415         // last thread for interpolation lines
416         // https://secure.php.net/manual/en/function.pg-connect.php
417         $DSN = CONST_Database_DSN;
418         $DSN = preg_replace('/^pgsql:/', '', $DSN);
419         $DSN = preg_replace('/;/', ' ', $DSN);
420         $aDBInstances[$iLoadThreads] = pg_connect($DSN, PGSQL_CONNECT_FORCE_NEW);
421         pg_ping($aDBInstances[$iLoadThreads]);
422         $sSQL = 'insert into location_property_osmline';
423         $sSQL .= ' (osm_id, address, linegeo)';
424         $sSQL .= ' SELECT osm_id, address, geometry from place where ';
425         $sSQL .= "class='place' and type='houses' and osm_type='W' and ST_GeometryType(geometry) = 'ST_LineString'";
426         if ($this->bVerbose) echo "$sSQL\n";
427         if (!pg_send_query($aDBInstances[$iLoadThreads], $sSQL)) {
428             fail(pg_last_error($aDBInstances[$iLoadThreads]));
429         }
430
431         $bFailed = false;
432         for ($i = 0; $i <= $iLoadThreads; $i++) {
433             while (($hPGresult = pg_get_result($aDBInstances[$i])) !== false) {
434                 $resultStatus = pg_result_status($hPGresult);
435                 // PGSQL_EMPTY_QUERY, PGSQL_COMMAND_OK, PGSQL_TUPLES_OK,
436                 // PGSQL_COPY_OUT, PGSQL_COPY_IN, PGSQL_BAD_RESPONSE,
437                 // PGSQL_NONFATAL_ERROR and PGSQL_FATAL_ERROR
438                 // echo 'Query result ' . $i . ' is: ' . $resultStatus . "\n";
439                 if ($resultStatus != PGSQL_COMMAND_OK && $resultStatus != PGSQL_TUPLES_OK) {
440                     $resultError = pg_result_error($hPGresult);
441                     echo '-- error text ' . $i . ': ' . $resultError . "\n";
442                     $bFailed = true;
443                 }
444             }
445         }
446         if ($bFailed) {
447             fail('SQL errors loading placex and/or location_property_osmline tables');
448         }
449
450         for ($i = 0; $i < $this->iInstances; $i++) {
451             pg_close($aDBInstances[$i]);
452         }
453
454         echo "\n";
455         info('Reanalysing database');
456         $this->pgsqlRunScript('ANALYSE');
457
458         $sDatabaseDate = getDatabaseDate($this->oDB);
459         $this->oDB->exec('TRUNCATE import_status');
460         if (!$sDatabaseDate) {
461             warn('could not determine database date.');
462         } else {
463             $sSQL = "INSERT INTO import_status (lastimportdate) VALUES('".$sDatabaseDate."')";
464             $this->oDB->exec($sSQL);
465             echo "Latest data imported from $sDatabaseDate.\n";
466         }
467     }
468
469     public function importTigerData()
470     {
471         info('Import Tiger data');
472
473         $sTemplate = file_get_contents(CONST_BasePath.'/sql/tiger_import_start.sql');
474         $sTemplate = str_replace('{www-user}', CONST_Database_Web_User, $sTemplate);
475         $sTemplate = $this->replaceTablespace(
476             '{ts:aux-data}',
477             CONST_Tablespace_Aux_Data,
478             $sTemplate
479         );
480         $sTemplate = $this->replaceTablespace(
481             '{ts:aux-index}',
482             CONST_Tablespace_Aux_Index,
483             $sTemplate
484         );
485         $this->pgsqlRunScript($sTemplate, false);
486
487         $aDBInstances = array();
488         for ($i = 0; $i < $this->iInstances; $i++) {
489             // https://secure.php.net/manual/en/function.pg-connect.php
490             $DSN = CONST_Database_DSN;
491             $DSN = preg_replace('/^pgsql:/', '', $DSN);
492             $DSN = preg_replace('/;/', ' ', $DSN);
493             $aDBInstances[$i] = pg_connect($DSN, PGSQL_CONNECT_FORCE_NEW | PGSQL_CONNECT_ASYNC);
494             pg_ping($aDBInstances[$i]);
495         }
496
497         foreach (glob(CONST_Tiger_Data_Path.'/*.sql') as $sFile) {
498             echo $sFile.': ';
499             $hFile = fopen($sFile, 'r');
500             $sSQL = fgets($hFile, 100000);
501             $iLines = 0;
502             while (true) {
503                 for ($i = 0; $i < $this->iInstances; $i++) {
504                     if (!pg_connection_busy($aDBInstances[$i])) {
505                         while (pg_get_result($aDBInstances[$i]));
506                         $sSQL = fgets($hFile, 100000);
507                         if (!$sSQL) break 2;
508                         if (!pg_send_query($aDBInstances[$i], $sSQL)) fail(pg_last_error($aDBInstances[$i]));
509                         $iLines++;
510                         if ($iLines == 1000) {
511                             echo '.';
512                             $iLines = 0;
513                         }
514                     }
515                 }
516                 usleep(10);
517             }
518             fclose($hFile);
519
520             $bAnyBusy = true;
521             while ($bAnyBusy) {
522                 $bAnyBusy = false;
523                 for ($i = 0; $i < $this->iInstances; $i++) {
524                     if (pg_connection_busy($aDBInstances[$i])) $bAnyBusy = true;
525                 }
526                 usleep(10);
527             }
528             echo "\n";
529         }
530
531         for ($i = 0; $i < $this->iInstances; $i++) {
532             pg_close($aDBInstances[$i]);
533         }
534
535         info('Creating indexes on Tiger data');
536         $sTemplate = file_get_contents(CONST_BasePath.'/sql/tiger_import_finish.sql');
537         $sTemplate = str_replace('{www-user}', CONST_Database_Web_User, $sTemplate);
538         $sTemplate = $this->replaceTablespace(
539             '{ts:aux-data}',
540             CONST_Tablespace_Aux_Data,
541             $sTemplate
542         );
543         $sTemplate = $this->replaceTablespace(
544             '{ts:aux-index}',
545             CONST_Tablespace_Aux_Index,
546             $sTemplate
547         );
548         $this->pgsqlRunScript($sTemplate, false);
549     }
550
551     public function calculatePostcodes($bCMDResultAll)
552     {
553         info('Calculate Postcodes');
554         $this->pgExec('TRUNCATE location_postcode');
555
556         $sSQL  = 'INSERT INTO location_postcode';
557         $sSQL .= ' (place_id, indexed_status, country_code, postcode, geometry) ';
558         $sSQL .= "SELECT nextval('seq_place'), 1, country_code,";
559         $sSQL .= "       upper(trim (both ' ' from address->'postcode')) as pc,";
560         $sSQL .= '       ST_Centroid(ST_Collect(ST_Centroid(geometry)))';
561         $sSQL .= '  FROM placex';
562         $sSQL .= " WHERE address ? 'postcode' AND address->'postcode' NOT SIMILAR TO '%(,|;)%'";
563         $sSQL .= '       AND geometry IS NOT null';
564         $sSQL .= ' GROUP BY country_code, pc';
565         $this->pgExec($sSQL);
566
567         // only add postcodes that are not yet available in OSM
568         $sSQL  = 'INSERT INTO location_postcode';
569         $sSQL .= ' (place_id, indexed_status, country_code, postcode, geometry) ';
570         $sSQL .= "SELECT nextval('seq_place'), 1, 'us', postcode,";
571         $sSQL .= '       ST_SetSRID(ST_Point(x,y),4326)';
572         $sSQL .= '  FROM us_postcode WHERE postcode NOT IN';
573         $sSQL .= '        (SELECT postcode FROM location_postcode';
574         $sSQL .= "          WHERE country_code = 'us')";
575         $this->pgExec($sSQL);
576
577         // add missing postcodes for GB (if available)
578         $sSQL  = 'INSERT INTO location_postcode';
579         $sSQL .= ' (place_id, indexed_status, country_code, postcode, geometry) ';
580         $sSQL .= "SELECT nextval('seq_place'), 1, 'gb', postcode, geometry";
581         $sSQL .= '  FROM gb_postcode WHERE postcode NOT IN';
582         $sSQL .= '           (SELECT postcode FROM location_postcode';
583         $sSQL .= "             WHERE country_code = 'gb')";
584         $this->pgExec($sSQL);
585
586         if (!$bCMDResultAll) {
587             $sSQL = "DELETE FROM word WHERE class='place' and type='postcode'";
588             $sSQL .= 'and word NOT IN (SELECT postcode FROM location_postcode)';
589             $this->pgExec($sSQL);
590         }
591
592         $sSQL = 'SELECT count(getorcreate_postcode_id(v)) FROM ';
593         $sSQL .= '(SELECT distinct(postcode) as v FROM location_postcode) p';
594         $this->pgExec($sSQL);
595     }
596
597     public function index($bIndexNoanalyse)
598     {
599         $sOutputFile = '';
600         $sBaseCmd = CONST_InstallPath.'/nominatim/nominatim -i'
601             .' -d '.escapeshellarg($this->aDSNInfo['database'])
602             .' -P '.escapeshellarg($this->aDSNInfo['port'])
603             .' -t '.escapeshellarg($this->iInstances.$sOutputFile);
604         if (isset($this->aDSNInfo['hostspec'])) {
605             $sBaseCmd .= ' -H '.escapeshellarg($this->aDSNInfo['hostspec']);
606         }
607         if (isset($this->aDSNInfo['username'])) {
608             $sBaseCmd .= ' -U '.escapeshellarg($this->aDSNInfo['username']);
609         }
610
611         info('Index ranks 0 - 4');
612         $iStatus = $this->runWithPgEnv($sBaseCmd.' -R 4');
613         if ($iStatus != 0) {
614             fail('error status ' . $iStatus . ' running nominatim!');
615         }
616         if (!$bIndexNoanalyse) $this->pgsqlRunScript('ANALYSE');
617
618         info('Index ranks 5 - 25');
619         $iStatus = $this->runWithPgEnv($sBaseCmd.' -r 5 -R 25');
620         if ($iStatus != 0) {
621             fail('error status ' . $iStatus . ' running nominatim!');
622         }
623         if (!$bIndexNoanalyse) $this->pgsqlRunScript('ANALYSE');
624
625         info('Index ranks 26 - 30');
626         $iStatus = $this->runWithPgEnv($sBaseCmd.' -r 26');
627         if ($iStatus != 0) {
628             fail('error status ' . $iStatus . ' running nominatim!');
629         }
630
631         info('Index postcodes');
632         $sSQL = 'UPDATE location_postcode SET indexed_status = 0';
633         $this->pgExec($sSQL);
634     }
635
636     public function createSearchIndices()
637     {
638         info('Create Search indices');
639
640         $sTemplate = file_get_contents(CONST_BasePath.'/sql/indices.src.sql');
641         if (!$this->dbReverseOnly()) {
642             $sTemplate .= file_get_contents(CONST_BasePath.'/sql/indices_search.src.sql');
643         }
644         $sTemplate = str_replace('{www-user}', CONST_Database_Web_User, $sTemplate);
645         $sTemplate = $this->replaceTablespace(
646             '{ts:address-index}',
647             CONST_Tablespace_Address_Index,
648             $sTemplate
649         );
650         $sTemplate = $this->replaceTablespace(
651             '{ts:search-index}',
652             CONST_Tablespace_Search_Index,
653             $sTemplate
654         );
655         $sTemplate = $this->replaceTablespace(
656             '{ts:aux-index}',
657             CONST_Tablespace_Aux_Index,
658             $sTemplate
659         );
660         $this->pgsqlRunScript($sTemplate);
661     }
662
663     public function createCountryNames()
664     {
665         info('Create search index for default country names');
666
667         $this->pgsqlRunScript("select getorcreate_country(make_standard_name('uk'), 'gb')");
668         $this->pgsqlRunScript("select getorcreate_country(make_standard_name('united states'), 'us')");
669         $this->pgsqlRunScript('select count(*) from (select getorcreate_country(make_standard_name(country_code), country_code) from country_name where country_code is not null) as x');
670         $this->pgsqlRunScript("select count(*) from (select getorcreate_country(make_standard_name(name->'name'), country_code) from country_name where name ? 'name') as x");
671         $sSQL = 'select count(*) from (select getorcreate_country(make_standard_name(v),'
672             .'country_code) from (select country_code, skeys(name) as k, svals(name) as v from country_name) x where k ';
673         if (CONST_Languages) {
674             $sSQL .= 'in ';
675             $sDelim = '(';
676             foreach (explode(',', CONST_Languages) as $sLang) {
677                 $sSQL .= $sDelim."'name:$sLang'";
678                 $sDelim = ',';
679             }
680             $sSQL .= ')';
681         } else {
682             // all include all simple name tags
683             $sSQL .= "like 'name:%'";
684         }
685         $sSQL .= ') v';
686         $this->pgsqlRunScript($sSQL);
687     }
688
689     public function drop()
690     {
691         info('Drop tables only required for updates');
692
693         // The implementation is potentially a bit dangerous because it uses
694         // a positive selection of tables to keep, and deletes everything else.
695         // Including any tables that the unsuspecting user might have manually
696         // created. USE AT YOUR OWN PERIL.
697         // tables we want to keep. everything else goes.
698         $aKeepTables = array(
699                         '*columns',
700                         'import_polygon_*',
701                         'import_status',
702                         'place_addressline',
703                         'location_postcode',
704                         'location_property*',
705                         'placex',
706                         'search_name',
707                         'seq_*',
708                         'word',
709                         'query_log',
710                         'new_query_log',
711                         'spatial_ref_sys',
712                         'country_name',
713                         'place_classtype_*',
714                         'country_osm_grid'
715                        );
716
717         $aDropTables = array();
718         $aHaveTables = $this->oDB->getCol("SELECT tablename FROM pg_tables WHERE schemaname='public'");
719
720         foreach ($aHaveTables as $sTable) {
721             $bFound = false;
722             foreach ($aKeepTables as $sKeep) {
723                 if (fnmatch($sKeep, $sTable)) {
724                     $bFound = true;
725                     break;
726                 }
727             }
728             if (!$bFound) array_push($aDropTables, $sTable);
729         }
730         foreach ($aDropTables as $sDrop) {
731             if ($this->bVerbose) echo "Dropping table $sDrop\n";
732             $this->oDB->exec("DROP TABLE $sDrop CASCADE");
733             // ignore warnings/errors as they might be caused by a table having
734             // been deleted already by CASCADE
735         }
736
737         if (!is_null(CONST_Osm2pgsql_Flatnode_File) && CONST_Osm2pgsql_Flatnode_File) {
738             if (file_exists(CONST_Osm2pgsql_Flatnode_File)) {
739                 if ($this->bVerbose) echo 'Deleting '.CONST_Osm2pgsql_Flatnode_File."\n";
740                 unlink(CONST_Osm2pgsql_Flatnode_File);
741             }
742         }
743     }
744
745     private function pgsqlRunDropAndRestore($sDumpFile)
746     {
747         $sCMD = 'pg_restore'
748             .' -p '.escapeshellarg($this->aDSNInfo['port'])
749             .' -d '.escapeshellarg($this->aDSNInfo['database'])
750             .' --no-owner -Fc --clean '.escapeshellarg($sDumpFile);
751         if ($this->oDB->getPostgresVersion() >= 9.04) {
752             $sCMD .= ' --if-exists';
753         }
754         if (isset($this->aDSNInfo['hostspec'])) {
755             $sCMD .= ' -h '.escapeshellarg($this->aDSNInfo['hostspec']);
756         }
757         if (isset($this->aDSNInfo['username'])) {
758             $sCMD .= ' -U '.escapeshellarg($this->aDSNInfo['username']);
759         }
760
761         $this->runWithPgEnv($sCMD);
762     }
763
764     private function pgsqlRunScript($sScript, $bfatal = true)
765     {
766         runSQLScript(
767             $sScript,
768             $bfatal,
769             $this->bVerbose,
770             $this->sIgnoreErrors
771         );
772     }
773
774     private function createSqlFunctions()
775     {
776         $sTemplate = file_get_contents(CONST_BasePath.'/sql/functions.sql');
777         $sTemplate = str_replace('{modulepath}', $this->sModulePath, $sTemplate);
778         if ($this->bEnableDiffUpdates) {
779             $sTemplate = str_replace('RETURN NEW; -- %DIFFUPDATES%', '--', $sTemplate);
780         }
781         if ($this->bEnableDebugStatements) {
782             $sTemplate = str_replace('--DEBUG:', '', $sTemplate);
783         }
784         if (CONST_Limit_Reindexing) {
785             $sTemplate = str_replace('--LIMIT INDEXING:', '', $sTemplate);
786         }
787         if (!CONST_Use_US_Tiger_Data) {
788             $sTemplate = str_replace('-- %NOTIGERDATA% ', '', $sTemplate);
789         }
790         if (!CONST_Use_Aux_Location_data) {
791             $sTemplate = str_replace('-- %NOAUXDATA% ', '', $sTemplate);
792         }
793
794         $sReverseOnly = $this->dbReverseOnly() ? 'true' : 'false';
795         $sTemplate = str_replace('%REVERSE-ONLY%', $sReverseOnly, $sTemplate);
796
797         $this->pgsqlRunScript($sTemplate);
798     }
799
800     private function pgsqlRunPartitionScript($sTemplate)
801     {
802         $sSQL = 'select distinct partition from country_name';
803         $aPartitions = $this->oDB->getCol($sSQL);
804         if (!$this->bNoPartitions) $aPartitions[] = 0;
805
806         preg_match_all('#^-- start(.*?)^-- end#ms', $sTemplate, $aMatches, PREG_SET_ORDER);
807         foreach ($aMatches as $aMatch) {
808             $sResult = '';
809             foreach ($aPartitions as $sPartitionName) {
810                 $sResult .= str_replace('-partition-', $sPartitionName, $aMatch[1]);
811             }
812             $sTemplate = str_replace($aMatch[0], $sResult, $sTemplate);
813         }
814
815         $this->pgsqlRunScript($sTemplate);
816     }
817
818     private function pgsqlRunScriptFile($sFilename)
819     {
820         if (!file_exists($sFilename)) fail('unable to find '.$sFilename);
821
822         $sCMD = 'psql'
823             .' -p '.escapeshellarg($this->aDSNInfo['port'])
824             .' -d '.escapeshellarg($this->aDSNInfo['database']);
825         if (!$this->bVerbose) {
826             $sCMD .= ' -q';
827         }
828         if (isset($this->aDSNInfo['hostspec'])) {
829             $sCMD .= ' -h '.escapeshellarg($this->aDSNInfo['hostspec']);
830         }
831         if (isset($this->aDSNInfo['username'])) {
832             $sCMD .= ' -U '.escapeshellarg($this->aDSNInfo['username']);
833         }
834         $aProcEnv = null;
835         if (isset($this->aDSNInfo['password'])) {
836             $aProcEnv = array_merge(array('PGPASSWORD' => $this->aDSNInfo['password']), $_ENV);
837         }
838         $ahGzipPipes = null;
839         if (preg_match('/\\.gz$/', $sFilename)) {
840             $aDescriptors = array(
841                              0 => array('pipe', 'r'),
842                              1 => array('pipe', 'w'),
843                              2 => array('file', '/dev/null', 'a')
844                             );
845             $hGzipProcess = proc_open('zcat '.escapeshellarg($sFilename), $aDescriptors, $ahGzipPipes);
846             if (!is_resource($hGzipProcess)) fail('unable to start zcat');
847             $aReadPipe = $ahGzipPipes[1];
848             fclose($ahGzipPipes[0]);
849         } else {
850             $sCMD .= ' -f '.escapeshellarg($sFilename);
851             $aReadPipe = array('pipe', 'r');
852         }
853         $aDescriptors = array(
854                          0 => $aReadPipe,
855                          1 => array('pipe', 'w'),
856                          2 => array('file', '/dev/null', 'a')
857                         );
858         $ahPipes = null;
859         $hProcess = proc_open($sCMD, $aDescriptors, $ahPipes, null, $aProcEnv);
860         if (!is_resource($hProcess)) fail('unable to start pgsql');
861         // TODO: error checking
862         while (!feof($ahPipes[1])) {
863             echo fread($ahPipes[1], 4096);
864         }
865         fclose($ahPipes[1]);
866         $iReturn = proc_close($hProcess);
867         if ($iReturn > 0) {
868             fail("pgsql returned with error code ($iReturn)");
869         }
870         if ($ahGzipPipes) {
871             fclose($ahGzipPipes[1]);
872             proc_close($hGzipProcess);
873         }
874     }
875
876     private function replaceTablespace($sTemplate, $sTablespace, $sSql)
877     {
878         if ($sTablespace) {
879             $sSql = str_replace($sTemplate, 'TABLESPACE "'.$sTablespace.'"', $sSql);
880         } else {
881             $sSql = str_replace($sTemplate, '', $sSql);
882         }
883         return $sSql;
884     }
885
886     private function runWithPgEnv($sCmd)
887     {
888         if ($this->bVerbose) {
889             echo "Execute: $sCmd\n";
890         }
891
892         $aProcEnv = null;
893
894         if (isset($this->aDSNInfo['password'])) {
895             $aProcEnv = array_merge(array('PGPASSWORD' => $this->aDSNInfo['password']), $_ENV);
896         }
897
898         return runWithEnv($sCmd, $aProcEnv);
899     }
900
901     /**
902      * Execute the SQL command on the open database.
903      *
904      * @param string $sSQL SQL command to execute.
905      *
906      * @return null
907      *
908      * @pre connect() must have been called.
909      */
910     private function pgExec($sSQL)
911     {
912         $this->oDB->exec($sSQL);
913     }
914
915     /**
916      * Check if the database is in reverse-only mode.
917      *
918      * @return True if there is no search_name table and infrastructure.
919      */
920     private function dbReverseOnly()
921     {
922         return !($this->oDB->tableExists('search_name'));
923     }
924 }