]> git.openstreetmap.org Git - nominatim.git/blob - utils/imports.php
also use address column for word count computation
[nominatim.git] / utils / imports.php
1 #!/usr/bin/php -Cq
2 <?php
3
4 require_once(dirname(dirname(__FILE__)).'/settings/settings.php');
5 require_once(CONST_BasePath.'/lib/init-cmd.php');
6 ini_set('memory_limit', '800M');
7
8 $aCMDOptions
9  = array(
10     "Create and setup nominatim search system",
11     array('help', 'h', 0, 1, 0, 0, false, 'Show Help'),
12     array('quiet', 'q', 0, 1, 0, 0, 'bool', 'Quiet output'),
13     array('verbose', 'v', 0, 1, 0, 0, 'bool', 'Verbose output'),
14
15     array('parse-tiger', '', 0, 1, 1, 1, 'realpath', 'Convert tiger edge files to nominatim sql import - datafiles from 2011 or later (source: edges directory of tiger data)'),
16    );
17 getCmdOpt($_SERVER['argv'], $aCMDOptions, $aCMDResult, true, true);
18
19
20 if (isset($aCMDResult['parse-tiger'])) {
21     if (!file_exists(CONST_Tiger_Data_Path)) mkdir(CONST_Tiger_Data_Path);
22
23     $sTempDir = tempnam('/tmp', 'tiger');
24     unlink($sTempDir);
25     mkdir($sTempDir);
26
27     foreach (glob($aCMDResult['parse-tiger'].'/tl_20??_?????_edges.zip', 0) as $sImportFile) {
28         set_time_limit(30);
29         preg_match('#([0-9]{5})_(.*)#', basename($sImportFile), $aMatch);
30         $sCountyID = $aMatch[1];
31         echo "Processing ".$sCountyID."...\n";
32         $sUnzipCmd = "unzip -d $sTempDir $sImportFile";
33         exec($sUnzipCmd);
34         $sShapeFile = $sTempDir.'/'.basename($sImportFile, '.zip').'.shp';
35         if (!file_exists($sShapeFile)) {
36             echo "Failed unzip ($sImportFile)\n";
37         } else {
38             $sParseCmd = CONST_BasePath.'/utils/tigerAddressImport.py '.$sShapeFile;
39             exec($sParseCmd);
40             $sOsmFile = $sTempDir.'/'.basename($sImportFile, '.zip').'.osm1.osm';
41             if (!file_exists($sOsmFile)) {
42                 echo "Failed parse ($sImportFile)\n";
43             } else {
44                 copy($sOsmFile, CONST_Tiger_Data_Path.'/'.$sCountyID.'.sql');
45             }
46         }
47         // Cleanup
48         foreach (glob($sTempDir.'/*') as $sTmpFile) {
49             unlink($sTmpFile);
50         }
51     }
52 }