3 require_once(CONST_BasePath.'/lib/init-cmd.php');
 
   4 ini_set('memory_limit', '800M');
 
   8     'Create and setup nominatim search system',
 
   9     array('help', 'h', 0, 1, 0, 0, false, 'Show Help'),
 
  10     array('quiet', 'q', 0, 1, 0, 0, 'bool', 'Quiet output'),
 
  11     array('verbose', 'v', 0, 1, 0, 0, 'bool', 'Verbose output'),
 
  13     array('create-tables', '', 0, 1, 0, 0, 'bool', 'Create wikipedia tables'),
 
  14     array('parse-articles', '', 0, 1, 0, 0, 'bool', 'Parse wikipedia articles'),
 
  15     array('link', '', 0, 1, 0, 0, 'bool', 'Try to link to existing OSM ids'),
 
  17 getCmdOpt($_SERVER['argv'], $aCMDOptions, $aCMDResult, true, true);
 
  20 $sTestPageText = <<<EOD
 
  21 {{Coord|47|N|2|E|type:country_region:FR|display=title}}
 
  22 {{ Infobox Amusement park
 
  23 | name = Six Flags Great Adventure
 
  24 | image = [[File:SixFlagsGreatAdventure logo.png]]
 
  25 | caption = Six Flags Great Adventure logo
 
  26 | location = [[Jackson, New Jersey|Jackson]]
 
  27 | location2 = New Jersey
 
  28 | location3 = United States
 
  29 | address = 1 Six Flags Boulevard<ref name="drivedir"/>
 
  30 | season = March/April through October/November
 
  31 | opening_date = July 1, 1974
 
  32 | previous_names = Great Adventure
 
  34 | rides = 45 park admission rides
 
  37 | owner = [[Six Flags]]
 
  39 | homepage = [http://www.sixflags.com/parks/greatadventure/ Six Flags Great Adventure]
 
  42 var_dump(_templatesToProperties(_parseWikipediaContent($sTestPageText)));
 
  44 //| coordinates = {{Coord|40|08|16.65|N|74|26|26.69|W|region:US-NJ_type:landmark|display=inline,title}}
 
  51     $oDB = new Nominatim\DB();
 
  54     if ($aCMDResult['drop-tables'])
 
  56         $oDB->query('DROP TABLE wikipedia_article');
 
  57         $oDB->query('DROP TABLE wikipedia_link');
 
  61 if ($aCMDResult['create-tables']) {
 
  63 CREATE TABLE wikipedia_article (
 
  64     language text NOT NULL,
 
  71     importance double precision,
 
  73     osm_type character(1),
 
  81         $oDB->query("SELECT AddGeometryColumn('wikipedia_article', 'location', 4326, 'GEOMETRY', 2)");
 
  84 CREATE TABLE wikipedia_link (
 
  93 function degreesAndMinutesToDecimal($iDegrees, $iMinutes = 0, $fSeconds = 0, $sNSEW = 'N')
 
  95     $sNSEW = strtoupper($sNSEW);
 
  96     return ($sNSEW == 'S' || $sNSEW == 'W'?-1:1) * ((float)$iDegrees + (float)$iMinutes/60 + (float)$fSeconds/3600);
 
 100 function _parseWikipediaContent($sPageText)
 
 102     $sPageText = str_replace("\n", ' ', $sPageText);
 
 103     $sPageText = preg_replace('#<!--.*?-->#m', '', $sPageText);
 
 104     $sPageText = preg_replace('#<math>.*?<\\/math>#m', '', $sPageText);
 
 106     $aPageText = preg_split('#({{|}}|\\[\\[|\\]\\]|[|])#', $sPageText, -1, PREG_SPLIT_DELIM_CAPTURE);
 
 108     $aPageProperties = array();
 
 110     $aTemplates = array();
 
 113     $aTemplateStack = array();
 
 114     $aState = array('body');
 
 115     foreach ($aPageText as $i => $sPart) {
 
 118                 array_unshift($aTemplateStack, array('', array()));
 
 119                 array_unshift($aState, 'template');
 
 122                 if ($aState[0] == 'template' || $aState[0] == 'templateparam') {
 
 123                     $aTemplate = array_shift($aTemplateStack);
 
 124                     array_shift($aState);
 
 126                     $aTemplates[] = $aTemplate;
 
 132                 array_unshift($aState, 'link');
 
 135                 if ($aState[0] == 'link' || $aState[0] == 'linksynonim') {
 
 136                     if (!$sLinkSyn) $sLinkSyn = $sLinkPage;
 
 137                     if (substr($sLinkPage, 0, 6) == 'Image:') $sLinkSyn = substr($sLinkPage, 6);
 
 139                     $aLinks[] = array($sLinkPage, $sLinkSyn);
 
 141                     array_shift($aState);
 
 142                     switch ($aState[0]) {
 
 144                             $aTemplateStack[0][0] .= trim($sPart);
 
 146                         case 'templateparam':
 
 147                             $aTemplateStack[0][1][0] .= $sLinkSyn;
 
 150                             $sLinkPage .= trim($sPart);
 
 156                             $sPageBody .= $sLinkSyn;
 
 159                             var_dump($aState, $sPageName, $aTemplateStack, $sPart, $aPageText);
 
 160                             fail('unknown state');
 
 165                 if ($aState[0] == 'template' || $aState[0] == 'templateparam') {
 
 166                     // Create a new template paramater
 
 167                     $aState[0] = 'templateparam';
 
 168                     array_unshift($aTemplateStack[0][1], '');
 
 170                 if ($aState[0] == 'link') $aState[0] = 'linksynonim';
 
 173                 switch ($aState[0]) {
 
 175                         $aTemplateStack[0][0] .= trim($sPart);
 
 177                     case 'templateparam':
 
 178                         $aTemplateStack[0][1][0] .= $sPart;
 
 181                         $sLinkPage .= trim($sPart);
 
 187                         $sPageBody .= $sPart;
 
 190                         var_dump($aState, $aPageText);
 
 191                         fail('unknown state');
 
 199 function _templatesToProperties($aTemplates)
 
 201     $aPageProperties = array();
 
 202     foreach ($aTemplates as $iTemplate => $aTemplate) {
 
 204         foreach (array_reverse($aTemplate[1]) as $iParam => $sParam) {
 
 205             if (($iPos = strpos($sParam, '=')) === false) {
 
 206                 $aParams[] = trim($sParam);
 
 208                 $aParams[trim(substr($sParam, 0, $iPos))] = trim(substr($sParam, $iPos+1));
 
 211         $aTemplates[$iTemplate][1] = $aParams;
 
 212         if (!isset($aPageProperties['sOfficialName']) && isset($aParams['official_name']) && $aParams['official_name']) $aPageProperties['sOfficialName'] = $aParams['official_name'];
 
 213         if (!isset($aPageProperties['iPopulation']) && isset($aParams['population']) && $aParams['population'] && preg_match('#^[0-9.,]+#', $aParams['population'])) {
 
 214             $aPageProperties['iPopulation'] = (int)str_replace(array(',', '.'), '', $aParams['population']);
 
 216         if (!isset($aPageProperties['iPopulation']) && isset($aParams['population_total']) && $aParams['population_total'] && preg_match('#^[0-9.,]+#', $aParams['population_total'])) {
 
 217             $aPageProperties['iPopulation'] = (int)str_replace(array(',', '.'), '', $aParams['population_total']);
 
 219         if (!isset($aPageProperties['iPopulation']) && isset($aParams['population_urban']) && $aParams['population_urban'] && preg_match('#^[0-9.,]+#', $aParams['population_urban'])) {
 
 220             $aPageProperties['iPopulation'] = (int)str_replace(array(',', '.'), '', $aParams['population_urban']);
 
 222         if (!isset($aPageProperties['iPopulation']) && isset($aParams['population_estimate']) && $aParams['population_estimate'] && preg_match('#^[0-9.,]+#', $aParams['population_estimate'])) {
 
 223             $aPageProperties['iPopulation'] = (int)str_replace(array(',', '.'), '', $aParams['population_estimate']);
 
 225         if (!isset($aPageProperties['sWebsite']) && isset($aParams['website']) && $aParams['website']) {
 
 226             if (preg_match('#^\\[?([^ \\]]+)[^\\]]*\\]?$#', $aParams['website'], $aMatch)) {
 
 227                 $aPageProperties['sWebsite'] = $aMatch[1];
 
 228                 if (strpos($aPageProperties['sWebsite'], ':/'.'/') === false) {
 
 229                     $aPageProperties['sWebsite'] = 'http:/'.'/'.$aPageProperties['sWebsite'];
 
 233         if (!isset($aPageProperties['sTopLevelDomain']) && isset($aParams['cctld']) && $aParams['cctld']) {
 
 234             $aPageProperties['sTopLevelDomain'] = str_replace(array('[', ']', '.'), '', $aParams['cctld']);
 
 237         if (!isset($aPageProperties['sInfoboxType']) && strtolower(substr($aTemplate[0], 0, 7)) == 'infobox') {
 
 238             $aPageProperties['sInfoboxType'] = trim(substr($aTemplate[0], 8));
 
 239             // $aPageProperties['aInfoboxParams'] = $aParams;
 
 242         // Assume the first template with lots of params is the type (fallback for infobox)
 
 243         if (!isset($aPageProperties['sPossibleInfoboxType']) && count($aParams) > 10) {
 
 244             $aPageProperties['sPossibleInfoboxType'] = trim($aTemplate[0]);
 
 245             // $aPageProperties['aInfoboxParams'] = $aParams;
 
 248         // do we have a lat/lon
 
 249         if (!isset($aPageProperties['fLat'])) {
 
 250             if (isset($aParams['latd']) && isset($aParams['longd'])) {
 
 251                 $aPageProperties['fLat'] = degreesAndMinutesToDecimal($aParams['latd'], @$aParams['latm'], @$aParams['lats'], @$aParams['latNS']);
 
 252                 $aPageProperties['fLon'] = degreesAndMinutesToDecimal($aParams['longd'], @$aParams['longm'], @$aParams['longs'], @$aParams['longEW']);
 
 254             if (isset($aParams['lat_degrees']) && isset($aParams['lat_degrees'])) {
 
 255                 $aPageProperties['fLat'] = degreesAndMinutesToDecimal($aParams['lat_degrees'], @$aParams['lat_minutes'], @$aParams['lat_seconds'], @$aParams['lat_direction']);
 
 256                 $aPageProperties['fLon'] = degreesAndMinutesToDecimal($aParams['long_degrees'], @$aParams['long_minutes'], @$aParams['long_seconds'], @$aParams['long_direction']);
 
 258             if (isset($aParams['latitude']) && isset($aParams['longitude'])) {
 
 259                 if (preg_match('#[0-9.]+#', $aParams['latitude']) && preg_match('#[0-9.]+#', $aParams['longitude'])) {
 
 260                     $aPageProperties['fLat'] = (float)$aParams['latitude'];
 
 261                     $aPageProperties['fLon'] = (float)$aParams['longitude'];
 
 264             if (strtolower($aTemplate[0]) == 'coord') {
 
 265                 if (isset($aParams[3]) && (strtoupper($aParams[3]) == 'N' || strtoupper($aParams[3]) == 'S')) {
 
 266                     $aPageProperties['fLat'] = degreesAndMinutesToDecimal($aParams[0], $aParams[1], $aParams[2], $aParams[3]);
 
 267                     $aPageProperties['fLon'] = degreesAndMinutesToDecimal($aParams[4], $aParams[5], $aParams[6], $aParams[7]);
 
 268                 } elseif (isset($aParams[0]) && isset($aParams[1]) && isset($aParams[2]) && (strtoupper($aParams[2]) == 'N' || strtoupper($aParams[2]) == 'S')) {
 
 269                     $aPageProperties['fLat'] = degreesAndMinutesToDecimal($aParams[0], $aParams[1], 0, $aParams[2]);
 
 270                     $aPageProperties['fLon'] = degreesAndMinutesToDecimal($aParams[3], $aParams[4], 0, $aParams[5]);
 
 271                 } elseif (isset($aParams[0]) && isset($aParams[1]) && (strtoupper($aParams[1]) == 'N' || strtoupper($aParams[1]) == 'S')) {
 
 272                     $aPageProperties['fLat'] = (strtoupper($aParams[1]) == 'N'?1:-1) * (float)$aParams[0];
 
 273                     $aPageProperties['fLon'] = (strtoupper($aParams[3]) == 'E'?1:-1) * (float)$aParams[2];
 
 274                 } elseif (isset($aParams[0]) && is_numeric($aParams[0]) && isset($aParams[1]) && is_numeric($aParams[1])) {
 
 275                     $aPageProperties['fLat'] = (float)$aParams[0];
 
 276                     $aPageProperties['fLon'] = (float)$aParams[1];
 
 279             if (isset($aParams['Latitude']) && isset($aParams['Longitude'])) {
 
 280                 $aParams['Latitude'] = str_replace(' ', ' ', $aParams['Latitude']);
 
 281                 $aParams['Longitude'] = str_replace(' ', ' ', $aParams['Longitude']);
 
 282                 if (preg_match('#^([0-9]+)°( ([0-9]+)′)? ([NS]) to ([0-9]+)°( ([0-9]+)′)? ([NS])#', $aParams['Latitude'], $aMatch)) {
 
 283                     $aPageProperties['fLat'] =
 
 284                         (degreesAndMinutesToDecimal($aMatch[1], $aMatch[3], 0, $aMatch[4])
 
 285                         +degreesAndMinutesToDecimal($aMatch[5], $aMatch[7], 0, $aMatch[8])) / 2;
 
 286                 } elseif (preg_match('#^([0-9]+)°( ([0-9]+)′)? ([NS])#', $aParams['Latitude'], $aMatch)) {
 
 287                     $aPageProperties['fLat'] = degreesAndMinutesToDecimal($aMatch[1], $aMatch[3], 0, $aMatch[4]);
 
 290                 if (preg_match('#^([0-9]+)°( ([0-9]+)′)? ([EW]) to ([0-9]+)°( ([0-9]+)′)? ([EW])#', $aParams['Longitude'], $aMatch)) {
 
 291                     $aPageProperties['fLon'] =
 
 292                         (degreesAndMinutesToDecimal($aMatch[1], $aMatch[3], 0, $aMatch[4])
 
 293                         +degreesAndMinutesToDecimal($aMatch[5], $aMatch[7], 0, $aMatch[8])) / 2;
 
 294                 } elseif (preg_match('#^([0-9]+)°( ([0-9]+)′)? ([EW])#', $aParams['Longitude'], $aMatch)) {
 
 295                     $aPageProperties['fLon'] = degreesAndMinutesToDecimal($aMatch[1], $aMatch[3], 0, $aMatch[4]);
 
 300     if (isset($aPageProperties['sPossibleInfoboxType'])) {
 
 301         if (!isset($aPageProperties['sInfoboxType'])) $aPageProperties['sInfoboxType'] = '#'.$aPageProperties['sPossibleInfoboxType'];
 
 302         unset($aPageProperties['sPossibleInfoboxType']);
 
 304     return $aPageProperties;
 
 307 if (isset($aCMDResult['parse-wikipedia'])) {
 
 308     $oDB = new Nominatim\DB();
 
 311     $sSQL = 'select page_title from content where page_namespace = 0 and page_id %10 = ';
 
 312     $sSQL .= $aCMDResult['parse-wikipedia'];
 
 313     $sSQL .= ' and (page_content ilike \'%{{Coord%\' or (page_content ilike \'%lat%\' and page_content ilike \'%lon%\'))';
 
 314     $aArticleNames = $oDB->getCol($sSQL);
 
 315     /* $aArticleNames = $oDB->getCol($sSQL = 'select page_title from content where page_namespace = 0
 
 316         and (page_content ilike \'%{{Coord%\' or (page_content ilike \'%lat%\'
 
 317         and page_content ilike \'%lon%\')) and page_title in (\'Virginia\')');
 
 319     foreach ($aArticleNames as $sArticleName) {
 
 320         $sPageText = $oDB->getOne('select page_content from content where page_namespace = 0 and page_title = \''.pg_escape_string($sArticleName).'\'');
 
 321         $aP = _templatesToProperties(_parseWikipediaContent($sPageText));
 
 323         if (isset($aP['sInfoboxType'])) {
 
 324             $aP['sInfoboxType'] = preg_replace('#\\s+#', ' ', $aP['sInfoboxType']);
 
 325             $sSQL = 'update wikipedia_article set ';
 
 326             $sSQL .= 'infobox_type = \''.pg_escape_string($aP['sInfoboxType']).'\'';
 
 327             $sSQL .= ' where language = \'en\' and title = \''.pg_escape_string($sArticleName).'\';';
 
 330         if (isset($aP['iPopulation'])) {
 
 331             $sSQL = 'update wikipedia_article set ';
 
 332             $sSQL .= 'population = \''.pg_escape_string($aP['iPopulation']).'\'';
 
 333             $sSQL .= ' where language = \'en\' and title = \''.pg_escape_string($sArticleName).'\';';
 
 336         if (isset($aP['sWebsite'])) {
 
 337             $sSQL = 'update wikipedia_article set ';
 
 338             $sSQL .= 'website = \''.pg_escape_string($aP['sWebsite']).'\'';
 
 339             $sSQL .= ' where language = \'en\' and title = \''.pg_escape_string($sArticleName).'\';';
 
 342         if (isset($aP['fLat']) && ($aP['fLat']!='-0' || $aP['fLon']!='-0')) {
 
 343             if (!isset($aP['sInfoboxType'])) $aP['sInfoboxType'] = '';
 
 344             echo $sArticleName.'|'.$aP['sInfoboxType'].'|'.$aP['fLat'].'|'.$aP['fLon'] ."\n";
 
 345             $sSQL = 'update wikipedia_article set ';
 
 346             $sSQL .= 'lat = \''.pg_escape_string($aP['fLat']).'\',';
 
 347             $sSQL .= 'lon = \''.pg_escape_string($aP['fLon']).'\'';
 
 348             $sSQL .= ' where language = \'en\' and title = \''.pg_escape_string($sArticleName).'\';';
 
 355 function nominatimXMLStart($hParser, $sName, $aAttr)
 
 357     global $aNominatRecords;
 
 360             $aNominatRecords[] = $aAttr;
 
 366 function nominatimXMLEnd($hParser, $sName)
 
 371 if (isset($aCMDResult['link'])) {
 
 372     $oDB = new Nominatim\DB();
 
 375     $aWikiArticles = $oDB->getAll("select * from wikipedia_article where language = 'en' and lat is not null and osm_type is null and totalcount < 31 order by importance desc limit 200000");
 
 377     // If you point this script at production OSM you will be blocked
 
 378     $sNominatimBaseURL = 'http://SEVERNAME/search.php';
 
 380     foreach ($aWikiArticles as $aRecord) {
 
 381         $aRecord['name'] = str_replace('_', ' ', $aRecord['title']);
 
 383         $sURL = $sNominatimBaseURL.'?format=xml&accept-language=en';
 
 385         echo "\n-- ".$aRecord['name'].', '.$aRecord['infobox_type']."\n";
 
 386         $fMaxDist = 0.0000001;
 
 388         switch (strtolower($aRecord['infobox_type'])) {
 
 389             case 'former country':
 
 392                 $fMaxDist = 60; // effectively turn it off
 
 393                 $sURL .= '&viewbox='.($aRecord['lon']-$fMaxDist).','.($aRecord['lat']+$fMaxDist).','.($aRecord['lon']+$fMaxDist).','.($aRecord['lat']-$fMaxDist);
 
 399                 $fMaxDist = 60; // effectively turn it off
 
 400                 $sURL .= '&featuretype=country';
 
 401                 $sURL .= '&viewbox='.($aRecord['lon']-$fMaxDist).','.($aRecord['lat']+$fMaxDist).','.($aRecord['lon']+$fMaxDist).','.($aRecord['lat']-$fMaxDist);
 
 403             case 'prefecture japan':
 
 404                 $aRecord['name'] = trim(str_replace(' Prefecture', ' ', $aRecord['name']));
 
 405                 // intentionally no break
 
 410             case 'u.s. state symbols':
 
 412             case 'province or territory of canada':
 
 413             case 'indian jurisdiction':
 
 415             case 'french region':
 
 416             case 'region of italy':
 
 418             case '#australia state or territory':
 
 419             case 'russian federal subject':
 
 421                 $sURL .= '&featuretype=state';
 
 422                 $sURL .= '&viewbox='.($aRecord['lon']-$fMaxDist).','.($aRecord['lat']+$fMaxDist).','.($aRecord['lon']+$fMaxDist).','.($aRecord['lat']-$fMaxDist);
 
 424             case 'protected area':
 
 426                 $sURL .= '&nearlat='.$aRecord['lat'];
 
 427                 $sURL .= '&nearlon='.$aRecord['lon'];
 
 428                 $sURL .= '&viewbox='.($aRecord['lon']-$fMaxDist).','.($aRecord['lat']+$fMaxDist).','.($aRecord['lon']+$fMaxDist).','.($aRecord['lat']-$fMaxDist);
 
 432                 // intentionally no break
 
 433             case 'french commune':
 
 434             case 'italian comune':
 
 436             case 'italian comune':
 
 437             case 'australian place':
 
 443             case 'russian inhabited locality':
 
 444             case 'finnish municipality/land area':
 
 445             case 'england county':
 
 446             case 'israel municipality':
 
 450                 $sURL .= '&featuretype=settlement';
 
 451                 $sURL .= '&viewbox='.($aRecord['lon']-0.5).','.($aRecord['lat']+0.5).','.($aRecord['lon']+0.5).','.($aRecord['lat']-0.5);
 
 454             case 'mountain pass':
 
 459                 $sURL .= '&viewbox='.($aRecord['lon']-0.5).','.($aRecord['lat']+0.5).','.($aRecord['lon']+0.5).','.($aRecord['lat']-0.5);
 
 463                 $aTypes = array('wreck');
 
 464                 $sURL .= '&viewbox='.($aRecord['lon']-0.01).','.($aRecord['lat']+0.01).','.($aRecord['lon']+0.01).','.($aRecord['lat']-0.01);
 
 465                 $sURL .= '&nearlat='.$aRecord['lat'];
 
 466                 $sURL .= '&nearlon='.$aRecord['lon'];
 
 473                 $sURL .= '&viewbox='.($aRecord['lon']-0.01).','.($aRecord['lat']+0.01).','.($aRecord['lon']+0.01).','.($aRecord['lat']-0.01);
 
 474                 $sURL .= '&bounded=1';
 
 475                 $sURL .= '&nearlat='.$aRecord['lat'];
 
 476                 $sURL .= '&nearlon='.$aRecord['lon'];
 
 481                 $sURL .= '&viewbox='.($aRecord['lon']-0.01).','.($aRecord['lat']+0.01).','.($aRecord['lon']+0.01).','.($aRecord['lat']-0.01);
 
 482                 // $sURL .= "&bounded=1";
 
 483                 $sURL .= '&nearlat='.$aRecord['lat'];
 
 484                 $sURL .= '&nearlon='.$aRecord['lon'];
 
 485                 echo '-- Unknown: '.$aRecord['infobox_type']."\n";
 
 488         $sNameURL = $sURL.'&q='.urlencode($aRecord['name']);
 
 491         $sXML = file_get_contents($sNameURL);
 
 493         $aNominatRecords = array();
 
 494         $hXMLParser = xml_parser_create();
 
 495         xml_set_element_handler($hXMLParser, 'nominatimXMLStart', 'nominatimXMLEnd');
 
 496         xml_parse($hXMLParser, $sXML, true);
 
 497         xml_parser_free($hXMLParser);
 
 499         if (!isset($aNominatRecords[0])) {
 
 500             $aNameParts = preg_split('#[(,]#', $aRecord['name']);
 
 501             if (count($aNameParts) > 1) {
 
 502                 $sNameURL = $sURL.'&q='.urlencode(trim($aNameParts[0]));
 
 504                 $sXML = file_get_contents($sNameURL);
 
 506                 $aNominatRecords = array();
 
 507                 $hXMLParser = xml_parser_create();
 
 508                 xml_set_element_handler($hXMLParser, 'nominatimXMLStart', 'nominatimXMLEnd');
 
 509                 xml_parse($hXMLParser, $sXML, true);
 
 510                 xml_parser_free($hXMLParser);
 
 514         // assume first is best/right
 
 515         for ($i = 0; $i < count($aNominatRecords); $i++) {
 
 516             $fDiff = ($aRecord['lat']-$aNominatRecords[$i]['LAT']) * ($aRecord['lat']-$aNominatRecords[$i]['LAT']);
 
 517             $fDiff += ($aRecord['lon']-$aNominatRecords[$i]['LON']) * ($aRecord['lon']-$aNominatRecords[$i]['LON']);
 
 518             $fDiff = sqrt($fDiff);
 
 520                 // If it was an unknown type base it on the rank of the found result
 
 521                 $iRank = (int)$aNominatRecords[$i]['PLACE_RANK'];
 
 522                 if ($iRank <= 4) $fMaxDist = 2;
 
 523                 elseif ($iRank <= 8) $fMaxDist = 1;
 
 524                 elseif ($iRank <= 10) $fMaxDist = 0.8;
 
 525                 elseif ($iRank <= 12) $fMaxDist = 0.6;
 
 526                 elseif ($iRank <= 17) $fMaxDist = 0.2;
 
 527                 elseif ($iRank <= 18) $fMaxDist = 0.1;
 
 528                 elseif ($iRank <= 22) $fMaxDist = 0.02;
 
 529                 elseif ($iRank <= 26) $fMaxDist = 0.001;
 
 530                 else $fMaxDist = 0.001;
 
 532             echo '-- FOUND "'.substr($aNominatRecords[$i]['DISPLAY_NAME'], 0, 50);
 
 533             echo '", '.$aNominatRecords[$i]['CLASS'].', '.$aNominatRecords[$i]['TYPE'];
 
 534             echo ', '.$aNominatRecords[$i]['PLACE_RANK'].', '.$aNominatRecords[$i]['OSM_TYPE'];
 
 535             echo " (dist:$fDiff, max:$fMaxDist)\n";
 
 536             if ($fDiff > $fMaxDist) {
 
 537                 echo "-- Diff too big $fDiff (max: $fMaxDist)".$aRecord['lat'].','.$aNominatRecords[$i]['LAT'].' & '.$aRecord['lon'].','.$aNominatRecords[$i]['LON']." \n";
 
 539                 $sSQL = 'update wikipedia_article set osm_type=';
 
 540                 switch ($aNominatRecords[$i]['OSM_TYPE']) {
 
 551                 $sSQL .= ', osm_id='.$aNominatRecords[$i]['OSM_ID']." where language = '".pg_escape_string($aRecord['language'])."' and title = '".pg_escape_string($aRecord['title'])."'";