1 # SPDX-License-Identifier: GPL-2.0-only
 
   3 # This file is part of Nominatim. (https://nominatim.org)
 
   5 # Copyright (C) 2022 by the Nominatim developer community.
 
   6 # For a full list of authors see the git log.
 
   7 """ Steps that run queries against the API.
 
   9     Queries may either be run directly via PHP using the query script
 
  10     or via the HTTP interface using php-cgi.
 
  12 from pathlib import Path
 
  18 import xml.etree.ElementTree as ET
 
  19 from urllib.parse import urlencode
 
  21 from utils import run_script
 
  22 from http_responses import GenericResponse, SearchResponse, ReverseResponse, StatusResponse
 
  23 from check_functions import Bbox, check_for_attributes
 
  24 from table_compare import NominatimID
 
  26 LOG = logging.getLogger(__name__)
 
  29     'HTTP_HOST' : 'localhost',
 
  30     'HTTP_USER_AGENT' : 'Mozilla/5.0 (X11; Linux x86_64; rv:51.0) Gecko/20100101 Firefox/51.0',
 
  31     'HTTP_ACCEPT' : 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
 
  32     'HTTP_ACCEPT_ENCODING' : 'gzip, deflate',
 
  33     'HTTP_CONNECTION' : 'keep-alive',
 
  34     'SERVER_SIGNATURE' : '<address>Nominatim BDD Tests</address>',
 
  35     'SERVER_SOFTWARE' : 'Nominatim test',
 
  36     'SERVER_NAME' : 'localhost',
 
  37     'SERVER_ADDR' : '127.0.1.1',
 
  39     'REMOTE_ADDR' : '127.0.0.1',
 
  40     'DOCUMENT_ROOT' : '/var/www',
 
  41     'REQUEST_SCHEME' : 'http',
 
  42     'CONTEXT_PREFIX' : '/',
 
  43     'SERVER_ADMIN' : 'webmaster@localhost',
 
  44     'REMOTE_PORT' : '49319',
 
  45     'GATEWAY_INTERFACE' : 'CGI/1.1',
 
  46     'SERVER_PROTOCOL' : 'HTTP/1.1',
 
  47     'REQUEST_METHOD' : 'GET',
 
  48     'REDIRECT_STATUS' : 'CGI'
 
  52 def make_todo_list(context, result_id):
 
  54         context.execute_steps("then at least 1 result is returned")
 
  55         return range(len(context.response.result))
 
  57     context.execute_steps(f"then more than {result_id}results are returned")
 
  58     return (int(result_id.strip()), )
 
  61 def compare(operator, op1, op2):
 
  62     if operator == 'less than':
 
  64     elif operator == 'more than':
 
  66     elif operator == 'exactly':
 
  68     elif operator == 'at least':
 
  70     elif operator == 'at most':
 
  73         raise ValueError(f"Unknown operator '{operator}'")
 
  76 def send_api_query(endpoint, params, fmt, context):
 
  78         if fmt.strip() == 'debug':
 
  81             params['format'] = fmt.strip()
 
  84         if context.table.headings[0] == 'param':
 
  85             for line in context.table:
 
  86                 params[line['param']] = line['value']
 
  88             for h in context.table.headings:
 
  89                 params[h] = context.table[0][h]
 
  91     if context.nominatim.api_engine is None:
 
  92         return send_api_query_php(endpoint, params, context)
 
  94     return asyncio.run(context.nominatim.api_engine(endpoint, params,
 
  95                                                     Path(context.nominatim.website_dir.name),
 
  96                                                     context.nominatim.test_env,
 
  97                                                     getattr(context, 'http_headers', {})))
 
 101 def send_api_query_php(endpoint, params, context):
 
 102     env = dict(BASE_SERVER_ENV)
 
 103     env['QUERY_STRING'] = urlencode(params)
 
 105     env['SCRIPT_NAME'] = f'/{endpoint}.php'
 
 106     env['REQUEST_URI'] = f"{env['SCRIPT_NAME']}?{env['QUERY_STRING']}"
 
 107     env['CONTEXT_DOCUMENT_ROOT'] = os.path.join(context.nominatim.website_dir.name, 'website')
 
 108     env['SCRIPT_FILENAME'] = os.path.join(env['CONTEXT_DOCUMENT_ROOT'],
 
 111     LOG.debug("Environment:" + json.dumps(env, sort_keys=True, indent=2))
 
 113     if hasattr(context, 'http_headers'):
 
 114         for k, v in context.http_headers.items():
 
 115             env['HTTP_' + k.upper().replace('-', '_')] = v
 
 117     cmd = ['/usr/bin/env', 'php-cgi', '-f']
 
 118     if context.nominatim.code_coverage_path:
 
 119         env['XDEBUG_MODE'] = 'coverage'
 
 120         env['COV_SCRIPT_FILENAME'] = env['SCRIPT_FILENAME']
 
 121         env['COV_PHP_DIR'] = context.nominatim.src_dir
 
 122         env['COV_TEST_NAME'] = f"{context.scenario.filename}:{context.scenario.line}"
 
 123         env['SCRIPT_FILENAME'] = \
 
 124                 os.path.join(os.path.split(__file__)[0], 'cgi-with-coverage.php')
 
 125         cmd.append(env['SCRIPT_FILENAME'])
 
 126         env['PHP_CODE_COVERAGE_FILE'] = context.nominatim.next_code_coverage_file()
 
 128         cmd.append(env['SCRIPT_FILENAME'])
 
 130     for k,v in params.items():
 
 131         cmd.append(f"{k}={v}")
 
 133     outp, err = run_script(cmd, cwd=context.nominatim.website_dir.name, env=env)
 
 135     assert len(err) == 0, f"Unexpected PHP error: {err}"
 
 137     if outp.startswith('Status: '):
 
 138         status = int(outp[8:11])
 
 142     content_start = outp.find('\r\n\r\n')
 
 144     return outp[content_start + 4:], status
 
 146 @given(u'the HTTP header')
 
 147 def add_http_header(context):
 
 148     if not hasattr(context, 'http_headers'):
 
 149         context.http_headers = {}
 
 151     for h in context.table.headings:
 
 152         context.http_headers[h] = context.table[0][h]
 
 155 @when(u'sending (?P<fmt>\S+ )?search query "(?P<query>.*)"(?P<addr> with address)?')
 
 156 def website_search_request(context, fmt, query, addr):
 
 161         params['addressdetails'] = '1'
 
 163     outp, status = send_api_query('search', params, fmt, context)
 
 165     context.response = SearchResponse(outp, fmt or 'json', status)
 
 168 @when('sending v1/reverse at (?P<lat>[\d.-]*),(?P<lon>[\d.-]*)(?: with format (?P<fmt>.+))?')
 
 169 def api_endpoint_v1_reverse(context, lat, lon, fmt):
 
 180     outp, status = send_api_query('reverse', params, fmt, context)
 
 181     context.response = ReverseResponse(outp, fmt or 'xml', status)
 
 184 @when('sending v1/reverse N(?P<nodeid>\d+)(?: with format (?P<fmt>.+))?')
 
 185 def api_endpoint_v1_reverse_from_node(context, nodeid, fmt):
 
 187     params['lon'], params['lat'] = (f'{c:f}' for c in context.osm.grid_node(int(nodeid)))
 
 189     outp, status = send_api_query('reverse', params, fmt, context)
 
 190     context.response = ReverseResponse(outp, fmt or 'xml', status)
 
 193 @when(u'sending (?P<fmt>\S+ )?details query for (?P<query>.*)')
 
 194 def website_details_request(context, fmt, query):
 
 196     if query[0] in 'NWR':
 
 197         nid = NominatimID(query)
 
 198         params['osmtype'] = nid.typ
 
 199         params['osmid'] = nid.oid
 
 201             params['class'] = nid.cls
 
 203         params['place_id'] = query
 
 204     outp, status = send_api_query('details', params, fmt, context)
 
 206     context.response = GenericResponse(outp, fmt or 'json', status)
 
 208 @when(u'sending (?P<fmt>\S+ )?lookup query for (?P<query>.*)')
 
 209 def website_lookup_request(context, fmt, query):
 
 210     params = { 'osm_ids' : query }
 
 211     outp, status = send_api_query('lookup', params, fmt, context)
 
 213     context.response = SearchResponse(outp, fmt or 'xml', status)
 
 215 @when(u'sending (?P<fmt>\S+ )?status query')
 
 216 def website_status_request(context, fmt):
 
 218     outp, status = send_api_query('status', params, fmt, context)
 
 220     context.response = StatusResponse(outp, fmt or 'text', status)
 
 222 @step(u'(?P<operator>less than|more than|exactly|at least|at most) (?P<number>\d+) results? (?:is|are) returned')
 
 223 def validate_result_number(context, operator, number):
 
 224     context.execute_steps("Then a HTTP 200 is returned")
 
 225     numres = len(context.response.result)
 
 226     assert compare(operator, numres, int(number)), \
 
 227            f"Bad number of results: expected {operator} {number}, got {numres}."
 
 229 @then(u'a HTTP (?P<status>\d+) is returned')
 
 230 def check_http_return_status(context, status):
 
 231     assert context.response.errorcode == int(status), \
 
 232            f"Return HTTP status is {context.response.errorcode}."\
 
 233            f" Full response:\n{context.response.page}"
 
 235 @then(u'the page contents equals "(?P<text>.+)"')
 
 236 def check_page_content_equals(context, text):
 
 237     assert context.response.page == text
 
 239 @then(u'the result is valid (?P<fmt>\w+)')
 
 240 def step_impl(context, fmt):
 
 241     context.execute_steps("Then a HTTP 200 is returned")
 
 242     if fmt.strip() == 'html':
 
 244             tree = ET.fromstring(context.response.page)
 
 245         except Exception as ex:
 
 246             assert False, f"Could not parse page:\n{context.response.page}"
 
 248         assert tree.tag == 'html'
 
 249         body = tree.find('./body')
 
 250         assert body is not None
 
 251         assert body.find('.//script') is None
 
 253         assert context.response.format == fmt
 
 256 @then(u'a (?P<fmt>\w+) user error is returned')
 
 257 def check_page_error(context, fmt):
 
 258     context.execute_steps("Then a HTTP 400 is returned")
 
 259     assert context.response.format == fmt
 
 262         assert re.search(r'<error>.+</error>', context.response.page, re.DOTALL) is not None
 
 264         assert re.search(r'({"error":)', context.response.page, re.DOTALL) is not None
 
 266 @then(u'result header contains')
 
 267 def check_header_attr(context):
 
 268     context.execute_steps("Then a HTTP 200 is returned")
 
 269     for line in context.table:
 
 270         assert line['attr'] in context.response.header, \
 
 271                f"Field '{line['attr']}' missing in header. Full header:\n{context.response.header}"
 
 272         value = context.response.header[line['attr']]
 
 273         assert re.fullmatch(line['value'], value) is not None, \
 
 274                f"Attribute '{line['attr']}': expected: '{line['value']}', got '{value}'"
 
 277 @then(u'result header has (?P<neg>not )?attributes (?P<attrs>.*)')
 
 278 def check_header_no_attr(context, neg, attrs):
 
 279     check_for_attributes(context.response.header, attrs,
 
 280                          'absent' if neg else 'present')
 
 283 @then(u'results contain(?: in field (?P<field>.*))?')
 
 284 def step_impl(context, field):
 
 285     context.execute_steps("then at least 1 result is returned")
 
 287     for line in context.table:
 
 288         context.response.match_row(line, context=context, field=field)
 
 291 @then(u'result (?P<lid>\d+ )?has (?P<neg>not )?attributes (?P<attrs>.*)')
 
 292 def validate_attributes(context, lid, neg, attrs):
 
 293     for i in make_todo_list(context, lid):
 
 294         check_for_attributes(context.response.result[i], attrs,
 
 295                              'absent' if neg else 'present')
 
 298 @then(u'result addresses contain')
 
 299 def step_impl(context):
 
 300     context.execute_steps("then at least 1 result is returned")
 
 302     for line in context.table:
 
 303         idx = int(line['ID']) if 'ID' in line.headings else None
 
 305         for name, value in zip(line.headings, line.cells):
 
 307                 context.response.assert_address_field(idx, name, value)
 
 309 @then(u'address of result (?P<lid>\d+) has(?P<neg> no)? types (?P<attrs>.*)')
 
 310 def check_address(context, lid, neg, attrs):
 
 311     context.execute_steps(f"then more than {lid} results are returned")
 
 313     addr_parts = context.response.result[int(lid)]['address']
 
 315     for attr in attrs.split(','):
 
 317             assert attr not in addr_parts
 
 319             assert attr in addr_parts
 
 321 @then(u'address of result (?P<lid>\d+) (?P<complete>is|contains)')
 
 322 def check_address(context, lid, complete):
 
 323     context.execute_steps(f"then more than {lid} results are returned")
 
 326     addr_parts = dict(context.response.result[lid]['address'])
 
 328     for line in context.table:
 
 329         context.response.assert_address_field(lid, line['type'], line['value'])
 
 330         del addr_parts[line['type']]
 
 333         assert len(addr_parts) == 0, f"Additional address parts found: {addr_parts!s}"
 
 336 @then(u'result (?P<lid>\d+ )?has bounding box in (?P<coords>[\d,.-]+)')
 
 337 def check_bounding_box_in_area(context, lid, coords):
 
 338     expected = Bbox(coords)
 
 340     for idx in make_todo_list(context, lid):
 
 341         res = context.response.result[idx]
 
 342         check_for_attributes(res, 'boundingbox')
 
 343         context.response.check_row(idx, res['boundingbox'] in expected,
 
 344                                    f"Bbox is not contained in {expected}")
 
 347 @then(u'result (?P<lid>\d+ )?has centroid in (?P<coords>[\d,.-]+)')
 
 348 def check_centroid_in_area(context, lid, coords):
 
 349     expected = Bbox(coords)
 
 351     for idx in make_todo_list(context, lid):
 
 352         res = context.response.result[idx]
 
 353         check_for_attributes(res, 'lat,lon')
 
 354         context.response.check_row(idx, (res['lon'], res['lat']) in expected,
 
 355                                    f"Centroid is not inside {expected}")
 
 358 @then(u'there are(?P<neg> no)? duplicates')
 
 359 def check_for_duplicates(context, neg):
 
 360     context.execute_steps("then at least 1 result is returned")
 
 365     for res in context.response.result:
 
 366         dup = (res['osm_type'], res['class'], res['type'], res['display_name'])
 
 373         assert not has_dupe, f"Found duplicate for {dup}"
 
 375         assert has_dupe, "No duplicates found"