searxng/digg.py at dc544498d09ff031f707e19e6777f6fcc92d8342

 """
  Digg (News, Social media)
  @website     https://digg.com
  @provide-api no
  @using-api   no
  @results     HTML (using search portal)
  @stable      no (HTML can change)
  @parse       url, title, content, publishedDate, thumbnail
 """
 # pylint: disable=missing-function-docstring
 from json import loads
 from urllib.parse import urlencode
 from datetime import datetime
 from lxml import html
 # engine dependent config
 categories = ['news', 'social media']
 paging = True
 base_url = 'https://digg.com'
 # search-url
 search_url = base_url + (
     '/api/search/'
     '?{query}'
     '&from={position}'
     '&size=20'
     '&format=html'
 )
 def request(query, params):
     offset = (params['pageno'] - 1) * 20
     params['url'] = search_url.format(
         query = urlencode({'q': query}),
         position = offset,
     )
     return params
 def response(resp):
     results = []
     # parse results
     for result in loads(resp.text)['mapped']:
         # strip html tags and superfluous quotation marks from content
         content = html.document_fromstring(
             result['excerpt']
         ).text_content()
         # 'created': {'ISO': '2020-10-16T14:09:55Z', ...}
         published = datetime.strptime(
             result['created']['ISO'], '%Y-%m-%dT%H:%M:%SZ'
         )
         results.append({
             'url': result['url'],
             'title': result['title'],
             'content' : content,
             'template': 'videos.html',
             'publishedDate': published,
             'thumbnail': result['images']['thumbImage'],
         })
     return results