Парсинг xml на python
Нужно создать скрипт для парсинга rss (xml)
Тут находится https://yadi.sk/d/T348wDhhLqX8Ww excel файл с 88 уникальными ссылками rss.
Всего будет 12000-15000 ссылок. Нужно создать унифицированный скрипт. Вариант один метод - одна ссылка, не подходит.
Из ссылок нужно вытаскивать информацию - название журнала, авторы, дату публикации, картинка, текст.
Тестовое задание, если Вы не можете его выполнить, то не откликайтесь!
http://rss.sciencedirect.com/publication/science/1...
По этой ссылке нужно получить название статьи, авторов, дату публикации, описание, изображение.
Проблема возникает с изображением. Нужно настроить параметры get запроса, чтобы ресурс отдал изображения.
Убедиться, что изображения присутствуют в xml можно через http://inoreader.com