Парсинг страниц Е-Каталога в БД
- https://www.e-katalog.ru/sitemap/sitemap-index.xml - отсюда, нужно спарсить все URL с sitemap у которых есть разметка katalog-pages-compare.
- Какие данные тянуть с этих страниц:
- заголовок H1;
- картинки товаров (парсим ссылку), названия товаров и цены;
- всю таблицу сравнения характеристик (все параметры);
- динамику цен.
ТЗ https://docs.google.com/document/d/1BV_aJhm7RvgFZc...