Телеграм-бот для Парсинга данных (документы pdf)
1. выгружать документы со страницы проекта по мере их обновления;
2. выделять определенные данные из документа (проектная декларация) в google таблицу.
1. Со страницы проекта (типовая страница проекта _ пример) необходимо выгружать документацию, которая будет размещаться/обновляться на странице (вкладка «Документы»), в телеграмм.
1.1. Количество страниц проектов, которые должны быть включены в рассылку бота от 5 до 20.
1.2. В телеге в сообщениях с выгруженными файлами должно быть добавлено наименование проекта и ID (из примера – это ЖК "Заволжский" и ID дома: 35919).
1.3. Необходимо добавить возможность добавлять новые страницы проектов и удалять старые страницы / или составить инструкцию к боту с функциональном добавления/удаления проекта)) (т.е. владелец бота мог бы добавить/удалить страницу проекта самостоятельно).
2. Из документа «Проектная декларация…» необходимо выцеплять данные под пунктами 19.7.1.1.1.1, 19.7.1.1.2.1, 19.7.1.1.3.1, 19.7.2.1.1.1, 19.7.2.1.2.1, 19.7.2.1.3.1, 19.7.3.1.1.1, 19.7.3.1.2.1, 19.7.3.1.3.1 и выгружать их в googleтаблицу (в определенную форму).