Сделать скрипт получения данных о людях с Википедии
Для сбора данных нужно сделать скрипт получения данных всех страниц людей с российской и английской википедии со следующими данными:
- id
- Ссылка на страницу в Википедии
- Ссылка на фото
- Пол
- Фамилия
- Имя
- Отчество, если есть
- Гражданство, какой страны
- Дата рождения
- Страна рождения
- Регион, Область, Штат рождения
- Город рождения
- Дата смерти, если человек не умер, оставить поле пустым
- Страна смерти
- Регион / Область / Штат смерти
- Город смерти
- Род деятельности / профессия. Каждую профессию вынести в отдельный столбец и напротив человека, если относится к профессии ставить 1, если не относится, то 0.
- Кол-во просмотров за каждый год с 2015 по 2020
- Кол-во просмотров страниц человека за каждый месяц с 2020 года по июнь 2021
Результат:
- Скрипт получения данных, с инструкцией развертывания и запуска.
- Два файла формата .xlsx с выгрузками с российской и английской википедии. Если кол-во данных будет очень большим, разбить файлы на несколько частей, чтобы открылись для анализа в Excel.