Проверка данных и растеризация
В каждой строке, поле content содержит xml string описывающий svg image.
Требуется:
- Перевести картинку в формат png
- Сохранить результат в корзине (google bucket)
- Сохранить ссылку на файл (сохраненный в корзине) и ошибки (если таковые возникли во время процесса) в новые колонки: rendered_image_location, error_status
Красивый, хорошо документированный код более чем приветствуется ;)
Схема исходной таблицы:
Url, content, query_time, batch_number, meta
Схема итоговой таблицы:
Url, content, rendered_image_location, error_status, query_time, batch_number, meta
Данные находятся:
for-ula:images_public.svg_view_100 ← BigQuery
Как оперировать корзинами (google buckets) в колабе:
https://medium.com/analytics-vidhya/how-to-access-files-from-google-cloud-storage-in-colab-notebooks-8edaf9e6c020
Если во время прочтения или выполнения задания возникнут вопросы, не стесняйтесь их задавать :)