Разработать / доработать конвертер DOCX -> HTML
,Основная проблема существующих open source библиотек - они некорректно записывают многоуровневые нумерованные списки. (Либо вообще нумерацию не отображают, либо отображают некорректно)
Сами пробовали libreoffice, pandoc, mammoth. Возможно их надо доработать напильником.
Это проект, но если все пойдет хорошо то будут ещё задачи постоянно.
Реализация может быть на python или под node.js
Пример файла прилагаю