Сила оптимизации ПО: NVIDIA вдвое ускорила исполнение языковых моделей на H100 с помощью TensorRT-LLM

09.09.2023 14:38

«3DNews»

Компания NVIDIA анонсировала программное обеспечение TensorRT-LLM с открытым исходным кодом, специально разработанное для ускорения исполнения больших языковых моделей (LLM). Платформа станет доступна в ближайшие недели. Отмечается, что NVIDIA тесно сотрудничает с такими компаниями, как Meta✴, Anyscale, Cohere, Deci, Grammarly, Mistral AI, MosaicML (входит в состав Databricks), OctoML, Tabnine и Together AI, для ускорения и оптимизации LLM. Однако большой размер и уникальные характеристики LLM могут затруднить их эффективное внедрение. Библиотека TensorRT-LLM как раз и призвана решить проблему.

29ru.net

Суд продлил арест совладельцу "Олимпситистроя" Фомину по делу о взятках Иванову Подмосковная компания экспортировала в Узбекистан тару на 1,4 миллиона рублей В Москве состоялся технический пуск первых четырех станций Троицкой линии метро Учителя из 11 стран Африки участвуют в образовательной программе в Москве

Светские новости от Life24.pro

Загрузка...

Губернаторы России

Москва

Сила оптимизации ПО: NVIDIA вдвое ускорила исполнение языковых моделей на H100 с помощью TensorRT-LLM

Москва-Пекин. Собянин в Китае подписал соглашение о сотрудничестве

В УФСИН России по Республике Дагестан прошли лично-командные соревнования по легкой атлетике

Все новости спорта сегодня

Скачков и Тайлакова выиграли соревнования по настольному теннису на Играх БРИКС

Бизнес-омбудсмен Москвы оказывает поддержку НМСП

СЕНСАЦИОННЫЙ ДОКЛАД ПРО ДЕЛО СКРИПАЛЕЙ, САФРОНОВА, ГОЛУНОВА.

Частные объявления в Вашем городе, в Вашем регионе и в России

Рэпер Элджей выступил на фестивале «Черника Fest Music» в Новосибирске

Учителя из 11 стран Африки участвуют в образовательной программе в Москве

Друзья 123ru.net

Информационные партнёры 123ru.net

Спонсоры 123ru.net