RUVIDEO
Поделитесь видео 🙏

Block-Recurrent Transformers

Трансформеры уже давно господствуют во многих задачах NLP. И если с задачами где длина последовательности относительно мала (не более 512 токенов) проблем не возникает, то с обработкой больших текстов не все так ясно. Проблема в том, что потребление памяти увеличивается квадратично с ростом обрабатываемой последовательности.

Существуют различные подходы к решению проблемы, например, можно линеаризовать softmax в модуле внимания, снизив асимптотику до O(N) (linear transformers); или же исследовать разреженность (BigBird). В свою очередь, авторы статьи продолжают идеи sliding-window и Transformer-XL. Поэтому на семинаре поговорим об этих подходах и архитектуре Block-Recurrent Transformer.

Докладчик: Кирилл Семин.

Что делает видео по-настоящему запоминающимся? Наверное, та самая атмосфера, которая заставляет забыть о времени. Когда вы заходите на RUVIDEO, чтобы посмотреть онлайн «Block-Recurrent Transformers», вы рассчитываете на нечто большее, чем просто загрузку плеера. И мы это понимаем. Контент такого уровня заслуживает того, чтобы его смотрели в HD 1080, без дрожания картинки и бесконечного буферизации.

Честно говоря, Rutube сегодня — это кладезь уникальных находок, которые часто теряются в общем шуме. Мы же вытаскиваем на поверхность самое интересное. Будь то динамичный экшн, глубокий разбор темы от любимого автора или просто уютное видео для настроения — всё это доступно здесь бесплатно и без лишних формальностей. Никаких «заполните анкету, чтобы продолжить». Только вы, ваш экран и качественный поток.

Если вас зацепило это видео, не забудьте взглянуть на похожие материалы в блоке справа. Мы откалибровали наши алгоритмы так, чтобы они подбирали контент не просто «по тегам», а по настроению и смыслу. Ведь в конечном итоге, онлайн-кинотеатр — это не склад файлов, а место, где каждый вечер можно найти свою историю. Приятного вам отдыха на RUVIDEO!

Видео взято из открытых источников Rutube. Если вы правообладатель, обратитесь к первоисточнику.