Хакатон по машинному переводу DeepHack.Babel

 
Хакатон по машинному переводу DeepHack.Babel

18 декабря 2017 года стартовал отборочный тур для участия в хакатоне DeepHack.Babel.

С 29 января по 4 февраля 2018 года пятидесяти участникам, прошедшим отбор, представится возможность применить свои знания для усовершенствования машинного перевода. Отборочный этап проходит до 8 января, регистрация на сайте хакатона: http://babel.deephack.me/.

DeepHack.Babel — уже пятый хакатон серии DeepHack, который организует Лаборатория нейронных систем и глубокого обучения МФТИ. В этом году темой хакатона выбран машинный перевод. Акцент будет сделан на нейронный машинный перевод, набирающий популярность в исследовательском сообществе и уже использующийся в коммерческих продуктах. В отличие от традиционного статистического метода, в его основе лежит использование искусственных нейронных сетей, что позволяет достичь более высокого качества перевода. Нейронный машинный перевод уже используют сервисы перевода таких компаний, как Google, Яндекс и Майкрософт.

«Цель хакатона, который пройдёт в МФТИ, — разработать методы обучения машинного переводчика без обучающих примеров, — рассказывает заведующий лабораторией Михаил Бурцев. — Дело в том, что система машинного перевода, как и человек, учится переводить, анализируя примеры правильных переводов с одного языка на другой. Участники же попытаются научить программу переводить, не давая ей таких примеров. Знание о том, как переводятся фразы с одного на другой язык, программа должна получить из двух не связанных между собой текстов. Эта технология позволит расширить возможности машинного перевода, автоматизировать перевод с редких языков, для которых сложно достать параллельные примеры правильных переводов. Кроме того, решение этой задачи может улучшить современные модели машинного перевода и для пар языков с большим объёмом данных, используя коллекции моноязычных текстов, которые доступны практически для любого языка».

По традиции DeepHack в рамках хакатона будет работать научная школа. Лекции об исследованиях в области машинного перевода прочитают ведущие мировые специалисты из Booking.com, Unbabel, Yandex, Apple, университета Carnegie Mellon (США), университета Лидса, университета Шеффилда (Великобритания), университета Гумбольдта (Германия), Городского университета Дублина (Ирландия) и других крупных исследовательских центров. Лекции открыты для свободного посещения после регистрации. Также будет организована трансляция на YouTube канале DeepHack.

«DeepHack — это, наверное, единственная хакатон-площадка в России такого уровня и с такой историей, — говорит участник прошлого хакатона Виктор Портнов, руководитель Data Science отдела корпоративного блока Сбербанка. —У нас была возможность на 7 дней полностью погрузиться в решение задач из самых передовых областей Data Science и AI. Было безумно интересно, сложно и напряженно до последней минуты. Особенно приятно, что мы выиграли, да еще прокачались в области NLP и познакомились со многими интересными людьми. Если получится участвовать в следующий раз, мы обязательно приедем!»

Хакатон организован лабораторией нейронных систем и глубокого обучения МФТИ в рамках работы над проектом iPavlov. В течение двух с половиной лет исследователи лаборатории в сотрудничестве с крупнейшими научными центрами по машинному обучению будут работать над созданием технологий разговорного искусственного интеллекта. Результаты будут опубликованы в виде библиотеки с открытой лицензией, чтобы любой, кто занимается разработкой диалоговых систем, мог использовать их в своих исследованиях и прикладных решениях.

Генеральными партнёрами хакатона выступают Фонд поддержки проектов Национальной технологической инициативы и Сбербанк. Хакатон также поддерживают сообщество Open Data Science, Отраслевой союз НейроНет и Биофармкластер «Северный».

Сайт хакатона: http://babel.deephack.me/