О проекте
Зачем мы это делаем и почему это важно
Благодаря работе Мирона Барателия уже создана нейросетевая модель для перевода абазинского языка (попробуйте её в @abaza_corpus_bot). Она неплохо справляется с переводами в обе стороны, но для выхода на новый уровень качества нам нужны данные — много качественных данных.
Для дальнейшего обучения требуется качественный языковой корпус: миллионы предложений, переведённых профессионально. Все доступные открытые материалы уже собраны.
Наша цель
Создать качественный корпус из ~3 миллионов предложений, переведённых профессионально и осмысленно человеком, чтобы вывести переводчик на принципиально новый уровень.
Созданный корпус будет использоваться для дальнейшего обучения переводчика и бесплатно опубликован в открытом доступе, чтобы компании и исследовательские команды по всему миру могли использовать его для своих ИИ-моделей.
Комплексный подход
Чтобы абазинский язык был действительно сохранён, необходимы две ключевые вещи:
ИИ-Переводчик
Созданием корпуса и обучением модели занимается наша команда.
Распознавание и синтез речи
Превращает текст в естественную речь. Этим занимается Фонд им. Баграта Шинкуба.
При поддержке
Проект реализован по инициативе Команды Абазашты при финансовой поддержке:
Какие возможности это откроет
Что станет возможным с качественным переводчиком, распознаванием и синтезом речи
Абазинский язык станет частью глобальной цифровой экосистемы и будет навсегда защищён от вымирания.
Как это работает
Переводите
Получайте предложения на русском языке и переводите их на абазинский. Машинный перевод уже подготовлен как подсказка.
Качество важнее всего
Следуйте правилам перевода. Ваша работа проходит модерацию для обеспечения высокого качества корпуса.
Получайте награды
Зарабатывайте XP, соревнуйтесь в рейтинге и получайте денежное вознаграждение за качественную работу.