+7 499 703 00 29

LLM Research Engineer / Applied Scientist

Ваши ключевые задачи:

  • Построить pipeline сбора, очистки, нормализации и валидирования доменных данных;
  • Разработать процесс ручной разметки: подходы, инструкции, инструменты, контроль качества;
  • Проектировать и реализовывать обучение узкоспециализированной LLM: pretraining/fine-tuning/SFT/continual learning;
  • Разработать RL-контур (RLHF / RLAIF / preference learning) для повышения качества модели;
  • Создать систему оценки модели: тесты, benchmarks, сложные сценарии, edge-cases финтех-домена;
  • Построить архитектуру постоянного дообучения модели с учётом обновлений данных, документов, требований;
  • Проектировать методы контроля качества и предотвращения галлюцинаций: grounding, retrieval, consistency checks;
  • Выбирать архитектуры моделей, экспериментировать с лоссами, оптимизацией, методами регуляризации;
  • Построить LLMOps-процесс: хранение данных и артефактов, версиями, эксперименты, воспроизводимость;
  • Участвовать в интеграции модели в продукты и определении требований к inference-уровню.

Мы ожидаем от вас:

  • Сильная математика и глубокое понимание современных языковых моделей;
  • Реальный опыт fine-tuning LLM (SFT/PEFT/LoRA/QLoRA) и построения обучающих пайплайнов;
  • Опыт применения RL для языковых моделей (предпочтения, policy optimization);
  • Навыки построения текстовых датасетов: парсинг, фильтрация, дедупликация, кластеризация, автоматическая валидация;
  • Опыт организации ручной разметки и контроля качества разметчиков;
  • Отличное владение PyTorch / JAX / фреймворками ускоренного обучения;
  • Понимание retrieval-систем и подходов к fact-grounding;
  • Навык построения систем постоянного дообучения (continual / periodic training);
  • Умение работать с большими корпусами текстов и сложной корпоративной документацией;
  • Продуктовое мышление: способность формировать требования и целевую точность модели.

Будет плюсом:

  • Опыт создания узкоспециализированных моделей (legal, fintech, regulatory, knowledge-intensive NLP);
  • Участие в исследованиях или публикациях по оптимизации LLM, RL или обучению на ограниченных данных;
  • Опыт построения моделей в условиях строгой безопасности данных.

Отправить резюме

Нажимая кнопку «Отправить», я даю согласие на обработку своих персональных данных и подтверждаю, что ознакомлен(а) и согласен(а) с условиями Политики конфиденциальностиПользовательского соглашения и Политикой обработки персональных данных.

Спасибо за обращение,
мы свяжемся с вами в ближайшее время

Ошибка!
Обновите сраницу и попробуйте еще раз

Обратный звонок

 

Нажимая кнопку «Заказать звонок», я даю согласие на обработку своих персональных данных и подтверждаю, что ознакомлен(а) и согласен(а) с условиями Политики конфиденциальностиПользовательского соглашения и Политикой обработки персональных данных.

Спасибо за обращение,
мы свяжемся с вами в ближайшее время

Ошибка!
Обновите сраницу и попробуйте еще раз