Nous recherchons un

Data Engineer LLM / RAG

Retour à la liste des offres
Retour

Data Engineer LLM / RAG

  • CDI (Permanent)
  • Temps plein
  • Kiev, Kyiv city, Ukraine
Postuler
Marque
BNP Paribas
Horaires
Temps plein
Référence
5000000416
Mise à jour le 26.06.2026

ПРО НАС

UKRSIBBANK BNP Paribas Group - один з найбільших універсальних банків України. Ми об’єднуємо досвід та креативність у своїй команді, створюючи відкрите та інклюзивне середовище для розвитку кожного працівника. 

Наші цінності – це відданість, інновації та відкритість, які допомагають нам досягати успіху в сфері банкінгу та робити позитивний вплив на суспільство.

Ми дякуємо нашим захисникам та захисницям, які віддано боронять свободу та незалежність України, та створюємо сприятливе середовище для роботи в банку.

З 2020 року UKRSIBBANK BNP Paribas Group  проходить сертифікацію кращого роботодавця в Україні та Європі – Top Employer. Це єдиний банк в Україні, який має міжнародну сертифікацію Top Employers Institute.

Ми в пошуку Провідного інженера-програміста:

Ми шукаємо Data Engineer із виразним фокусом на LLM / RAG, який відповідатиме за побудову, автоматизацію та підтримку конвеєрів обробки даних для прикладних AI-рішень у напрямах ETL/ELT, підготовки даних для LLM і RAG (розбір документів, поділ на фрагменти,побудова ембедингів, індексація у векторних сховищах, формування контексту для моделей), журналювання та простежуваності AI-рішень,а також інтеграції з корпоративною платформою даних на базі open-source стеку та сервісів Azure, включно з даними з банківських legacy-систем як одного з важливих джерел.

Роль передбачає тісну взаємодію з Solution Architect, командою Data Science, DevMLOps, System Analyst, QA, Security та Compliance з фокусом на побудову надійних, масштабованих і відтворюваних конвеєрів обробки даних для LLM / RAG-рішень корпоративного рівня, що відповідають вимогам управління, контролю та аудиту.

Ключові зони відповідальності

  • Будувати та підтримувати ETL/ELT-конвеєри обробки даних для AI/ML та LLM-рішень: отримання даних, перетворення, перевірка якості, завантаження, оркестрація через Apache Airflow / Prefect та інтеграція з CI/CD (GitLab CI, Azure DevOps).
  • Будувати та підтримувати конвеєри підготовки даних для RAG і LLM-сценаріїв: розбір документів, поділ на фрагменти (fixed, semantic, recursive), генерація ембедингів, індексація та супровід векторних сховищ (Qdrant, OpenSearch kNN, Milvus), збагачення метаданих, інкрементальні оновлення, формування та контроль якості контексту для моделей.
  • Забезпечувати інфраструктуру журналювання та простежуваності для AI- та LLM-рішень: журналювання прогнозів і взаємодії з LLM (запити, відповіді, токени, затримка), аудит використання моделей, простежуваність походження даних і контексту, а також конвеєри аудиторського сліду для відповідності вимогам та управління даними.
  • Впроваджувати та підтримувати механізми контролю якості даних для AI / LLM-рішень: автоматизовану валідацію даних, керування схемами, контракти даних, виявлення аномалій у потоках даних, контроль якості контексту та звітність щодо якості.
  • Інтегрувати конвеєри даних для AI та LLM із корпоративною платформою даних: Cloudera (CDP/CML), Spark, Hive, HDFS, забезпечуючи безшовний потік даних між корпоративним сховищем даних, банківськими legacy-системами як джерелами даних, конвеєрами пошуку релевантного контексту та компонентами AI-платформи.
  • Будувати та підтримувати шар надання даних: REST / gRPC API (FastAPI), подієво-орієнтовану інтеграцію (Kafka / RabbitMQ), кешування даних (Redis) для забезпечення швидкого доступу до даних і контексту для AI- та LLM-компонентів.
  • Забезпечувати управління даними та відповідність вимогам: документування походження даних, каталогізацію даних, політики зберігання, анонімізацію / псевдонімізацію даних відповідно до GDPR, EU AI Act та банківських вимог.
  • Розробляти та підтримувати документацію для конвеєрів даних: специфікації, схеми потоків даних, словники даних, описи процесів добору контексту, робочі інструкції, визначення SLA та процедури реагування на інциденти.

Ми в пошуку фахівця, який має:

  • Вищу освіту.
  • Від 3 років досвіду в Data Engineering / ETL Development / Data Platform Engineering, з яких щонайменше 1 рік — у побудові конвеєрів обробки даних для AI/ML-рішень, зокрема для сценаріїв LLM / RAG, або корпоративних платформ даних.
  • Практичний досвід побудови та підтримки ETL/ELT-конвеєрів із використанням Apache Airflow / Prefect та Apache Spark.
  • Досвід роботи з Python, SQL та базами даних (PostgreSQL / Oracle, Elasticsearch / OpenSearch) у промисловому середовищі, включно з інтеграцією гетерогенних корпоративних джерел даних та, бажано, банківських legacy-систем.
  • Досвід або розуміння побудови конвеєрів даних для RAG / LLM-сценаріїв: розбір документів, поділ на фрагменти, побудова ембедингів, індексація у векторних сховищах, підготовка контексту для моделей.
  • Розуміння специфіки LLM-рішень: підготовка даних для inference та evaluation, журналювання взаємодії з моделями, контроль якості контексту й результатів, базове розуміння затримок, використання токенів і якості добору контексту.
  • Досвід роботи з сервісами Azure для роботи з даними та AI/LLM-сценаріями або з подібними хмарними платформами.
  • Здатність працювати у регульованому середовищі з вимогами до простежуваності даних, аудиту, управління даними та відповідності вимогам.
  • Досвід роботи у банку або фінтех-компанії буде значною перевагою.

Обов'язкові навички

  • Інженерія даних: проєктування та розробка ETL/ELT-конвеєрів, моделювання даних, контроль якості даних, простежуваність даних, пакетна та потокова обробка.
  • Оркестрація: Apache Airflow / Prefect — проєктування DAG, керування залежностями, обробка помилок, моніторинг SLA, сповіщення.
  • Big Data: Apache Spark (PySpark), SQL — для масштабної обробки даних у корпоративному середовищі.
  • Бази даних і сховища: PostgreSQL, OpenSearch / Elasticsearch, Redis, S3 / MinIO / Azure Blob. Python — основна мова для побудови конвеєрів даних, ETL і валідації даних; SQL - для перетворення даних і перевірок якості.
  • CI/CD для Data: інтеграція конвеєрів даних у GitLab CI / Azure DevOps, автоматизоване тестування, контроль версій для коду конвеєрів.
  • Управління даними: документування походження даних, звітність щодо якості даних, керування схемами, контракти даних, розуміння вимог compliance.

Окрім команди однодумців та цікавої роботи ви отримаєте.

Стабільність:

  • Працевлаштування з дотриманням вимог чинного законодавства України 
  • своєчасна виплата заробітної плати 
  • програми медичного страхування та страхування життя
  • 25 днів щорічної відпустки, додаткові дні відпустки на пам’ятні події, соціальні відпустки у відповідності до законодавства України
  • щорічні перегляди заробітної плати відповідно до персональної ефективності та фінансових показників банку
  • встановлення строку випробування відповідно до вимог чинного законодавства

Розвиток своїх талантів заради кар’єри:

  • можливість навчання: Школа лідера, Сервіс дизайну, Бізнес аналітики, Data, Digital, Agile та програму розвитку талантів I-Players та широкий набір мікро-тренінгів (SQL, BI, EQ, тощо)
  • можливість брати участь у програмі внутрішньої та міжнародної мобільності до BNP Paribas Group
  • підтримку працівників постійно навчатись та професійно розвиватись. Щороку наші працівники складають індивідуальний план розвитку разом з керівником чи ментором і впевнено рухаються до мети

Краще місце для роботи:

  • Робота з періодичною можливістю працювати дистанційно
  • програму «War&Life balance: як повернути життя в життя» — це практичні воркшопи з фахівцями для підтримки емоційного стану
  • в рамках програми «New Ways of Working» дайджест з порадами від експертів щодо підтримки фізичного та ментального здоров’я
  • різноманітність, інклюзивність
  • залучення до проєктів сталого розвитку та корпоративно-соціальної відповідальності
     

Бажаєш дізнатися більше? 
 Додаткова інформація може бути надана на наступних етапах розгляду вакансії.

#veteranfriendly  

BNP Paribas

Leader européen des services bancaires et financiers, BNP Paribas est présent dans 64 pays et rassemble près de 178 000 collaborateurs, dont plus de 144 000 en Europe. Le Groupe détient des positions clés dans ses trois grands pôles opérationnels : Commercial, Personal Banking & Services pour l’ensemble des banques commerciales du Groupe et plusieurs métiers spécialisés parmi lesquels BNP Paribas Personal Finance ou encore Arval; Investment & Protection Services pour les solutions d’épargne, d’investissement et de protection ; et Corporate & Institutional Banking, centré sur les clientèles Entreprises et Institutionnels.

Fort d’un solide modèle diversifié et intégré, le Groupe accompagne l’ensemble de ses clients (particuliers, associations, entrepreneurs, PME, grandes entreprises et institutionnels) pour les aider à réaliser leurs projets en leur proposant des services de financement, d’investissement, d’épargne ou de protection.

En Europe, BNP Paribas est composé de quatre marchés domestiques : la Belgique, la France, l'Italie et le Luxembourg. Le Groupe déploie également son modèle intégré de banque commerciale dans les pays du bassin méditerranéen, en Turquie et en Europe de l’Est. Acteur bancaire international de premier plan, le Groupe dispose de plateformes et de métiers leaders en Europe, d’une forte présence dans la zone Amériques, ainsi que d’un dispositif solide et en forte croissance en Asie-Pacifique. BNP Paribas met en œuvre dans l’ensemble de ses activités une démarche de Responsabilité Sociale et Environnementale lui permettant de contribuer à la construction d’un futur durable, tout en assurant la performance et la stabilité du Groupe.