We are looking for

Data Engineer LLM / RAG

Back to offers list
Retour

Data Engineer LLM / RAG

  • Permanent
  • Full time
  • Kyiv, Kyiv city, Ukraine
Apply
Job type
Permanent
Brand
BNP Paribas
Schedule
Full time
Reference
5000000416
Last update 26.06.2026

ПРО НАС

UKRSIBBANK BNP Paribas Group - один з найбільших універсальних банків України. Ми об’єднуємо досвід та креативність у своїй команді, створюючи відкрите та інклюзивне середовище для розвитку кожного працівника. 

Наші цінності – це відданість, інновації та відкритість, які допомагають нам досягати успіху в сфері банкінгу та робити позитивний вплив на суспільство.

Ми дякуємо нашим захисникам та захисницям, які віддано боронять свободу та незалежність України, та створюємо сприятливе середовище для роботи в банку.

З 2020 року UKRSIBBANK BNP Paribas Group  проходить сертифікацію кращого роботодавця в Україні та Європі – Top Employer. Це єдиний банк в Україні, який має міжнародну сертифікацію Top Employers Institute.

Ми в пошуку Провідного інженера-програміста:

Ми шукаємо Data Engineer із виразним фокусом на LLM / RAG, який відповідатиме за побудову, автоматизацію та підтримку конвеєрів обробки даних для прикладних AI-рішень у напрямах ETL/ELT, підготовки даних для LLM і RAG (розбір документів, поділ на фрагменти,побудова ембедингів, індексація у векторних сховищах, формування контексту для моделей), журналювання та простежуваності AI-рішень,а також інтеграції з корпоративною платформою даних на базі open-source стеку та сервісів Azure, включно з даними з банківських legacy-систем як одного з важливих джерел.

Роль передбачає тісну взаємодію з Solution Architect, командою Data Science, DevMLOps, System Analyst, QA, Security та Compliance з фокусом на побудову надійних, масштабованих і відтворюваних конвеєрів обробки даних для LLM / RAG-рішень корпоративного рівня, що відповідають вимогам управління, контролю та аудиту.

Ключові зони відповідальності

  • Будувати та підтримувати ETL/ELT-конвеєри обробки даних для AI/ML та LLM-рішень: отримання даних, перетворення, перевірка якості, завантаження, оркестрація через Apache Airflow / Prefect та інтеграція з CI/CD (GitLab CI, Azure DevOps).
  • Будувати та підтримувати конвеєри підготовки даних для RAG і LLM-сценаріїв: розбір документів, поділ на фрагменти (fixed, semantic, recursive), генерація ембедингів, індексація та супровід векторних сховищ (Qdrant, OpenSearch kNN, Milvus), збагачення метаданих, інкрементальні оновлення, формування та контроль якості контексту для моделей.
  • Забезпечувати інфраструктуру журналювання та простежуваності для AI- та LLM-рішень: журналювання прогнозів і взаємодії з LLM (запити, відповіді, токени, затримка), аудит використання моделей, простежуваність походження даних і контексту, а також конвеєри аудиторського сліду для відповідності вимогам та управління даними.
  • Впроваджувати та підтримувати механізми контролю якості даних для AI / LLM-рішень: автоматизовану валідацію даних, керування схемами, контракти даних, виявлення аномалій у потоках даних, контроль якості контексту та звітність щодо якості.
  • Інтегрувати конвеєри даних для AI та LLM із корпоративною платформою даних: Cloudera (CDP/CML), Spark, Hive, HDFS, забезпечуючи безшовний потік даних між корпоративним сховищем даних, банківськими legacy-системами як джерелами даних, конвеєрами пошуку релевантного контексту та компонентами AI-платформи.
  • Будувати та підтримувати шар надання даних: REST / gRPC API (FastAPI), подієво-орієнтовану інтеграцію (Kafka / RabbitMQ), кешування даних (Redis) для забезпечення швидкого доступу до даних і контексту для AI- та LLM-компонентів.
  • Забезпечувати управління даними та відповідність вимогам: документування походження даних, каталогізацію даних, політики зберігання, анонімізацію / псевдонімізацію даних відповідно до GDPR, EU AI Act та банківських вимог.
  • Розробляти та підтримувати документацію для конвеєрів даних: специфікації, схеми потоків даних, словники даних, описи процесів добору контексту, робочі інструкції, визначення SLA та процедури реагування на інциденти.

Ми в пошуку фахівця, який має:

  • Вищу освіту.
  • Від 3 років досвіду в Data Engineering / ETL Development / Data Platform Engineering, з яких щонайменше 1 рік — у побудові конвеєрів обробки даних для AI/ML-рішень, зокрема для сценаріїв LLM / RAG, або корпоративних платформ даних.
  • Практичний досвід побудови та підтримки ETL/ELT-конвеєрів із використанням Apache Airflow / Prefect та Apache Spark.
  • Досвід роботи з Python, SQL та базами даних (PostgreSQL / Oracle, Elasticsearch / OpenSearch) у промисловому середовищі, включно з інтеграцією гетерогенних корпоративних джерел даних та, бажано, банківських legacy-систем.
  • Досвід або розуміння побудови конвеєрів даних для RAG / LLM-сценаріїв: розбір документів, поділ на фрагменти, побудова ембедингів, індексація у векторних сховищах, підготовка контексту для моделей.
  • Розуміння специфіки LLM-рішень: підготовка даних для inference та evaluation, журналювання взаємодії з моделями, контроль якості контексту й результатів, базове розуміння затримок, використання токенів і якості добору контексту.
  • Досвід роботи з сервісами Azure для роботи з даними та AI/LLM-сценаріями або з подібними хмарними платформами.
  • Здатність працювати у регульованому середовищі з вимогами до простежуваності даних, аудиту, управління даними та відповідності вимогам.
  • Досвід роботи у банку або фінтех-компанії буде значною перевагою.

Обов'язкові навички

  • Інженерія даних: проєктування та розробка ETL/ELT-конвеєрів, моделювання даних, контроль якості даних, простежуваність даних, пакетна та потокова обробка.
  • Оркестрація: Apache Airflow / Prefect — проєктування DAG, керування залежностями, обробка помилок, моніторинг SLA, сповіщення.
  • Big Data: Apache Spark (PySpark), SQL — для масштабної обробки даних у корпоративному середовищі.
  • Бази даних і сховища: PostgreSQL, OpenSearch / Elasticsearch, Redis, S3 / MinIO / Azure Blob. Python — основна мова для побудови конвеєрів даних, ETL і валідації даних; SQL - для перетворення даних і перевірок якості.
  • CI/CD для Data: інтеграція конвеєрів даних у GitLab CI / Azure DevOps, автоматизоване тестування, контроль версій для коду конвеєрів.
  • Управління даними: документування походження даних, звітність щодо якості даних, керування схемами, контракти даних, розуміння вимог compliance.

Окрім команди однодумців та цікавої роботи ви отримаєте.

Стабільність:

  • Працевлаштування з дотриманням вимог чинного законодавства України 
  • своєчасна виплата заробітної плати 
  • програми медичного страхування та страхування життя
  • 25 днів щорічної відпустки, додаткові дні відпустки на пам’ятні події, соціальні відпустки у відповідності до законодавства України
  • щорічні перегляди заробітної плати відповідно до персональної ефективності та фінансових показників банку
  • встановлення строку випробування відповідно до вимог чинного законодавства

Розвиток своїх талантів заради кар’єри:

  • можливість навчання: Школа лідера, Сервіс дизайну, Бізнес аналітики, Data, Digital, Agile та програму розвитку талантів I-Players та широкий набір мікро-тренінгів (SQL, BI, EQ, тощо)
  • можливість брати участь у програмі внутрішньої та міжнародної мобільності до BNP Paribas Group
  • підтримку працівників постійно навчатись та професійно розвиватись. Щороку наші працівники складають індивідуальний план розвитку разом з керівником чи ментором і впевнено рухаються до мети

Краще місце для роботи:

  • Робота з періодичною можливістю працювати дистанційно
  • програму «War&Life balance: як повернути життя в життя» — це практичні воркшопи з фахівцями для підтримки емоційного стану
  • в рамках програми «New Ways of Working» дайджест з порадами від експертів щодо підтримки фізичного та ментального здоров’я
  • різноманітність, інклюзивність
  • залучення до проєктів сталого розвитку та корпоративно-соціальної відповідальності
     

Бажаєш дізнатися більше? 
 Додаткова інформація може бути надана на наступних етапах розгляду вакансії.

#veteranfriendly