Mykola
ML Engineer, 70 000 грн
- Вид зайнятості:
- повна, неповна
- Вік:
- 45 років
- Місто проживання:
- Інші країни
- Готовий працювати:
- Дистанційно
Контактна інформація
Шукач вказав телефон та ел. пошту.
Прізвище, контакти та світлина доступні тільки для зареєстрованих роботодавців. Щоб отримати доступ до особистих даних кандидатів, увійдіть як роботодавець або зареєструйтеся.
Отримати контакти цього кандидата можна на сторінці https://www.work.ua/resumes/18284640/
Досвід роботи
Machine Learning Engineer
з 03.2022 по 05.2026
(4 роки 3 місяці)
AI Pro, Дистанційно (IT)
Побудував RAG систему для технічної документації (100k+ документів, ~25M токенів)
Сервіс обслуговує:
~8,000+ активних користувачів/місяць
~1,200+ DAU
пік: ~120–150 RPS
Оптимізував inference pipeline:
latency: 3.8s → 1.6s (P95)
cost ↓ на 38%
Реалізував autoscaling (GPU + CPU ноди) під навантаження
Впровадив monitoring + alerting → uptime 99.9%.
Приклад кейсiв
1. Production RAG система (high-load)
Архітектура: LLM (Mistral 7B) + embeddings + FAISS
Дані: 100k+ документів, ~10GB тексту
Навантаження:
~120 RPS (пікове)
~1.5M запитів/день
Оптимізації:
smart chunking + reranking
caching (Redis)
Результат:
latency ↓ на 50%
↑ релевантність відповідей на ~40%
скорочення часу пошуку для інженерів у 10+ разів
2. Масштабування LLM inference (GPU optimization)
Початково:
1 запит = 1 GPU inference (~3–5 сек)
Впровадив:
batching (до 16 запитів)
INT8/INT4 quantization
async pipeline
Після:
throughput ↑ у 6 разів
latency P95 ~1.5 сек
GPU utilization ↑ з ~35% до ~85%
ML Engineer
з 10.2019 по 02.2022
(2 роки 5 місяців)
Innovatech, Київ (IT)
NLP сервіси з навантаженням:
~2–5 млн запитів/день
~30–50 RPS стабільно
Розробив embedding search систему (top-k retrieval <100ms)
Інтегрував ML у backend продукти
Приклад кейса:
Fine-tuning LLM під технічний домен
Dataset: ~50k прикладів (інженерні тексти, документація)
LoRA fine-tuning (1–2 GPU)
Evaluation pipeline (custom metrics + human eval)
Результат:
↓ hallucinations ~30%
↑ accuracy відповідей у домені ~35%
Знання і навички
- LLM
- TensorFlow
- PyTorch
- MLOps
- FineTu
- Fine-tuning
Додаткова інформація
ML Engineer з 7+ роками досвіду у розробці та масштабуванні ML/NLP систем. Спеціалізуюсь на LLM, RAG-архітектурах та production-ready MLOps. Маю досвід побудови високонавантажених систем із тисячами користувачів та оптимізації витрат інфраструктури.
Machine Learning / NLP:
LLM (LLaMA 2/3, Mistral 7B), fine-tuning (LoRA, PEFT)
Embeddings, semantic search, RAG
Quantization (INT8/INT4), distillation
Технології:
Python, PyTorch, TensorFlow
Hugging Face, LangChain, LlamaIndex
FastAPI, REST
MLOps:
MLflow, W&B
CI/CD, Airflow
Monitoring: Prometheus, Grafana
Інфраструктура:
AWS, RunPod
Docker
Linux / Bash
PostgreSQL
Схожі кандидати
-
AI engineer
Дистанційно -
Спеціаліст з ШІ
Дистанційно -
Ai creator
35000 грн, Дистанційно, Запоріжжя -
Automation Engineer (AI)
95000 грн, Дистанційно, Дніпро -
AI creator
Дистанційно, Київ -
AI-креатор
100000 грн, Дистанційно