Mykola

ML Engineer, 70 000 UAH

Employment type:
full-time, part-time
Age:
45 years
City of residence:
Other countries
Ready to work:
Remote

Contact information

The job seeker has entered a phone number and email.

Name, contacts and photo are only available to registered employers. To access the candidates' personal information, log in as an employer or sign up.

Work experience

Machine Learning Engineer

from 03.2022 to 05.2026 (4 years 3 months)
AI Pro, Дистанційно (IT)

Побудував RAG систему для технічної документації (100k+ документів, ~25M токенів)
Сервіс обслуговує:
~8,000+ активних користувачів/місяць
~1,200+ DAU
пік: ~120–150 RPS
Оптимізував inference pipeline:
latency: 3.8s → 1.6s (P95)
cost ↓ на 38%
Реалізував autoscaling (GPU + CPU ноди) під навантаження
Впровадив monitoring + alerting → uptime 99.9%.

Приклад кейсiв
1. Production RAG система (high-load)
Архітектура: LLM (Mistral 7B) + embeddings + FAISS
Дані: 100k+ документів, ~10GB тексту
Навантаження:
~120 RPS (пікове)
~1.5M запитів/день
Оптимізації:
smart chunking + reranking
caching (Redis)
Результат:
latency ↓ на 50%
↑ релевантність відповідей на ~40%
скорочення часу пошуку для інженерів у 10+ разів

2. Масштабування LLM inference (GPU optimization)
Початково:
1 запит = 1 GPU inference (~3–5 сек)
Впровадив:
batching (до 16 запитів)
INT8/INT4 quantization
async pipeline
Після:
throughput ↑ у 6 разів
latency P95 ~1.5 сек
GPU utilization ↑ з ~35% до ~85%

ML Engineer

from 10.2019 to 02.2022 (2 years 5 months)
Innovatech, Київ (IT)

NLP сервіси з навантаженням:
~2–5 млн запитів/день
~30–50 RPS стабільно
Розробив embedding search систему (top-k retrieval <100ms)
Інтегрував ML у backend продукти

Приклад кейса:
Fine-tuning LLM під технічний домен
Dataset: ~50k прикладів (інженерні тексти, документація)
LoRA fine-tuning (1–2 GPU)
Evaluation pipeline (custom metrics + human eval)
Результат:
↓ hallucinations ~30%
↑ accuracy відповідей у домені ~35%

Knowledge and skills

  • LLM
  • TensorFlow
  • PyTorch
  • MLOps
  • FineTu
  • Fine-tuning

Additional information

ML Engineer з 7+ роками досвіду у розробці та масштабуванні ML/NLP систем. Спеціалізуюсь на LLM, RAG-архітектурах та production-ready MLOps. Маю досвід побудови високонавантажених систем із тисячами користувачів та оптимізації витрат інфраструктури.

Machine Learning / NLP:
LLM (LLaMA 2/3, Mistral 7B), fine-tuning (LoRA, PEFT)
Embeddings, semantic search, RAG
Quantization (INT8/INT4), distillation

Технології:
Python, PyTorch, TensorFlow
Hugging Face, LangChain, LlamaIndex
FastAPI, REST

MLOps:
MLflow, W&B
CI/CD, Airflow
Monitoring: Prometheus, Grafana

Інфраструктура:
AWS, RunPod
Docker
Linux / Bash
PostgreSQL

Similar candidates

All similar candidates

Candidates at categories

Candidates by city


Compare your requirements and salary with other companies' jobs: