Job Description
Interr.io — продуктова AI-компанія, яка генерує дизайн інтер'єрів. Ми створюємо продукт, який перетворює фотографії порожніх приміщень на фотореалістичні дизайнерські концепти на основі текстових запитів користувачів.
Наша ціль — створити найрозумнішого автоматичного дизайнера на ринку.
Ми шукаємо ML Engineer, який побудує надійну інфраструктуру для запуску та масштабування цих мультимодальних моделей у продакшені, забезпечуючи низьку затримку та високу якість генерації.
Місія позиції
Побудувати надійну, продуктивну та масштабовану ML-інфраструктуру, яка дозволить interr.io:
- Запускати та підтримувати ML/LLM-функції в продакшені.
- Забезпечувати стабільну якість результатів (боротьба з галюцинаціями).
- Оптимізувати latency, cost та reliability системи.
- Швидко експериментувати та оновлювати моделі.
Твоя головна мета: створити «серце» продукту — ML-системи, які працюють швидко, точно та стабільно.
Обов'язки та зони відповідальності:
- Production ML: РозгоÑÑÐ°Ð½Ð½Ñ Ñа пÑдÑÑимка ML/LLM-моделей Ñ Ð¿ÑодакÑÐµÐ½Ñ (пеÑеÑ
Ñд вÑд Notebooks до мÑкÑоÑеÑвÑÑÑв).
- LLM Engineering: РобоÑа з API (OpenAI, Gemini), open-source моделÑми Ñа ÑÑ
Ð½Ñ fine-tuning.
- RAG Architecture: ÐобÑдова повного ÑÐ¸ÐºÐ»Ñ RAG: embeddings, векÑоÑÐ½Ñ Ð±Ð°Ð·Ð¸ (Pinecone/Qdrant), retrieval ÑÑÑаÑегÑÑ.
- Data Engineering: ÐобÑдова ETL/ELT-пайплайнÑв Ð´Ð»Ñ Ð¿ÑдгоÑовки даниÑ
пÑд ML.
- Integration: ТÑÑна ÑнÑегÑаÑÑÑ Ð¼Ð¾Ð´ÐµÐ»ÐµÐ¹ Ñз backend-ÑеÑвÑÑами (FastAPI/Flask).
- Optimization: ÐÐ½Ð¸Ð¶ÐµÐ½Ð½Ñ Ð·Ð°ÑÑимок (latency) Ñа ваÑÑоÑÑÑ ÑокенÑв, ÑобоÑа з пÑопÑÑÐºÐ½Ð¾Ñ Ð·Ð´Ð°ÑнÑÑÑÑ (throughput).
- Evaluation: СÑвоÑÐµÐ½Ð½Ñ ÑиÑÑеми авÑомаÑиÑниÑ
ÑеÑÑÑв Ñ Ð±ÐµÐ½ÑмаÑкÑв Ð´Ð»Ñ Ð¾ÑÑнки ÑкоÑÑÑ Ð¼Ð¾Ð´ÐµÐ»ÐµÐ¹ Ñ Ð¿ÑомпÑÑв.
У Ð½Ð°Ñ Ð²ÑдбÑдеÑÑÑÑ Ð¼ÐµÑÑ, ÑкÑо Ñи маÑÑ:
- ÐоÑвÑд: 2.5+ ÑокÑв Ñ ML Engineering / Data Science / NLP.
- ÐÑодакÑн-доÑвÑд впÑÐ¾Ð²Ð°Ð´Ð¶ÐµÐ½Ð½Ñ Ð¼Ð¾Ð´ÐµÐ»ÐµÐ¹.
- Python Strong: ÐÐ»Ð¸Ð±Ð¾ÐºÑ Ð·Ð½Ð°Ð½Ð½Ñ Python (pandas, numpy, scikit-learn, pydantic).
- LLM Stack: ÐоÑвÑд з OpenAI/Anthropic API, HuggingFace, ÑозÑмÑÐ½Ð½Ñ Ð¿ÑинÑипÑв Prompt Engineering.
- RAG & Vector DBs: ÐÑакÑиÑний доÑвÑд Ñз векÑоÑним поÑÑком (Pinecone, Qdrant, Weaviate).
- DevOps Skills: Docker, Kubernetes (базово), CI/CD. Ти маÑÑ ÑозÑмÑÑи, Ñк живе ÑвÑй код на ÑеÑвеÑÑ.
- Metrics: РозÑмÑннÑ, Ñк оÑÑнÑваÑи Ð¼Ð¾Ð´ÐµÐ»Ñ (ROC, precision/recall, LLM eval frameworks).
ÐÑде плÑÑом:
- ÐоÑвÑд Ñз LangChain або LlamaIndex
- ÐÐ½Ð°Ð½Ð½Ñ Ð¼ÐµÑодÑв опÑимÑзаÑÑÑ (quantization, distillation, batching).
- ÐоÑвÑд ÑобоÑи з GPU Ñа Ñ
маÑними пÑовайдеÑами (AWS/GCP/Azure).
- РозÑмÑÐ½Ð½Ñ Ð°ÑÑ
ÑÑекÑÑÑи виÑоконаванÑажениÑ
ÑиÑÑем.
ð¤ Ðи пÑопонÑÑмо:
- Ðплив: Ти бÑдÑÑÑ Ð°ÑÑ
ÑÑекÑÑÑÑ Ð· нÑлÑ. Ð¢Ð²Ð¾Ñ ÑÑÑÐµÐ½Ð½Ñ Ð²Ð¸Ð·Ð½Ð°ÑаÑÑÑ Ð¼Ð°Ð¹Ð±ÑÑÐ½Ñ Ð¿ÑодÑкÑÑ.
- РозвиÑок: ÐÑÑмий ÑлÑÑ
до позиÑÑй Lead ML Engineer або AI Architect.
- ÐомандÑ: ÐÑÑма комÑнÑкаÑÑÑ Ð· ÑаÑндеÑами Ñа ÑилÑÐ½Ð¾Ñ ÑеÑ
нÑÑÐ½Ð¾Ñ ÐºÐ¾Ð¼Ð°Ð½Ð´Ð¾Ñ.
- РемоÑÑ ÑоÑмаÑ.
ÐÑоÑÐµÑ Ð½Ð°Ð¹Ð¼Ñ: Call з ÑекÑÑÑеÑом > Intro-call Ñз менеджеÑом > ТеÑÑове Ð·Ð°Ð²Ð´Ð°Ð½Ð½Ñ > ТеÑ
нÑÑне ÑнÑеÑв'Ñ > ÐÑеÑ.
ÐаÑÑкавило? ÐадÑилай ÑезÑме!