logo

AI Agent Engineer (Realtime Systems & Backend)

Remote/USA · Fluently · Partners · Vacancies
$120 - 180К в год + 0.5% equity
Apply

Мы делаем лучшего в мире AI спикинг коуча, который слушает ваши онлайн колы и помогает прокачивать английский. Недавно прошли Y Combinator и подняли $2.5M. За последние 8 месяцев выросли со $100k до $7.5M ARR. Команда состоит из 15 топовых ребят (prev. Google, Nvidia, Lyft, Amazon), оба фаундера с техническим и рисерч бэкграундом.

Responsibilities

  • Лидить разработку нашего Voice AI Агента (LiveKit): брать end-to-end задачи по voice / real-time пайплайнам, orchestration-логике агента и его интеграции с продуктом; иногда — backend.

    • RealTime Voice AI Agent: Python, LiveKit/WebRTC, streaming ASR/TTS, VAD, diarization, state machines, session management, retries/timeouts, QoS, latency budgets.
    • Agent Logic: tool/function-calling, routing, memory, guardrails, fallback flows, prompt/response orchestration, управление состоянием диалога, reliability и качество agent-сценариев в production.
    • Backend (когда нужно): Nest.js/Node.js, REST/OpenAPI, Drizzle ORM, Supabase/Postgres (RLS, миграции), интеграции с внешними сервисами.
    • ML / Voice Components: training и production deployment моделей там, где это нужно для voice stack’а (ASR, TTS, VAD, speaker/diarization, embeddings, scoring), DSP, ffmpeg/decoding, batch/stream inference, quantization/ONNX/TensorRT, reproducibility.
  • Делать applied ML вокруг LLM: RAG, tool/function-calling, prompt/response routing, safety/guardrails, memory, A/B, баланс качества, latency и стоимости.
  • Проектировать надежные real-time системы: идемпотентность, backpressure, caching/batching, очереди/планировщики, throughput/latency trade-offs, graceful degradation.
  • Вести observability/SLOs: Sentry, Prometheus/Grafana/Loki, tracing, alerts; быстро находить причины и фиксить проблемы.
  • Инфра и deploy: Docker, GitHub Actions, LiveKit Cloud, Modal/Render/AWS, GPU-инференс, secrets management, rollbacks, canary releases.
  • Качество и простота: uv workspaces, ruff/mypy/pytest, pydantic, строгая типизация; в JS/TS — turborepo, ESLint/Prettier, Zod, внутренние CLI/интеграционные тулзы. Документация, code review, OpenAPI, KISS.

Requirements

  • Умение работать много и делать быстро
  • Опыт работы в big tech, VC-backed startups, Yandex
  • Любой (даже неудачный) опыт фаундерства
  • Отсутствие опыта работы в EPAM, аутсорс галерах, Web3, gambling
  • Ребята из МФТИ, МГУ, ВШЭ и ШАДа
  • Kaggle, Codeforces, олимпиады, etc.
  • Contribution to open source github repos, >10 звезд, >500 contributions за год
  • Активный блог, twitter или телеграмм канал
  • Конкретные примеры классных приложений которые вы забилдили или отвечали на какую-то большую часть (нужны ссылки: web, app store, github, etc.)
  • Наличие вкуса, hands-on опыт в дизайне
  • Теплые рекомендации от коллег, CEO/CTO (не linkedin, а authentic)
  • Приятных в общении людей, умение просто и понятно объяснять сложные вещи, способность договариваться, бескрайний оптимизм, etc.

Conditions

  • Работа на больших скоростях: единственное правило — регулярно и много деливерить в прод.
  • Ежедневная работа напрямую с CEO/CTO.
  • Мы ожидаем самостоятельности: надо овнить свои проекты end-to-end.
  • Платим competitive salary (в соответствии с вашим бэкграудом и скиллами):

    • Даем опцион (оценка компании год назад — $20M).
    • Базовая часть растет после PMF и успешно завершенных проектов.
  • Full Async Remote, любая таймзона:

    • Устраиваем через Deel в [почти] любую страну.
    • Не нанимаем людей, находящихся в РФ.
    • Помогаем с визами в США (O-1).
    • Делаем 1-2 off-sites за год, последний был на Бали.
Share this job opening

Application:

I agree to the processing of my personal data in accordance with the AlumniHub Privacy Policy