Senior AI-Engineer / Agent-Architekt (m/w/d)

Neurawork GmbH & Co. KG

Jetzt bewerben
KI generiert

Job Zusammenfassung

Du entwickelst eine AI-Agent-Plattform für Firmenkunden und baust RAG-Pipelines. Du sorgst dafür, dass die KI-Ergebnisse erklärbar und nachvollziehbar sind.

Über den Job:

NeuraPlox sucht den Engineer, der unsere AI-Agent-Plattform für Enterprise-Kunden in regulierten Branchen baut.

Kein Tutorial-LLM, kein Vibe-Engineering, keine Demo-RAGs, die bei 10k Embeddings auseinanderfallen. Wir bauen explainable AI mit Audit-Lineage, Decision-Provenance und pgvector at scale, weil unsere Kunden ihre KI-Outputs nicht nur erklären wollen, sondern müssen. Investor-backed, München-Region.


AUFGABEN

Was du bei uns baust


  • Production-grade AI-Agent-Plattform mit PydanticAI, LiteLLM, Langfuse
  • RAG-Pipelines mit pgvector at scale (Multi-Tenant-Isolation, Index-Rebuild-Strategie, Hybrid Search)
  • Multi-Tenant Token-Quota-Service plus Eval-Frameworks pro Tenant
  • MCP (Model Context Protocol) Tool-Integration als First-Class-Citizen
  • Explainable Outputs, lückenlose Auditierbarkeit von Prompt bis Output für regulierte Branchen
  • Architektur-Entscheidungen, die im Bank-, Versicherungs- und Pharma-Kontext halten

Wie wir arbeiten


  • Eval-driven, nicht Vibe-driven. Jeder Agent-Change geht durch eine Eval-Suite.
  • ADRs für jede relevante Architektur-Entscheidung, nicht im Slack-Thread vergraben
  • LLM-Calls werden gemessen, nicht geraten - Langfuse von Tag eins
  • Re-Ranking, pgvector-Sizing und Retrieval-Quality werden empirisch entschieden
  • Direkter Draht zum Founding-Team, kein Layer aus Project Managern dazwischen

QUALIFIKATION

Was wir suchen


  • 5+ Jahre Python-Production-Engineering
  • Echte Production-LLM-Erfahrung mit Tokens, Latenz, Cost und Eval als täglicher Realität
  • RAG-Engineering mit pgvector-Sizing und Re-Ranking, nicht nur "ich kenne LangChain"
  • LangGraph, PydanticAI oder vergleichbares Agent-Framework in Produktion eingesetzt
  • LiteLLM, Langfuse, MCP - oder Bereitschaft, dich in 2 Wochen einzuarbeiten

Tech-Stack:

Python, FastAPI, PydanticAI, LangGraph, LiteLLM, Langfuse, pgvector, MCP, Kubernetes-Grundlagen.


BENEFITS

Du willst endlich unter gleichgesinnten, echten Profis an einer richtig performanten Lösung arbeiten - nicht nur was dir von oben aufgedrückt wird. Bei uns arbeitest du nach technischer Best Practices - nicht was im Management gut ankommt. Tolles Team, viel Freiraum bei deiner Arbeit. Du bestimmst, echter Impact!


Was wir bieten


  • VSOP als Investor-backed Startup für Schlüsselpositionen
  • Voll-remote möglich, Wohnsitz Deutschland - Team-Entwicklungstage ca. 1xMonat im Munich-Office
  • Du reportest direkt an Christoph Knöll (Founder/CEO) und arbeitest eng mit unserem Head of AI
  • Senior-Hire für das AI-Layer, du prägst die Agent-Architektur, nicht "tunest Prompts"

CV plus 3 Sätze, warum genau diese Rolle. Kein Anschreiben-Template.

Wir lesen jede Bewerbung selbst.

Deine Vorteile
bei hokify

Dein Profil. Deine Jobs.

Mobile Jobsuche ohne Anschreiben.

Anfahrt zum Arbeitgeber

Job-ID.: 28953059

Zuletzt aktualisiert vor etwa 9 Stunden

Jobkategorien:

Software EntwicklerIn
Web EntwicklerIn
Datenbank EntwicklerIn, Administrator
IT-BeraterIn
Software-BetreuerIn

Weitere interessante Jobs:

Dein Profil.
Deine Jobs.

Entspannte Jobsuche
ohne Anschreiben

Einfache Bewerbung
via Smartphone