.

.

.

Senior GenAI Engineer — LLMs / RAG / Python (w/m/d) — Remote in Deutschland

StandortVollständig remote — Deutschland | Frankfurt (≤ 4 Tage/Monat Reise)
Gehalt80.000 – 100.000 € brutto p.a.
VerfügbarkeitAb sofort
ArbeitgeberWird nach dem Erstgespräch bekannt gegeben — vermittelt durch Talents2Germany

Was du aufbauen wirst

  • Konzeption und Verantwortung für End-to-End-RAG-Pipelines — von der Dokumentenaufnahme und Chunking-Strategie bis zur Retrieval-Evaluierung und Antwortqualität
  • Bewertung, Fine-Tuning und Deployment von LLMs (OpenAI, Anthropic, Open-Source) für domänenspezifische deutschsprachige Anwendungsfälle
  • Architektur robuster, skalierbarer KI-Systeme unter Einhaltung von Enterprise-Anforderungen an Zuverlässigkeit und Compliance
  • Aufbau von Evaluierungsrahmen — automatisierte Evals, Human-in-the-Loop-Tests, Regressions-Suites — zur Sicherstellung der Produktionszuverlässigkeit
  • Zusammenarbeit mit Fullstack-Entwickler:innen zur Bereitstellung von KI-Funktionen über saubere APIs und intuitive Produktoberflächen
  • Enge Zusammenarbeit mit Unternehmenskunden: Anforderungen verstehen, in technische Lösungen übersetzen und maßgeschneiderte Ergebnisse liefern
  • Verfolgung aktueller GenAI-Entwicklungen und kurzfristige Übersetzung relevanter Forschung in praktische Produktverbesserungen

Was wir suchen

Technische Anforderungen

  • 5+ Jahre Softwareentwicklungserfahrung, davon mindestens 2 Jahre in angewandter KI/ML in Produktionsumgebungen
  • Tiefe Python-Kenntnisse — du schreibst sauberen, testbaren, produktionsreifen Code (nicht nur Notebooks)
  • Praktische Erfahrung mit RAG-Architekturen und Vector-Datenbanken (Pinecone, Weaviate, Qdrant o.ä.)
  • Fundiertes Wissen über mindestens einen großen LLM-Anbieter (OpenAI, Anthropic, Cohere) und Best Practices im Prompt Engineering
  • Solides Verständnis von MLOps: Modell-Versionierung, Deployment, Monitoring und graceful Degradation in der Produktion
  • Erfahrung mit Orchestrierungs-Frameworks wie LangChain, LlamaIndex o.ä.

Persönlichkeit & Arbeitsweise

  • Du überbrückst den Weg von der Forschung zur Produktion schneller als jede:r andere im Team
  • Deutschkenntnisse auf B1/B2-Niveau und Bereitschaft, innerhalb von 6 Monaten C1-Niveau zu erreichen
  • Sicherer Umgang mit Unklarheiten — du definierst das Problem und schlägst die Lösung vor, anstatt auf ein Spec-Dokument zu warten

Besonders willkommen

  • Erfahrung mit mehrsprachigen NLP-Aufgaben, insbesondere deutschsprachiger Textverarbeitung
  • Fine-Tuning oder RLHF-Erfahrung (LoRA, QLoRA, DPO)
  • Kenntnisse in Multi-Agent-Frameworks (LangGraph, CrewAI, AutoGen)
  • Hintergrund in Enterprise-KI-Deployments, Information Retrieval oder Wissensgraphen
  • Open-Source-GenAI-Projekte, technische Artikel oder Community-Beiträge (GitHub, HuggingFace, arXiv)

Vergütung & Benefits

Gehalt80.000 – 100.000 € brutto jährlich
Urlaub30 Urlaubstage + gesetzliche Feiertage in Deutschland

Wie wir arbeiten

Vollständig remote-first mit einem internationalen Team. Gelegentliche Reisen nach Frankfurt erforderlich (bis zu 4 Tage/Monat).

Unser Bewerbungsprozess

  • Erstgespräch
  • Technisches Screening
  • HR-Interview
  • Engineering-Panel
  • Gespräch zu Kultur & Werten

Jetzt bewerben

Bereit, an echten GenAI-Herausforderungen zu arbeiten? Bewirb dich über das untenstehende Formular — nur dein Lebenslauf, kein Anschreiben nötig. Oder melde dich direkt, wenn du zuerst sprechen möchtest.

Fragen? Marek Scheier · hr@talents2germany.de