Senior GenAI Engineer — LLMs / RAG / Python (w/m/d) — Remote in Deutschland

Standort	Vollständig remote — Deutschland \| Frankfurt (≤ 4 Tage/Monat Reise)
Gehalt	80.000 – 100.000 € brutto p.a.
Verfügbarkeit	Ab sofort
Arbeitgeber	Wird nach dem Erstgespräch bekannt gegeben — vermittelt durch Talents2Germany

Was du aufbauen wirst

Konzeption und Verantwortung für End-to-End-RAG-Pipelines — von der Dokumentenaufnahme und Chunking-Strategie bis zur Retrieval-Evaluierung und Antwortqualität
Bewertung, Fine-Tuning und Deployment von LLMs (OpenAI, Anthropic, Open-Source) für domänenspezifische deutschsprachige Anwendungsfälle
Architektur robuster, skalierbarer KI-Systeme unter Einhaltung von Enterprise-Anforderungen an Zuverlässigkeit und Compliance
Aufbau von Evaluierungsrahmen — automatisierte Evals, Human-in-the-Loop-Tests, Regressions-Suites — zur Sicherstellung der Produktionszuverlässigkeit
Zusammenarbeit mit Fullstack-Entwickler:innen zur Bereitstellung von KI-Funktionen über saubere APIs und intuitive Produktoberflächen
Enge Zusammenarbeit mit Unternehmenskunden: Anforderungen verstehen, in technische Lösungen übersetzen und maßgeschneiderte Ergebnisse liefern
Verfolgung aktueller GenAI-Entwicklungen und kurzfristige Übersetzung relevanter Forschung in praktische Produktverbesserungen

Was wir suchen

Technische Anforderungen

5+ Jahre Softwareentwicklungserfahrung, davon mindestens 2 Jahre in angewandter KI/ML in Produktionsumgebungen
Tiefe Python-Kenntnisse — du schreibst sauberen, testbaren, produktionsreifen Code (nicht nur Notebooks)
Praktische Erfahrung mit RAG-Architekturen und Vector-Datenbanken (Pinecone, Weaviate, Qdrant o.ä.)
Fundiertes Wissen über mindestens einen großen LLM-Anbieter (OpenAI, Anthropic, Cohere) und Best Practices im Prompt Engineering
Solides Verständnis von MLOps: Modell-Versionierung, Deployment, Monitoring und graceful Degradation in der Produktion
Erfahrung mit Orchestrierungs-Frameworks wie LangChain, LlamaIndex o.ä.

Persönlichkeit & Arbeitsweise

Du überbrückst den Weg von der Forschung zur Produktion schneller als jede:r andere im Team
Deutschkenntnisse auf B1/B2-Niveau und Bereitschaft, innerhalb von 6 Monaten C1-Niveau zu erreichen
Sicherer Umgang mit Unklarheiten — du definierst das Problem und schlägst die Lösung vor, anstatt auf ein Spec-Dokument zu warten

Besonders willkommen

Erfahrung mit mehrsprachigen NLP-Aufgaben, insbesondere deutschsprachiger Textverarbeitung
Fine-Tuning oder RLHF-Erfahrung (LoRA, QLoRA, DPO)
Kenntnisse in Multi-Agent-Frameworks (LangGraph, CrewAI, AutoGen)
Hintergrund in Enterprise-KI-Deployments, Information Retrieval oder Wissensgraphen
Open-Source-GenAI-Projekte, technische Artikel oder Community-Beiträge (GitHub, HuggingFace, arXiv)

Vergütung & Benefits

Gehalt	80.000 – 100.000 € brutto jährlich
Urlaub	30 Urlaubstage + gesetzliche Feiertage in Deutschland

Wie wir arbeiten

Vollständig remote-first mit einem internationalen Team. Gelegentliche Reisen nach Frankfurt erforderlich (bis zu 4 Tage/Monat).

Unser Bewerbungsprozess

Erstgespräch
Technisches Screening
HR-Interview
Engineering-Panel
Gespräch zu Kultur & Werten

Jetzt bewerben

Bereit, an echten GenAI-Herausforderungen zu arbeiten? Bewirb dich über das untenstehende Formular — nur dein Lebenslauf, kein Anschreiben nötig. Oder melde dich direkt, wenn du zuerst sprechen möchtest.