AI Inference Engineer (all genders)

Exxeta
Frankfurt am Main

Was erwartet dich

  • Du konzipierst, entwickelst und betreibst produktive LLM-Inferenzplattformen für Kunden mit hohen Anforderungen an Datensouveränität, Sicherheit und Betriebskontrolle – on-premises, in privaten Cloud-Umgebungen oder souveränen europäischen Cloud-Setups.
  • Gemeinsam mit Cloud-, Plattform-, Security- und Data-Engineering-Teams sowie unseren Kunden überführst du AI-Use-Cases in den produktiven Betrieb.
  • Dabei integrierst du moderne Inferenz-Engines und Open-Weights-Modelle in Kubernetes-, Container- und Plattformumgebungen.
  • Außerdem planst und optimierst du GPU- und Speicherressourcen sowie Inferenz-Workloads: Von Modellgrößen, Quantisierung und Batching bis hin zu KV-Cache-Strategien, Latenz, Durchsatz und Kosten.
  • Du verantwortest die Runtime produktiver AI-Systeme, inklusive Modellserving, APIs, Authentifizierung, Secrets, Observability, Logging
  • Aus Kundenprojekten entwickelst du wiederverwendbare Referenzarchitekturen, Deployment-Templates und Betriebs-Playbooks und stärkst so unsere Applied-AI-Capability.

Was erwarten wir von dir

  • Persönlicher Background: Erfahrung in Platform Engineering, Cloud Infrastructure, MLOps, LLMOps, DevOps, Backend Engineering oder Machine Learning Engineering. Entscheidend ist deine Erfahrung im Aufbau und Betrieb produktiver Systeme und dein Antrieb zu schneller persönlicher Weiterentwicklung
  • Inference Engineering: Du verstehst die technischen und wirtschaftlichen Zusammenhänge moderner LLM-Inferenz, von Model-Serving und GPU-Auslastung über Quantisierung, Batching und KV-Cache-Management bis hin zu Latenz, Durchsatz und Kosten.
  • Cloud & Plattformen: Docker, Kubernetes, Helm, Terraform, CI/CD, Linux sowie Observability gehören für dich zum Arbeitsalltag.
  • AI-Verständnis: Du kannst Transformer-basierte Modelle wie LLMs und Embeddings einordnen und fundierte technische Entscheidungen für produktive AI-Systeme treffen.
  • Security & Governance: Themen wie Identitäten, Berechtigungen, Secrets, Logging, Auditierung und Compliance denkst du, insbesondere in regulierten Umgebungen, von Anfang an mit.
  • Kommunikation & Arbeitsweise: Du vermittelst komplexe technische Zusammenhänge verständlich, arbeitest pragmatisch und bewegst dich auch in dynamischen Projektumfeldern sicher.
  • Pluspunkt: Erfahrung mit vLLM, SGLang oder vergleichbaren Inference-Technologien, GPU-Clustern, souveränen Cloud- oder Private-Cloud-Umgebungen.
  • On the road: Du bist reisebereit und flexibel, unsere Kunden bundesweit vor Ort zu beraten.
  • Let's talk: Du sprichst fließend Deutsch und Englisch - super, dann findest du dich bei Exxeta bestens zurecht

Warum Exxeta

Bei Exxeta entwickeln wir digitale Lösungen, die wirklich etwas verändern – in Unternehmen, Märkten und Köpfen. Über 1200 Kolleg:innen bringen dafür Technologie, Ideen und unterschiedliche Perspektiven zusammen. Was uns antreibt: Neugier, Teamspirit und der Anspruch, echten Impact zu schaffen. Hightech with a heartbeat eben.

Veröffentlicht am 2026-06-29

Empfohlene Jobs

kfz-meister (m/w/d).

Randstad
Frankfurt am Main

Bist du bereit, in deiner Karriere die technische Gesamtverantwortung zu übernehmen?  Du liebst das Handwerk und die Werkstatt-Luft, möchtest aber jetzt die Gesamtverantwortung für Qualität und Arb…

Details Anzeigen
Veröffentlicht am 2026-06-23

(Senior) SAP Entwickler ABAP (m/w/d)

Frankfurt am Main

Im Rahmen der SAP S/4HANA-Transformation im Produktions- und Logistikumfeld wird die technische Weiterentwicklung der Systemlandschaft vorangetrieben und aktiv durch erfahrene Entwicklerinnen und Ent…

Details Anzeigen
Veröffentlicht am 2026-06-27

Serviceassistenz (m/w/d) PK 2309

KFZ-Netzwerk GmbH Unternehmensberatung
Frankfurt am Main

Serviceassistenz (m/w/d) PK 2309 in Frankfurt am Main Ihre Aufgaben Kundenempfang und Kundenbetreuung Bearbeitung des Post Ein- und Ausgangs Unterstützende der Bereiche Buchhaltung und Ve…

Details Anzeigen
Veröffentlicht am 2026-06-12

Kalkulator Bau (m/w/d)

Hays AG
Frankfurt am Main

Ihre Aufgaben: Eigenverantwortliche Kalkulation von Bauprojekten im Tief- und Rohrleitungsbau über alle Angebotsphasen hinweg Erstellung vollständiger Angebotsunterlagen inkl. Massenermittlun…

Details Anzeigen
Veröffentlicht am 2026-02-03

IT-Service-Techniker (m/w/d) bei einem IT-Dienstleister - hybrides Arbeiten (Remote & Präsenz)

Frankfurt am Main

Bereit für den nächsten Karriereschritt in der IT-Branche? Für ein renommiertes Kundenunternehmen der DIS AG suchen wir einen engagierten IT-Servicetechniker. Diese Position bietet Ihnen die Möglic…

Details Anzeigen
Veröffentlicht am 2026-07-03

Erziehungswissenschaftler (m/w/d)

PERMACON GmbH Frankfurt
Frankfurt am Main

Ihre Chance als Erziehungswissenschaftler (m/w/d) in einer Kita Sie sind Experte im Bereich Erziehung und frühkindlicher Bildung? Sie möchten Ihr Fachwissen praxisnah einbringen und Kitas in Frankf…

Details Anzeigen
Veröffentlicht am 2026-07-01

Mitarbeiter (m/w/d) Kreditportfoliomanagement Immobilienfonds

DekaBank Deutsche Girozentrale
Frankfurt am Main

Mitarbeiter (m/w/d) Kreditportfoliomanagement Immobilienfonds Standort: Frankfurt - Niederrad Besetzung zum: 01.04.2026 Zuständige Ansprechperson für die Position: Tajneem Mia (recruiting@d…

Details Anzeigen
Veröffentlicht am 2026-02-20

Standortleiter | Senior Facility Manager (m/w/d) Großkundenobjekt | Rhein-Main-Gebiet

WISAG Job & Karriere GmbH & Co. KG
Frankfurt am Main

Willkommen bei der WISAG … einem der führenden Dienstleistungsunternehmen in Deutschland für die Bereiche: Aviation, Facility und Industrie. Mehr als 60.000 Mitarbeiterinnen und Mitarbeiter sind Ta…

Details Anzeigen
Veröffentlicht am 2026-06-25

Praktikant:in – AI (Use Cases & Automatisierung)

Vindelici Advisors AG
Frankfurt am Main

DEIN BEITRAG Als Praktikant:in im Bereich AI (Use Cases & Automatisierung) (all genders)  kombinierst Du technisches Verständnis mit der Fähigkeit, AI-Anwendungen direkt nutzbar zu machen. Du …

Details Anzeigen
Veröffentlicht am 2026-06-24

Teamleiter Cards Issuing B2B - Commercial Cards (d/m/w)

Deutsche Bank
Frankfurt am Main

This position is at Deutsche Bank The selection process will be fully managed by Deutsche Bank. -- ## Job Description: # Details zur Rolle und Einbindung ins Team Das Produktmanagement Issuing …

Details Anzeigen
Veröffentlicht am 2026-07-02