jobportalschweiz.ch
← Tutte le offerte

Ingegnere di Affidabilità del Sito - Agenti AI

Kraken

Tipo di contratto
Tempo pieno
Luogo
Svizzera
Candidati ora
COSTRUIRE IL FUTURO DELLA FINANZA APERTA Payward - l'azienda madre dietro Kraken, NinjaTrader, Breakout, xStocks, Payward Services e CF Benchmarks - ha trascorso gli ultimi 15 anni costruendo una delle piattaforme di infrastrutture finanziarie più moderne e accessibili a livello globale nel settore, progettata per avanzare un sistema finanziario globale aperto. Prima di candidarti, ti invitiamo a esplorare la nostra pagina della cultura https://www.kraken.com/culture per capire cosa ci spinge e come lavoriamo. IL TEAM Fondata nel 2011, Kraken è una delle piattaforme di criptovalute più longeve al mondo, affidata da oltre 10 milioni di individui e istituzioni in tutto il mondo. Offre spot trading, margin, futures, staking e servizi OTC, con prodotti costruiti per investitori individuali e clienti istituzionali. Il team di infrastrutture AI si trova all'interno dell'organizzazione Data e si occupa di costruire, gestire e scalare i sistemi che alimentano gli agenti AI in produzione - sia strumenti interni che prodotti rivolti all'esterno. Lavorando a stretto contatto con i team AI e Agent Systems, questo gruppo garantisce che gli strati di orchestrazione, esecuzione e model-serving che sostengono i flussi di lavoro agente siano affidabili, osservabili e progettati per scalare. Questo team opera all'intersezione dell'infrastruttura dei dati e dell'AI applicata - uno spazio che si muove velocemente e richiede ingegneri che possano portare la disciplina di produzione alla tecnologia emergente. Collaborerai con i team di Data Engineering, ML e prodotti rivolti ai clienti per consolidare l'infrastruttura degli agenti e mantenerla in funzione secondo gli standard che ci si aspettano dagli utenti. È importante notare che si tratta di un team di ingegneria della piattaforma. Oltre alla gestione dell'infrastruttura, il team è responsabile della costruzione delle API, degli SDK e delle capacità della piattaforma che consentono ai team AI, Data e Engineering di consumare l'infrastruttura degli agenti come servizio in modo sicuro ed efficiente. Il successo in questo ruolo richiede di pensare oltre le operazioni di infrastruttura e verso l'esperienza dello sviluppatore, l'adozione della piattaforma e la scalabilità a lungo termine. L'OPPORTUNITÀ - Progettare, costruire e gestire lo strato di infrastruttura che supporta i flussi di lavoro degli agenti AI in produzione - Garantire l'affidabilità, la scalabilità e l'osservabilità dei sistemi agente attraverso prodotti interni ed esterni - Progettare e sviluppare servizi di piattaforma, API, SDK e capacità di self-service che consentono ai team di ingegneria di consumare facilmente l'infrastruttura AI e i servizi della piattaforma degli agenti - Gestire e mantenere l'infrastruttura di calcolo, orchestrazione e servizio che alimenta l'inferenza del modello e l'esecuzione dell'agente - Implementare procedure di monitoraggio, allarme e risposta agli incidenti robuste e personalizzate per i carichi di lavoro AI/ML - Utilizzare strumenti di Infrastructure as Code (IaC) come Terraform per provisionare e gestire componenti di infrastruttura cloud (AWS) - Costruire e mantenere pipeline CI/CD che supportano la distribuzione rapida e affidabile dei servizi AI e dei flussi di lavoro degli agenti - Definire e implementare guardrail, gestione dei fallimenti e modelli di ripristino specifici per i sistemi agente e LLM - Collaborare con i team AI e Data Engineering per tradurre i prototipi sperimentali degli agenti in sistemi di produzione consolidati - Gestire carichi di lavoro containerizzati utilizzando Kubernetes, garantendo un deploy efficiente, una scalabilità e un'orchestrazione dei servizi AI - Implementare controlli di accesso e best practice di sicurezza in tutti gli ambienti di infrastruttura AI - Documentare l'architettura, i runbook e le best practice per supportare la condivisione delle conoscenze all'interno del team COSA PORTI - 5+ anni di esperienza come Ingegnere di Affidabilità del Sito, Ingegnere di Infrastruttura, Ingegnere di Piattaforma o ruolo simile in un ambiente di produzione - Esperienza pratica nella gestione dell'infrastruttura ML, del servizio del modello o dei flussi di lavoro MLOps in produzione - Esperienza nella costruzione di piattaforme per sviluppatori, strumenti interni, API o SDK consumati dai team di ingegneria a livello di scala - Solida comprensione dei principi di ingegneria della piattaforma, compresa l'esperienza dello sviluppatore, l'infrastruttura self-service e la progettazione della piattaforma basata su API - Proficientezza con gli strumenti di Infrastructure as Code, in particolare Terraform - Esperienza con la containerizzazione e l'orchestrazione, in particolare Kubernetes e Docker - Solida comprensione dell'infrastruttura cloud, preferibilmente AWS - Forti capacità di scripting (bash/shell) e proficiente in almeno un linguaggio di programmazione (Python preferito) - Esperienza nella progettazione e gestione di sistemi di osservabilità, monitoraggio e allarme - Esperienza nell'implementazione di procedure di risposta agli incidenti e nella partecipazione alle rotazioni di on-call - Forti capacità di collaborazione lavorando con team di dati, AI e ingegneria - Alta mentalità di proprietà in un ambiente di produzione in rapida evoluzione e ad alto rischio BELLE HAVES - Esperienza nella costruzione o gestione dell'infrastruttura per sistemi basati su agenti o potenziati da LLM - Familiarità con framework di orchestrazione degli agenti (ad es. LangGraph, CrewAI o simili) - Background nell'infrastruttura dei dati, compresa la familiarità con Airflow, Kafka, Spark o strumenti di data lake - Esperienza con pipeline CI/CD e automazione del deploy per carichi di lavoro AI/ML - Esposizione a framework di valutazione e monitoraggio delle prestazioni del modello a livello di scala - Esperienza di lavoro in ambienti 0→1 in rapida evoluzione o team di

Tradotto automaticamente dall’originale.

Pubblicato oggi

Questa offerta compare anche su