Ingegnere di Affidabilità del Sito - Agenti AI
Kraken
- Tipo di contratto
- Tempo pieno
- Luogo
- Svizzera
COSTRUIRE IL FUTURO DELLA FINANZA APERTA
Payward - l'azienda madre dietro Kraken, NinjaTrader, Breakout, xStocks, Payward Services e CF Benchmarks - ha trascorso gli ultimi 15 anni costruendo una delle piattaforme di infrastrutture finanziarie più moderne e accessibili a livello globale nel settore, progettata per avanzare un sistema finanziario globale aperto.
Prima di candidarti, ti invitiamo a esplorare la nostra pagina della cultura https://www.kraken.com/culture per capire cosa ci spinge e come lavoriamo.
IL TEAM
Fondata nel 2011, Kraken è una delle piattaforme di criptovalute più longeve al mondo, affidata da oltre 10 milioni di individui e istituzioni in tutto il mondo. Offre spot trading, margin, futures, staking e servizi OTC, con prodotti costruiti per investitori individuali e clienti istituzionali.
Il team di infrastrutture AI si trova all'interno dell'organizzazione Data e si occupa di costruire, gestire e scalare i sistemi che alimentano gli agenti AI in produzione - sia strumenti interni che prodotti rivolti all'esterno. Lavorando a stretto contatto con i team AI e Agent Systems, questo gruppo garantisce che gli strati di orchestrazione, esecuzione e model-serving che sostengono i flussi di lavoro agente siano affidabili, osservabili e progettati per scalare.
Questo team opera all'intersezione dell'infrastruttura dei dati e dell'AI applicata - uno spazio che si muove velocemente e richiede ingegneri che possano portare la disciplina di produzione alla tecnologia emergente. Collaborerai con i team di Data Engineering, ML e prodotti rivolti ai clienti per consolidare l'infrastruttura degli agenti e mantenerla in funzione secondo gli standard che ci si aspettano dagli utenti.
È importante notare che si tratta di un team di ingegneria della piattaforma. Oltre alla gestione dell'infrastruttura, il team è responsabile della costruzione delle API, degli SDK e delle capacità della piattaforma che consentono ai team AI, Data e Engineering di consumare l'infrastruttura degli agenti come servizio in modo sicuro ed efficiente. Il successo in questo ruolo richiede di pensare oltre le operazioni di infrastruttura e verso l'esperienza dello sviluppatore, l'adozione della piattaforma e la scalabilità a lungo termine.
L'OPPORTUNITÀ
- Progettare, costruire e gestire lo strato di infrastruttura che supporta i flussi di lavoro degli agenti AI in produzione
- Garantire l'affidabilità, la scalabilità e l'osservabilità dei sistemi agente attraverso prodotti interni ed esterni
- Progettare e sviluppare servizi di piattaforma, API, SDK e capacità di self-service che consentono ai team di ingegneria di consumare facilmente l'infrastruttura AI e i servizi della piattaforma degli agenti
- Gestire e mantenere l'infrastruttura di calcolo, orchestrazione e servizio che alimenta l'inferenza del modello e l'esecuzione dell'agente
- Implementare procedure di monitoraggio, allarme e risposta agli incidenti robuste e personalizzate per i carichi di lavoro AI/ML
- Utilizzare strumenti di Infrastructure as Code (IaC) come Terraform per provisionare e gestire componenti di infrastruttura cloud (AWS)
- Costruire e mantenere pipeline CI/CD che supportano la distribuzione rapida e affidabile dei servizi AI e dei flussi di lavoro degli agenti
- Definire e implementare guardrail, gestione dei fallimenti e modelli di ripristino specifici per i sistemi agente e LLM
- Collaborare con i team AI e Data Engineering per tradurre i prototipi sperimentali degli agenti in sistemi di produzione consolidati
- Gestire carichi di lavoro containerizzati utilizzando Kubernetes, garantendo un deploy efficiente, una scalabilità e un'orchestrazione dei servizi AI
- Implementare controlli di accesso e best practice di sicurezza in tutti gli ambienti di infrastruttura AI
- Documentare l'architettura, i runbook e le best practice per supportare la condivisione delle conoscenze all'interno del team
COSA PORTI
- 5+ anni di esperienza come Ingegnere di Affidabilità del Sito, Ingegnere di Infrastruttura, Ingegnere di Piattaforma o ruolo simile in un ambiente di produzione
- Esperienza pratica nella gestione dell'infrastruttura ML, del servizio del modello o dei flussi di lavoro MLOps in produzione
- Esperienza nella costruzione di piattaforme per sviluppatori, strumenti interni, API o SDK consumati dai team di ingegneria a livello di scala
- Solida comprensione dei principi di ingegneria della piattaforma, compresa l'esperienza dello sviluppatore, l'infrastruttura self-service e la progettazione della piattaforma basata su API
- Proficientezza con gli strumenti di Infrastructure as Code, in particolare Terraform
- Esperienza con la containerizzazione e l'orchestrazione, in particolare Kubernetes e Docker
- Solida comprensione dell'infrastruttura cloud, preferibilmente AWS
- Forti capacità di scripting (bash/shell) e proficiente in almeno un linguaggio di programmazione (Python preferito)
- Esperienza nella progettazione e gestione di sistemi di osservabilità, monitoraggio e allarme
- Esperienza nell'implementazione di procedure di risposta agli incidenti e nella partecipazione alle rotazioni di on-call
- Forti capacità di collaborazione lavorando con team di dati, AI e ingegneria
- Alta mentalità di proprietà in un ambiente di produzione in rapida evoluzione e ad alto rischio
BELLE HAVES
- Esperienza nella costruzione o gestione dell'infrastruttura per sistemi basati su agenti o potenziati da LLM
- Familiarità con framework di orchestrazione degli agenti (ad es. LangGraph, CrewAI o simili)
- Background nell'infrastruttura dei dati, compresa la familiarità con Airflow, Kafka, Spark o strumenti di data lake
- Esperienza con pipeline CI/CD e automazione del deploy per carichi di lavoro AI/ML
- Esposizione a framework di valutazione e monitoraggio delle prestazioni del modello a livello di scala
- Esperienza di lavoro in ambienti 0→1 in rapida evoluzione o team di
Tradotto automaticamente dall’originale.
Pubblicato oggi
Questa offerta compare anche su