Job Description:
Leonardo è un gruppo industriale internazionale, tra le principali realtà mondiali nell’Aerospazio, Difesa e Sicurezza che realizza capacità tecnologiche multidominio in ambito Elicotteri, Velivoli, Aerostrutture, Elettronica, Cyber Security e Spazio. Con oltre 60.000 dipendenti nel mondo, l’azienda ha una solida presenza industriale in Italia, Regno Unito, Polonia, Stati Uniti, e opera in 150 paesi anche attraverso aziende controllate, joint venture e partecipazioni. Protagonista dei principali programmi strategici a livello globale, è partner tecnologico e industriale di Governi, Amministrazioni della Difesa, Istituzioni e imprese.
All’interno dell’Area Cyber & Security Solutions, stiamo ricercando un/a Data Engineer per architetture dati scalabili per la nostra sede di Genova / Roma.
Di seguito l’elenco delle principali attività previste per il ruolo:
- Guidare lo sviluppo di data pipelines end-to-end, dalla progettazione del data lakehouse all’orchestrazione di workload batch e streaming
- Definire architetture per soluzioni data-intensive garantendo scalabilità, affidabilità e performance
- Progettare e implementare data lakehouse architectures con table formats moderni (Delta Lake, Iceberg)
- Sviluppare batch processing pipelines con Spark per elaborazione di grandi volumi di dati
- Implementare real-time streaming pipelines con Kafka e Flink per analytics in tempo reale
- Progettare data modeling (dimensional, star schema, data vault) per analytics workloads
- Collaborare con Solution Architect e development teams per definire standard e best practices
- Implementare pratiche DataOps (CI/CD for data pipelines, data testing, monitoring)
- Assicurare data quality attraverso validation frameworks e data observability
- Garantire conformità ai requisiti di data governance e security (lineage, cataloging, privacy)
- Fornire mentoring tecnico a Data Engineer junior ed expert
- Ottimizzare performance di data pipelines e gestire tuning di cluster distribuiti
- Coordinare integration con ML platforms per feature engineering e model training
Titolo di studio
Laurea Magistrale in Ingegneria Informatica, Matematica, Statistica, Fisica o equivalente.
Seniority
Senior (più di 5 anni di esperienza nel ruolo o almeno 7 anni di esperienza in ruoli analoghi)
Conoscenze e competenze tecniche
- Data processing avanzato con Apache Spark (PySpark, Scala) per batch e streaming
- Orchestration avanzata con Apache Airflow (DAG design, custom operators, sensors)
- Data lakehouse architectures (Delta Lake, Apache Iceberg) con schema evolution e time travel
- Stream processing con Apache Kafka e Apache Flink per real-time analytics
- Data modeling avanzato (dimensional, data vault, graph) e schema design
- Data quality frameworks e data observability (Great Expectations, dbt tests)
- Data governance (data lineage, metadata management, data cataloging)
Competenze comportamentali
- Leadership tecnica e mentoring verso data engineers
- Eccellenti capacità comunicative verso stakeholder tecnici e business
- Problem solving architetturale su data challenges complessi
- Capacità di definire standard e best practices per data engineering
- Visione strategica sulla data platform evolution
- Data governance mindset
Conoscenze linguistiche
Italiano madrelingua, Inglese professionale (B2)
Competenze informatiche
- Data processing frameworks (Apache Spark - PySpark, Scala)
- Orchestration tools (Apache Airflow, Prefect)
- Data lakehouse platforms (Delta Lake, Apache Iceberg) e object storage (MinIO, Ceph)
- Streaming platforms (Apache Kafka, Apache Flink)
- Linguaggi per data processing (Python, SQL, Scala)
- SQL avanzato (window functions, CTE, query optimization)
- dbt per analytics transformations
- Container orchestration (Kubernetes) for data workloads
- DataOps: CI/CD for data pipelines, data testing frameworks
- Version control avanzato (Git, DVC for data versioning)
Informazioni Aggiuntive
Altro
- Disponibilità a brevi trasferte su territorio nazionale
- Certificazioni data engineering (Databricks, Snowflake, cloud platforms) sono titoli preferenziali
- Esperienza in progetti big data su larga scala (petabyte-scale) è fortemente preferita
- Competenze in ML e feature engineering è un plus
- Background in data science o distributed systems è un plus
- Disponibilità a ottenere clearance di sicurezza
Seniority:
Primary Location:
IT - Genova - Fiumara
Additional Locations:
IT - Roma - Via Laurentina
Contract Type:
Permanent
Hybrid Working: