Pentacomp to firma z ponad 30-letnim doświadczeniem na rynku IT. Tworzymy nowoczesne rozwiązania informatyczne oraz świadczymy profesjonalne usługi dla dużych przedsiębiorstw i sektora publicznego. Łączymy innowacyjność z praktyczną wiedzą, zdobywaną podczas realizacji wielu zaawansowanych projektów dla wymagających klientów. Lumicode to spółka należąca do Grupy Pentacomp, wspierająca rozwój i realizację projektów IT. Aktualnie poszukujemy osoby na stanowisko: Specjalista/ka Data Lake Opis stanowiska Poszukujemy doświadczonego specjaliste/specjalistke w zakresie projektowania, budowy i utrzymania rozwiązań klasy Data Lake oraz ETL/ELT, z ugruntowaną wiedzą w obszarze Data Governance, jakości danych i zarządzania metadanymi. Stanowisko łączy kompetencje techniczne z umiejętnością definiowania procesów zarządzania danymi na poziomie organizacyjnym. Nasze wymagania Data Lake & Data Warehouse: Projektowanie i implementacja architektury DL i DW.Integracja danych z wielu źródeł, w tym systemów HIS, ERP, CRM i źródeł zewnętrznych. ETL / ELT: Tworzenie i optymalizacja procesów ETL/ELT w narzędziach takich jak Apache Airflow, Talend, Informatica, dbt, SSIS czy Azure Data Factory.Projektowanie pipeline’ów danych, automatyzacja i orkiestracja przetwarzania dużych wolumenów danych. Data Governance: Wdrażanie zasad zarządzania danymi (data ownership, data stewardship, lineage, katalogi danych).Znajomość narzędzi klasy Data Catalog / Data Quality .Definiowanie polityk zgodności z RODO, ISO 27001, DAMA-DMBOK. Data Quality & Metadata Management: Opracowanie i utrzymanie reguł jakości danych, monitorowanie anomalii.Zarządzanie metadanymi technicznymi i biznesowymi. Programowanie i integracja danych: Doświadczenie w SQL, Spark, Python i innych.Znajomość architektury REST API i SOAP. Architektura danych: Projektowanie modeli danych (relacyjnych, semantycznych i big data). Bazy Danych: Bazy danych SQL, No-SQL, Wektorowe. Wykształcenie : Wyższe z zakresu IT / Analityki Danych / Statystyki / Matematyki Stosowanej Technologie i narzędzia ETL/Orkiestracja: Apache Airflow, Talend itp Big Data: Hadoop, Spark, Kafka itp Data Governance: Apache Atlas itp Języki: SQL, Python, Java itp CI/CD: Jenkins, Bitbucket Mile widziane Doświadczenie projektach z zakresu zdrowia i e-zdrowia Certyfikacja big data / analityka danych Znajomość UML/BPMN Doświadczenie w projektach Scrum