Projekt polega na zaprojektowaniu i wdrożeniu zaawansowanego systemu wyszukiwania wiedzy (AI search) opartego na ontologiach i metadanych, pracującego na nieustrukturyzowanych dokumentach w skali enterprise.
Zakres obejmuje end-to-end odpowiedzialność za modelowanie wiedzy, jakość wyszukiwania (retrieval + reranking) oraz rozwój rozwiązań z obszaru semantyki, grafów i RAG w środowisku regulowanym.
Planowany czas współpracy: ponad 12 miesięcy.
Planowany termin rozpoczęcia współpracy: 02.03.2026.
Model pracy: praca hybrydowa lub zdalna
responsibilities :
Projektowanie i wdrażanie ontologii w realnym systemie, w tym mapowanie dokumentów na encje, klasy i relacje oraz utrzymywanie spójnej struktury wiedzy.
Budowa i zarządzanie metadanymi, w tym tagowanie dokumentów oraz utrzymywanie słowników synonimów i aliasów pojęć.
Projektowanie i rozwój systemu AI search obejmującego indeksowanie dokumentów, chunking treści, embeddingi oraz mechanizmy retrieval i reranking z uwzględnieniem metadanych i kontekstu użytkownika.
Praca z nieustrukturyzowanymi danymi (PDF, Word, SharePoint, Confluence, intranet), w tym identyfikacja treści istotnej oraz eliminacja szumu informacyjnego.
Projektowanie i uruchamianie półautomatycznych procesów przetwarzania wiedzy, obejmujących ekstrakcję encji (NER), normalizację nazw, deduplikację pojęć oraz walidację jakości danych.
Odpowiedzialność za jakość wyszukiwania poprzez przygotowywanie zestawów pytań testowych, analizę błędów i iteracyjne doskonalenie modeli, ontologii oraz metadanych.
Praca z danymi i automatyzacją przy użyciu SQL oraz Python (skrypty, pipeline’y przetwarzania).
Integracja danych poprzez API oraz pipeline’y (pobieranie danych, walidacja, aktualizacja indeksów wyszukiwania).
Dokumentowanie architektury, procesów i workflow oraz utrzymywanie ich w repozytorium (np. Git).
requirements-expected :
Min. 2–5 lat doświadczenia w pracy z danymi / wiedzą / wyszukiwaniem / NLP / knowledge bases (w dowolnej kombinacji)
Praktyczna umiejętność wdrażania ontologii w realny system: mapowanie dokumentów → encje / klasy / relacje
Tagowanie i budowa metadanych; utrzymywanie słowników synonimów i aliasów
Zrozumienie jak działa „AI search”: indeksowanie dokumentów, chunking, embeddingi, retrieval + reranking, filtrowanie po metadanych i kontekście użytkownika
Umiejętność pracy na nieustrukturyzowanych danych (PDF/Word/intranet/SharePoint/Confluence) i identyfikowanie treści vs. szumu
Projektowanie i uruchamianie procesu półautomatycznego: ekstrakcja encji (NER), normalizacja nazw, deduplikacja pojęć, walidacja jakości
Praktyczne podejście do jakości: testy na zestawie pytań, poprawianie na podstawie błędów
SQL (min. średniozaawansowany)
Python (min. podstawy/scripting)
Praca z API/pipeline: pobieranie danych, walidacja, aktualizacja indeksów
Umiejętność dokumentowania i utrzymania workflow w repo (np. Git)