Web Scraping Engineer
Miejsce pracy: Poznań
Technologies we use
Expected
- Python
- Kubernetes
- BeautifulSoup
- Scrapy
- SQL
- MongoDB
Optional
- Azure Cloud
- IP Rotation services
- Microsoft Power BI
About the project
Develop cutting-edge data extraction tools for the recruiting industry.
Your responsibilities
- Develop & Maintain: Design, implement, and scale web scrapers to extract recruiting data from online platforms.
- Containerization & Orchestration: Build and manage containerized applications in a Kubernetes environment.
- Monitoring & Optimization: Develop dashboards to track scraper performance and data reliability.
- IP Rotation & Stability: Utilize and optimize IP rotation techniques to ensure robust data extraction.
- Data Storage & Integration: Efficiently store, structure, and process scraped data using SQL and MongoDB for seamless integration across systems.
- Independent Collaboration: Work closely with external teams and stakeholders, integrating solutions seamlessly across different systems.
- Documentation & Knowledge Sharing: Clearly document processes, code, and system architectures for transparency and efficiency.
Our requirements
- Python: Strong proficiency in writing efficient, clean, and scalable code.
- Kubernetes: Hands-on experience with container orchestration and deployment.
- Web Scraping: Expertise in frameworks like BeautifulSoup or Scrapy for recruiting data extraction.
- SQL & MongoDB: Experience working with relational (SQL) and NoSQL (MongoDB) databases to store and process extracted data.
- Self-Sufficiency: Ability to work independently and drive projects forward with minimal supervision.
- Collaboration: Experience working with external teams, integrating solutions, and managing stakeholder expectations.
Optional
- Azure Cloud: Experience with cloud-based architectures and deployments.
- Data Visualization: Familiarity with tools like Power BI to visualize scraping performance.
- IP Rotation: Experience with IP rotation services to enhance scraper reliability.
This is how we organize our work
This is how we work
- in house
- you have influence on the technological solutions applied
- you have influence on the product
- you focus on product development
Team members
- backend developer
- devOps
- data scientist
This is how we work on a project
Development opportunities we offer
- development budget
- industry-specific e-learning platforms
- intracompany training
- substantive support from technological leaders
- technical knowledge exchange within the company
What we offer
- A flexible, independent work environment with the freedom to shape your own workflows.
- Exciting projects in recruiting technology, working with innovative external teams.
- Opportunities for continuous learning and professional growth.
- Competitive compensation based on expertise and project scope.
- The position is available in both full-time and part-time, offering flexibility to match your preferences and availability.
Benefits
- private medical care
- remote work opportunities
- Multisport card
Take the Next Step
If youre passionate about cloud-based solutions, working autonomously, and building cutting-edge data extraction tools for the recruiting industry, we’d love to hear from you. Apply now and help us redefine the future of recruiting data!
Application Requirement
Please submit your CV in English only. Thank you!
HEADFOUND GmbH
We are a forward-thinking company specializing in cloud-based solutions and advanced data extraction techniques, with a strong focus on recruiting data. Our goal is to enhance the quality and availability of candidate information through powerful scrapers and intelligent data processing.
We operate in a highly flexible environment where autonomy and ownership matter. You’ll work independently, collaborating with external teams and partners rather than within a traditional in-house development structure.
Klikając w przycisk „Aplikuj” lub w inny sposób wysyłając zgłoszenie rekrutacyjne, zgadzasz się na przetwarzanie Twoich danych osobowych przez HEADFOUND GmbH z siedzibą w: Holzmarkt 2a, 50676 Köln (Pracodawca), jako administratora danych osobowych w celu przeprowadzenia rekrutacji na stanowisko wskazane w ogłoszeniu.
Twoje dane osobowe będą przetwarzane w oparciu o następujące podstawy prawne: (a) aby podjąć działania na Twoje żądanie przed zawarciem umowy (np. informacje o oczekiwanym wynagrodzeniu i dostępności do rozpoczęcia pracy); (b) w oparciu o nasz prawnie uzasadniony interes (np. imię, nazwisko, data urodzenia, dane kontaktowe, wykształcenie, kwalifikacje zawodowe, przebieg dotychczasowego zatrudnienia); c) w oparciu o Twoją zgodę, która wyrażona jest poprzez przeslanie dokumentów aplikacyjnych zawierających takie informacje jak np. wizerunek czy zainteresowania.
Podanie wszystkich danych osobowych, o których mowa powyżej jest dobrowolne, natomiast dane wymienione w lit. a) i b) są niezbędne do wzięcia udziału w rekrutacji. Niepodanie danych skutkuje brakiem możliwości rozpatrzenia kandydatury. Podanie pozostałych danych jest dobrowolne, ale może pomóc w sprawnym przeprowadzeniu procesu rekrutacji.
Masz prawo żądać dostępu do Twoich danych (w tym uzyskania ich kopii), sprostowania danych, ich usunięcia, ograniczenia przetwarzania, przeniesienia, jak również wniesienia sprzeciwu wobec ich przetwarzania. Masz także prawo wniesienia skargi do Prezesa Urzędu Ochrony Danych Osobowych.
Twoje dane osobowe mogą zostać przekazane dostawcom usługi publikacji ogłoszeń o pracę, dostawcom systemów do zarządzania rekrutacjami, dostawcom usług IT (hosting), dostawcom systemów informatycznych.
Podane przez Ciebie dane osobowe nie będą wykorzystywane w celu profilowania albo podejmowania decyzji w sposób zautomatyzowany.
Twoje dane osobowe będą przetwarzane przez okres maks. 1 roku od zakończenia publikacji ogłoszenia, chyba, że wyraziłeś odrębną zgodę na wykorzystanie Twoich danych osobowych w przyszłych rekrutacjach.
W celu realizacji praw lub w przypadku jakichkolwiek pytań związanych z przetwarzaniem Twoich danych osobowych skontaktuj się z nami pod adresem: michal.adamczyk@headfound.com.