Logo

Data Scientist (m/w/d)

  • Pune (IND)
  • IT
  • Vollzeit
  • Publiziert: 02.07.2024
scheme imagescheme imagescheme image
Thinkproject ist ein europäischer Marktführer im Bereich der Digitalisierung der Baubranche. Neben Standorten in Europa haben wir Niederlassungen und Kund*innen auf der ganzen Welt.

Gegründet wurde unser Unternehmen im Jahr 2000, zu einer Zeit an der der Großteil der Planung und Verwaltung von Bauprojekten manuell durchgeführt wurde. Für die Verantwortlichen wurde es immer schwieriger einen Überblick über die immer komplexer werdenden Bauprojekte zu behalten. Hier knüpften unsere Gründer an und konnten mit ihrem Branchen-Know-How einen großen Wandel in der Digitalisierung schaffen.
Heute sprechen wir von "Construction Intelligence" - denn unsere Software macht große und kleine Bauprojekte effizienter, sicherer, pünktlicher und vor allem nachhaltiger.

Ort: Pune
Abteilung: R&D
Vertrag: Permanent

Wie wird dein Tag aussehen

  • Sammeln, Vorverarbeiten und Analysieren von strukturierten und unstrukturierten Datensätzen im Zusammenhang mit der Baubranche mithilfe von statistischen Methoden und Techniken des maschinellen Lernens.
  • Entwickeln Sie Vorhersagemodelle, Algorithmen und datengesteuerte Lösungen, um geschäftliche Herausforderungen zu bewältigen und Entscheidungsprozesse zu verbessern.
  • Zusammenarbeit mit Software-Ingenieuren, Produktmanagern und Fachleuten, um analytische Lösungen in unsere Cloud-basierten Software-Plattformen zu integrieren.
  • Entwerfen und Implementieren von Experimenten, Tests und datengesteuerten Initiativen zur Verbesserung von Produktfunktionalitäten und Benutzererfahrung.
  • Durchführung von explorativen Datenanalysen, um Trends, Muster und Korrelationen in baubezogenen Datensätzen zu erkennen.
  • Kommunikation von Ergebnissen und Erkenntnissen an technische und nicht-technische Interessengruppen durch Berichte, Visualisierungen und Präsentationen.
  • Du bleibst auf dem Laufenden über die neuesten Fortschritte in den Bereichen Data Science, maschinelles Lernen und Bautechnologie, um Innovationen innerhalb des Unternehmens voranzutreiben.

Was brauchst du, um die Rolle zu erfüllen

Master-Abschluss in Informatik, Datenwissenschaft, Statistik oder einem verwandten quantitativen Bereich.
Mindestens 5 Jahre Erfahrung als Data Scientist oder in einer ähnlichen Funktion, vorzugsweise in der Softwarebranche oder im Bauwesen.
Beherrschung von Programmiersprachen wie Python oder R für Datenanalyse, maschinelles Lernen und statistische Modellierung, mit Fachkenntnissen in einschlägigen Bibliotheken.
Ausgeprägtes Verständnis von Techniken des maschinellen Lernens (überwachtes/unüberwachtes Lernen, Regression, Clustering, Normalisierung usw.) sowie praktische Erfahrung mit Bibliotheken wie scikit-learn, TensorFlow, PyTorch usw.
Praktische Erfahrung in der Arbeit mit großen Datensätzen, der Nutzung von Datenvisualisierungstools (insbesondere Power BI) und der Arbeit mit SQL/NoSQL-Datenbanken.
Hervorragende Problemlösungsfähigkeiten und Geschicklichkeit bei der Umsetzung von Geschäftsanforderungen in datengesteuerte Lösungen.
Effektive Kommunikationsfähigkeiten, die es ermöglichen, komplexe Ergebnisse klar und verständlich zu präsentieren.
Fähigkeit, an der Erstellung von Modellen mitzuwirken.
Beherrschung der Erstellung von Modellen von Grund auf und der Feinabstimmung bestehender Modelle.
Gute Kenntnisse von Spark SQL und PySpark.
In der Lage sein, an der Verwaltung großer Modelle mitzuwirken.
Evaluierung von out-of-box Supervised/Un-supervised/Neural Network Modellen auf ihre Effektivität für Thinkproject Business Herausforderungen. Erfahrung im gesamten Lebenszyklus der ML-Anwendungsentwicklung - Datenvorbereitung, Experimentverfolgung, Reproduzierbarkeit der Modellergebnisse und Bereitstellung.
Erfahrung in der Arbeit mit ML-Trainings- und Inferenz-Pipelines
Erfahrung im Umgang mit Tools wie ML Flow für die Verfolgung der ML-Entwicklung, Apache Spark für die Bereitstellung von ML-Produktionsanwendungen usw.
Flexibilität bei der Arbeit mit traditionellen und auf neuronalen Netzen basierenden ML-Modellen für Anwendungsfälle in den Bereichen NLP, Computer Vision und tabellarisch strukturierte Daten.   Bonuspunkte für:
Erfahrung mit Snowflake-Transformationen und Snowpark.
Kenntnisse von Azure Data Factory oder Kafka-Ingestion.
Verständnis für die Handhabung von Parquet-Dateien.
Vertrautheit mit MLFlow oder Kubeflow.  

Was wir anbieten

Health Days I Lunch 'n' Learn Sessions I Women's Network I LGBTQIA+ Network I Demo Days I Coffee Chat Roulette I Ideas Portal I Free English Lessons I Thinkproject Academy I Social Events I Volunteering Activities I Open Forum with Leadership Team (Tp Café) I Hybrid working I Unlimited learning

Mitarbeiterzufriedenheit steht bei uns an oberster Stelle. Unsere Mitarbeiter*innen machen Thinkproject zu dem was es heute ist. Wir schätzen eine Arbeitsatmosphäre bei der jeder die Möglichkeit hat unsere Unternehmenskultur durch offenes Feedback und Respekt mit zu gestalten. Wir sind davon überzeugt, dass eine zeitgemäße Flexibilität und ein vielseitiges Benefitprogramm Erfolgsfaktoren für unser Business sind.

Dein Kontakt:

Vikas Gaikwad

Bitte bewirb Dich online, inklusive Deiner Gehaltsvorstellung und des frühestmöglichen Eintrittstermins.

Arbeiten bei thinkproject.com - Make your intelligence an asset.