Vous avez du talent ? Rejoignez-nous !

Data Scientist IA / NLP pour la démocratie / Jeune Docteur

Data
Data Scientist IA / NLP pour la démocratie / Jeune Docteur
Postuler

Mission

Make.org est une civic-tech dont la mission est d’engager massivement les citoyens dans la transformation positive de la société. Nous croyons que bien utilisée, la technologie permet de recréer du lien et du dialogue constructif, et faire sortir des bulles d’information et de l’invective des réseaux sociaux. Nous développons des plateformes d’engagement massif en ligne qui mettent en œuvre ces principes au service de l’engagement citoyen.

Nous opérons certaines opérations nous même comme nos grandes causes contre les violences faites aux femmes ou pour donner une chance à chaque jeune. Nous travaillons aussi avec des institutions comme le ministère de l’économie pour co-construire la loi sur les influenceurs. Et avec des entreprises comme Orange pour rendre le numérique plus durable.Nous sommes aussi présents en Allemagne et à Bruxelles, et nous sommes capables d’opérer des opérations au niveau européen comme We Europeans en amont les élections européennes qui a réuni 1,7 million de participants. Nous avons vocation à nous développer au niveau européen et mondial.

Nous voyons l’arrivée de l’IA générative à la fois comme une menace et comme une belle opportunité pour la démocratie. Il est important de se défendre contre les usages néfastes de l’IA comme la génération de fake news et de deep fake, et nous portons une initiative collective d’acteurs de la tech pour y répondre : le Democratic Shield. Mais c’est aussi en renforçant les démocraties que nous les rendrons plus résilientes. Et nous croyons que L’IA peut donner encore plus de possibilités aux citoyens de participer à l’élaboration de solution communes.

La mission principale de ce poste de Data Scientist est de contribuer à développer les usages de l’IA au service de l'engagement citoyen. Cela va de l’analyse automatique des résultats au développement de solution basée sur des IA génératives pour aider les citoyens à appréhender la complexité des problèmes d'intérêt général, en passant par l'entraînement d’IA générative open-source et à la correction de leur biais. 

Principaux défis

La donnée analysée par nos algorithmes et nos plateformes est essentiellement de la donnée textuelle. Nous mobilisons donc essentiellement des techniques de NLP, aujourd’hui grandement renouvelées par l’IA générative et les LLM.

En tant que Data Scientist vous serez amené entre autres à développer, à évaluer et à déployer des algorithmes pour analyser automatiquement les résultats d’une consultation, à améliorer un système RAG pour rendre les réponses de l’IA plus pertinente, à développer un assistant d’aide à la rédaction de contribution. Nous allons aussi travailler pour être en mesure d'utiliser et de sur-entraîner des LLM open-source afin de mettre en place des solutions IA souveraines et maîtrisées.

Un des principaux défis actuellement est l'accélération du rythme d’innovation dans le domaine de l’IA générative qui nécessite une veille et une remise en cause permanente. Malgré ce progrès constant, les LLM restent des technologies récentes et transformer les progrès annoncés en applications concrètes, fiables et utiles reste un défi. La nouveauté permet donc d’imaginer de nouveaux usages et de nouvelles solutions, mais il reste essentiel de cadrer ces usages et pour les rendre évaluables et être en mesure de les rendre suffisamment performant pour être opérationnels.  

Nous restons une petite équipe, vous devrez donc aussi être en mesure de développer vous même de bout en bout les applications à usages interne (dashboard, rapport d’analyse automatiques, data-visualisations) et d’accompagner la mise en production des algorithmes destinés à nos plateformes d’engagement.

Profil recherché 

Vous possédez un doctorat dans une discipline scientifique orientée data : informatique, mathématiques appliquées, linguistique, physique statistique, data science.

Vous avez une bonne connaissance des techniques de base du NLP et du machine learning (stemming, pos tagging, tf-idf, text categorisation, text clustering). Vous êtes à l’aise avec les concepts de base du deep learning (embeddings, transformers) et vous avez déjà une première expérience avec les LLM. Vous aimez vous tenir à la pointe des avancées dans le domaine et les mettre en oeuvre dans des applications concrètes. 

Vous aimez travailler en équipe dans un contexte agile. Vous aimez expérimenter pour trouver de nouvelles approches puis industrialiser vos projets pour les pérenniser. 

Vous voulez rejoindre une équipe data innovante et dynamique et une aventure start-up dédiée à un projet de transformation de la société.

We are an international company, speaking english is mandatory.

Having a Ph.D is mandatory for this position.

Stack technique

L’équipe data travaille exclusivement en python. Les algorithmes sont développés et entraînés avec les librairies standard (scikit-learn, spacy, nltk, transformers, langchain). Les analyses et les algorithmes de Data Science s’appuient sur une plateforme de collecte de données basée sur Kafka et analysable en Spark.

Nos applications sont déployées par containerisation en Docker. Nous bénéficions aussi d’une intégration continue basée sur Gitlab. Une connaissance pratique de ces technologies est un plus.

Le code de la plateforme Make.org est open-source (https://gitlab.com/makeorg) et l’ouverture des projets internes comme la participation aux projets open-source mobilisés par la plateforme est encouragée.

Modalités pratiques

Date de début : à partir de Septembre 2024

Type de contrat : CDI

Localisation : Hybride Télétravail + 4 jours /mois Paris Centre

Suchst du einen Job mit Sinn? Wir suchen Verstärkung. Komm in unser Team!

Data Scientist IA / NLP pour la démocratie / Jeune Docteur

Team: 
Data
Data Scientist IA / NLP pour la démocratie / Jeune Docteur
Jetzt bewerben

Mission

Make.org est une civic-tech dont la mission est d’engager massivement les citoyens dans la transformation positive de la société. Nous croyons que bien utilisée, la technologie permet de recréer du lien et du dialogue constructif, et faire sortir des bulles d’information et de l’invective des réseaux sociaux. Nous développons des plateformes d’engagement massif en ligne qui mettent en œuvre ces principes au service de l’engagement citoyen.

Nous opérons certaines opérations nous même comme nos grandes causes contre les violences faites aux femmes ou pour donner une chance à chaque jeune. Nous travaillons aussi avec des institutions comme le ministère de l’économie pour co-construire la loi sur les influenceurs. Et avec des entreprises comme Orange pour rendre le numérique plus durable.Nous sommes aussi présents en Allemagne et à Bruxelles, et nous sommes capables d’opérer des opérations au niveau européen comme We Europeans en amont les élections européennes qui a réuni 1,7 million de participants. Nous avons vocation à nous développer au niveau européen et mondial.

Nous voyons l’arrivée de l’IA générative à la fois comme une menace et comme une belle opportunité pour la démocratie. Il est important de se défendre contre les usages néfastes de l’IA comme la génération de fake news et de deep fake, et nous portons une initiative collective d’acteurs de la tech pour y répondre : le Democratic Shield. Mais c’est aussi en renforçant les démocraties que nous les rendrons plus résilientes. Et nous croyons que L’IA peut donner encore plus de possibilités aux citoyens de participer à l’élaboration de solution communes.

La mission principale de ce poste de Data Scientist est de contribuer à développer les usages de l’IA au service de l'engagement citoyen. Cela va de l’analyse automatique des résultats au développement de solution basée sur des IA génératives pour aider les citoyens à appréhender la complexité des problèmes d'intérêt général, en passant par l'entraînement d’IA générative open-source et à la correction de leur biais. 

Principaux défis

La donnée analysée par nos algorithmes et nos plateformes est essentiellement de la donnée textuelle. Nous mobilisons donc essentiellement des techniques de NLP, aujourd’hui grandement renouvelées par l’IA générative et les LLM.

En tant que Data Scientist vous serez amené entre autres à développer, à évaluer et à déployer des algorithmes pour analyser automatiquement les résultats d’une consultation, à améliorer un système RAG pour rendre les réponses de l’IA plus pertinente, à développer un assistant d’aide à la rédaction de contribution. Nous allons aussi travailler pour être en mesure d'utiliser et de sur-entraîner des LLM open-source afin de mettre en place des solutions IA souveraines et maîtrisées.

Un des principaux défis actuellement est l'accélération du rythme d’innovation dans le domaine de l’IA générative qui nécessite une veille et une remise en cause permanente. Malgré ce progrès constant, les LLM restent des technologies récentes et transformer les progrès annoncés en applications concrètes, fiables et utiles reste un défi. La nouveauté permet donc d’imaginer de nouveaux usages et de nouvelles solutions, mais il reste essentiel de cadrer ces usages et pour les rendre évaluables et être en mesure de les rendre suffisamment performant pour être opérationnels.  

Nous restons une petite équipe, vous devrez donc aussi être en mesure de développer vous même de bout en bout les applications à usages interne (dashboard, rapport d’analyse automatiques, data-visualisations) et d’accompagner la mise en production des algorithmes destinés à nos plateformes d’engagement.

Profil recherché 

Vous possédez un doctorat dans une discipline scientifique orientée data : informatique, mathématiques appliquées, linguistique, physique statistique, data science.

Vous avez une bonne connaissance des techniques de base du NLP et du machine learning (stemming, pos tagging, tf-idf, text categorisation, text clustering). Vous êtes à l’aise avec les concepts de base du deep learning (embeddings, transformers) et vous avez déjà une première expérience avec les LLM. Vous aimez vous tenir à la pointe des avancées dans le domaine et les mettre en oeuvre dans des applications concrètes. 

Vous aimez travailler en équipe dans un contexte agile. Vous aimez expérimenter pour trouver de nouvelles approches puis industrialiser vos projets pour les pérenniser. 

Vous voulez rejoindre une équipe data innovante et dynamique et une aventure start-up dédiée à un projet de transformation de la société.

We are an international company, speaking english is mandatory.

Having a Ph.D is mandatory for this position.

Stack technique

L’équipe data travaille exclusivement en python. Les algorithmes sont développés et entraînés avec les librairies standard (scikit-learn, spacy, nltk, transformers, langchain). Les analyses et les algorithmes de Data Science s’appuient sur une plateforme de collecte de données basée sur Kafka et analysable en Spark.

Nos applications sont déployées par containerisation en Docker. Nous bénéficions aussi d’une intégration continue basée sur Gitlab. Une connaissance pratique de ces technologies est un plus.

Le code de la plateforme Make.org est open-source (https://gitlab.com/makeorg) et l’ouverture des projets internes comme la participation aux projets open-source mobilisés par la plateforme est encouragée.

Modalités pratiques

Date de début : à partir de Septembre 2024

Type de contrat : CDI

Localisation : Hybride Télétravail + 4 jours /mois Paris Centre

Unsere neuesten Jobangebote

No items found.
 Alle Jobangebote anzeigen