Vous avez du talent ? Rejoignez-nous !

Data Engineer Junior / IA pour la démocratie

Data
Data Engineer Junior / IA pour la démocratie
Postuler

Mission

Make.org est une civic-tech dont la mission est d’engager massivement les citoyens dans la transformation positive de la société. Nous croyons que bien utilisée, la technologie permet de recréer du lien et du dialogue constructif, et faire sortir des bulles d’information et de l’invective des réseaux sociaux. Nous développons des plateformes d’engagement massif en ligne qui mettent en œuvre ces principes au service de l’engagement citoyen.

Nous opérons certaines opérations nous même comme nos grandes causes contre les violences faites aux femmes ou pour donner une chance à chaque jeune. Nous travaillons aussi avec des institutions comme le ministère de l’économie pour co-construire la loi sur les influenceurs. Et avec des entreprises comme Orange pour rendre le numérique plus durable.Nous sommes aussi présents en Allemagne et à Bruxelles, et nous sommes capables d’opérer des opérations au niveau européen comme We Europeans en amont les élections européennes qui a réuni 1,7 million de participants. Nous avons vocation à nous développer au niveau européen et mondial.

Nous voyons l’arrivée de l’IA générative à la fois comme une menace et comme une belle opportunité pour la démocratie. Il est important de se défendre contre les usages néfastes de l’IA comme la génération de fake news et de deep fake, et nous portons une initiative collective d’acteurs de la tech pour y répondre : le Democratic Shield. Mais c’est aussi en renforçant les démocraties que nous les rendrons plus résilientes. Et nous croyons que L’IA peut donner encore plus de possibilités aux citoyens de participer à l’élaboration de solution communes.

La mission principale de ce poste de Data Ingénieur est de contribuer à développer les usages de l’IA au service de l'engagement citoyen. Cela va de l’analyse automatique des résultats au développement de solution basée sur des IA génératives pour aider les citoyens à appréhender la complexité des problèmes d'intérêt général, en passant par l'entraînement d’IA générative open-source et à la correction de leur biais. 

Principaux défis

La donnée analysée par nos algorithmes et nos plateformes est essentiellement de la donnée textuelle. Nous mobilisons donc essentiellement des techniques de NLP, aujourd’hui grandement renouvelées par l’IA générative et les LLM.

En tant que Data Ingénieur vous serez amené à déployer les algorithmes développés par les Data Scientists, à contribuer à leur amélioration et à assurer la maintenance des algorithmes et des services en production.

Vous aurez notamment à faire évoluer et à maintenir une architecture RAG, à développer et à maintenir les algorithmes d’ingestion et de nettoyage de données. Vous assurerez aussi le développement et la maintenance de services data interne comme l’analyse automatique des consultations, le suivi de la performance de nos campagnes d’acquisition et le suivi des métriques d’engagement sur nos plateformes.

Un des principaux défis actuellement est l'accélération du rythme d’innovation dans le domaine de l’IA générative qui nécessite une veille et une remise en cause permanente. Malgré ce progrès constant, les LLM restent des technologies récentes et transformer les progrès annoncés en applications concrètes, fiables et utiles reste un défi. Vous devrez donc  tester et valider les nouvelles fonctionnalités permises par les avancées technologiques des LLM.

Nous restons une petite équipe, les Data Scientists seront donc aussi en mesure de développer une bonne partie des applications et vous travaillerez en étroite collaboration avec eux. Mais vous serez en charge de la fiabilité et de la maintenabilité des applications data.

Profil recherché 

Vous avez une première expérience en développement d’application data ou une formation avec de beaux projets appliqués.

Python est votre deuxième langue maternelle, vous maîtrisez les librairies standards, vous connaissez les librairies classiques utilisées en data-science et en IA (pandas, sklearn, spacy, transformers, langchain ou llamaindex). Vous êtes à l’aise en SQL, et vous avez quelques connaissances en noSQ. 

Vous êtes à l’aise avec les technologies de mise en production notamment Docker. Vous aimez tester de nouvelles librairies, intégrer de nouvelles API. Bonus : vous avez déjà développé une application intégrant un LLM.

Vous aimez travailler en équipe dans un contexte agile. Vous aimez expérimenter pour trouver de nouvelles approches puis industrialiser vos projets pour les pérenniser. 

Vous voulez rejoindre une équipe data innovante et dynamique et une aventure start-up dédiée à un projet de transfo

rmation de la société.

We are an international company, speaking english is mandatory.

Stack technique

L’équipe data travaille exclusivement en python. Les algorithmes sont développés et entraînés avec les librairies standard (scikit-learn, spacy, nltk, transformers, langchain). Les analyses et les algorithmes de Data Science s’appuient sur une plateforme de collecte de données basée sur Kafka et analysable en Spark.

Nos applications sont déployées par containerisation en Docker. Nous bénéficions aussi d’une intégration continue basée sur Gitlab. Une connaissance pratique de ces technologies est un plus.

Le code de la plateforme Make.org est open-source (https://gitlab.com/makeorg) et l’ouverture des projets internes comme la participation aux projets open-source mobilisés par la plateforme est encouragée.

Modalités pratiques

Date de début : à partir d’Octobre 2024

Type de contrat : CDI

Localisation : Hybride Télétravail + 4 jours /mois Paris Centre

Suchst du einen Job mit Sinn? Wir suchen Verstärkung. Komm in unser Team!

Data Engineer Junior / IA pour la démocratie

Team: 
Data
Data Engineer Junior / IA pour la démocratie
Jetzt bewerben

Mission

Make.org est une civic-tech dont la mission est d’engager massivement les citoyens dans la transformation positive de la société. Nous croyons que bien utilisée, la technologie permet de recréer du lien et du dialogue constructif, et faire sortir des bulles d’information et de l’invective des réseaux sociaux. Nous développons des plateformes d’engagement massif en ligne qui mettent en œuvre ces principes au service de l’engagement citoyen.

Nous opérons certaines opérations nous même comme nos grandes causes contre les violences faites aux femmes ou pour donner une chance à chaque jeune. Nous travaillons aussi avec des institutions comme le ministère de l’économie pour co-construire la loi sur les influenceurs. Et avec des entreprises comme Orange pour rendre le numérique plus durable.Nous sommes aussi présents en Allemagne et à Bruxelles, et nous sommes capables d’opérer des opérations au niveau européen comme We Europeans en amont les élections européennes qui a réuni 1,7 million de participants. Nous avons vocation à nous développer au niveau européen et mondial.

Nous voyons l’arrivée de l’IA générative à la fois comme une menace et comme une belle opportunité pour la démocratie. Il est important de se défendre contre les usages néfastes de l’IA comme la génération de fake news et de deep fake, et nous portons une initiative collective d’acteurs de la tech pour y répondre : le Democratic Shield. Mais c’est aussi en renforçant les démocraties que nous les rendrons plus résilientes. Et nous croyons que L’IA peut donner encore plus de possibilités aux citoyens de participer à l’élaboration de solution communes.

La mission principale de ce poste de Data Ingénieur est de contribuer à développer les usages de l’IA au service de l'engagement citoyen. Cela va de l’analyse automatique des résultats au développement de solution basée sur des IA génératives pour aider les citoyens à appréhender la complexité des problèmes d'intérêt général, en passant par l'entraînement d’IA générative open-source et à la correction de leur biais. 

Principaux défis

La donnée analysée par nos algorithmes et nos plateformes est essentiellement de la donnée textuelle. Nous mobilisons donc essentiellement des techniques de NLP, aujourd’hui grandement renouvelées par l’IA générative et les LLM.

En tant que Data Ingénieur vous serez amené à déployer les algorithmes développés par les Data Scientists, à contribuer à leur amélioration et à assurer la maintenance des algorithmes et des services en production.

Vous aurez notamment à faire évoluer et à maintenir une architecture RAG, à développer et à maintenir les algorithmes d’ingestion et de nettoyage de données. Vous assurerez aussi le développement et la maintenance de services data interne comme l’analyse automatique des consultations, le suivi de la performance de nos campagnes d’acquisition et le suivi des métriques d’engagement sur nos plateformes.

Un des principaux défis actuellement est l'accélération du rythme d’innovation dans le domaine de l’IA générative qui nécessite une veille et une remise en cause permanente. Malgré ce progrès constant, les LLM restent des technologies récentes et transformer les progrès annoncés en applications concrètes, fiables et utiles reste un défi. Vous devrez donc  tester et valider les nouvelles fonctionnalités permises par les avancées technologiques des LLM.

Nous restons une petite équipe, les Data Scientists seront donc aussi en mesure de développer une bonne partie des applications et vous travaillerez en étroite collaboration avec eux. Mais vous serez en charge de la fiabilité et de la maintenabilité des applications data.

Profil recherché 

Vous avez une première expérience en développement d’application data ou une formation avec de beaux projets appliqués.

Python est votre deuxième langue maternelle, vous maîtrisez les librairies standards, vous connaissez les librairies classiques utilisées en data-science et en IA (pandas, sklearn, spacy, transformers, langchain ou llamaindex). Vous êtes à l’aise en SQL, et vous avez quelques connaissances en noSQ. 

Vous êtes à l’aise avec les technologies de mise en production notamment Docker. Vous aimez tester de nouvelles librairies, intégrer de nouvelles API. Bonus : vous avez déjà développé une application intégrant un LLM.

Vous aimez travailler en équipe dans un contexte agile. Vous aimez expérimenter pour trouver de nouvelles approches puis industrialiser vos projets pour les pérenniser. 

Vous voulez rejoindre une équipe data innovante et dynamique et une aventure start-up dédiée à un projet de transfo

rmation de la société.

We are an international company, speaking english is mandatory.

Stack technique

L’équipe data travaille exclusivement en python. Les algorithmes sont développés et entraînés avec les librairies standard (scikit-learn, spacy, nltk, transformers, langchain). Les analyses et les algorithmes de Data Science s’appuient sur une plateforme de collecte de données basée sur Kafka et analysable en Spark.

Nos applications sont déployées par containerisation en Docker. Nous bénéficions aussi d’une intégration continue basée sur Gitlab. Une connaissance pratique de ces technologies est un plus.

Le code de la plateforme Make.org est open-source (https://gitlab.com/makeorg) et l’ouverture des projets internes comme la participation aux projets open-source mobilisés par la plateforme est encouragée.

Modalités pratiques

Date de début : à partir d’Octobre 2024

Type de contrat : CDI

Localisation : Hybride Télétravail + 4 jours /mois Paris Centre