Apprentissage - data scientist (f/h) Populaire
DASSAULT SYSTEMES
Editeur de logiciels
Yvelines
Apprentissage/Alternance 12 mois

Offre d'alternance
Apprentissage - data scientist (f/h) Populaire
DASSAULT SYSTEMES

DASSAULT SYSTEMES
Apprentissage/Alternance 12 mois

Détail de l'offre

Quelles sont les missions ?

Vos futurs défis ...
L'objectif de cet apprentissage est d'exploiter les données relatives à ces analyses statistiques du code source (pattern d'erreur/ pattern de correction) afin d'introduire des algorithmes de Deep Learning robustes capables d'aider les développeurs dans la correction de ces erreurs.

Les approches de correction automatique de code ou Automatic Program Repair (inshort, APR) tentent de proposer automatiquement des corrections aux erreurs de code, et ce avec peu, voire sans intervention humaine. Les travaux de recherche classiques sur la correction automatique de code ont majoritairement porté sur des techniques basées sur des règles statiques prédéfinies par les experts ou sur des connaissances spécifiques à un langage de programmation (Syntactic and Semantic Analysis) [1].
L'apport de ces travaux se limite souvent à des corrections d'erreurs très simples souvent apportées sur une seule ligne. Plus récemment, quelques progrès ont été réalisés, notamment avec l'utilisation des algorithmes de Deep Learning et Code Embedding [2] pour proposer des approches génériques capables de traiter différents langages de programmation sans avoir besoin de règles spécifiques par langage [3][4][5].
Bien que ces approches aient réusi à mieux formaliser le problème, les performances et les résultats sont loin d'être optimaux ce qui ouvre un grand champ de recherche dans ce domaine.

Dans ce contexte, vous aurez pour mission la réalisation des objectifs suivants :

Etudier l'état de l'art sur la correction automatique de code (utilisant des approches Deep Learning / DevOps)
Mettre en place des pipelines pour la collecte de données massives.
Explorer, analyser et prétraiter les données (i.e. changement de représentation utilisant des arbres syntaxiques abstraits, approches d'apprentissage non supervivé)
Formaliser le problème et proposer une nouvelle approche fondée sur des concepts mathématiques
Développer des modèles d'apprentissage automatique capables de proposer des corrections
Evaluer, comparer et caractériser les modèles par des tests effectuées sur les données réelles de production
Intégrer les modèles dans nos chaines de DevOps de production
Communiquer et présenter les résultats de façon innovante pour les autres équipes.
Vous travaillerez en collaboration étroite avec un Research Data Scientist, un stagiaire, les autres équipes du département pour l'aspect collecte de données et plus particulièrement les équipes : SI, BI, développeurs, et architectes.

Références :

[1] M. Asad, K. K. Ganguly and K. Sakib, "Impact Analysis of Syntactic and Semantic Similarities on Patch Prioritization in Automated Program Repair," 2019 IEEE International Conference on Software Maintenance and Evolution (ICSME), Cleveland, OH, USA, 2019

[2] Uri Alon, Meital Zilberstein, Omer Levy, and Eran Yahav. Code2vec: Learning distributed representations of code. Proc. ACM Program. Lang., 3(POPL):40:1-40:29, 2019.

[3] Zimin Chen, Steve Kommrusch, Michele Tufano, Louis-Noël Pouchet, Denys Poshyvanyk, and Martin Monperrus. Sequencer: Sequence-to-sequence learning for end-to-end program repair. IEEE Transaction on Software Engineering, 2019.

[4] Andrew Scott, Johannes Bader, and Satish Chandra. Getafix: Learning to fix bugs automatically. CoRR, abs/**********, 2019.

[5] Gupta, Rahul, Soham Pal, A. Kanade and S. Shevade. DeepFix: Fixing Common C Language Errors by Deep Learning. AAAI, 2017.

Lire la suite

Quel est le profil idéal ?

Vos atouts pour réussir ...
Etudiant.e préparant un diplôme de niveau BAC+4 à BAC+5, Ecole d'ingénieurs ou Master Universitaire, en recherche de contrat d'apprentissage pour une durée minimum de 12 mois.

Compétences techniques souhaitées :
Bonne base académique ou une première expérience souhaitable Data Science, Machine Learning, Big Data, Statistiques.

Pourquoi les rejoindre ?

Offre d'alternance
Apprentissage - data scientist (f/h) DASSAULT SYSTEMES
DASSAULT SYSTEMES
Apprentissage/Alternance 12 mois
Voir les 1220 offres de DASSAULT SYSTEMES

Imaginez demain...
Dassault Systèmes, " The 3DEXPERIENCE Company ", offre aux entreprises et aux particuliers les univers virtuels nécessaires à la conception d'innovations durables. Ses solutions leaders sur le marché transforment pour ses clients, la conception, la fabrication et la maintenance de leurs produits. Les solutions collaboratives de Dassault Systèmes permettent de promouvoir l'innovation sociale et offrent de nouvelles possibilités d'améliorer le monde réel grâce aux univers virtuels. Avec des ventes dans plus de 140 pays, le Groupe apporte de la valeur à plus de 200 000 entreprises de toutes tailles dans toutes les industries. CATIA, SOLIDWORKS, SIMULIA, DELMIA, ENOVIA, GEOVIA, EXALEAD, BIOVIA, NETVIBES, 3D VIA, 3DEXCITE sont des marques déposées de Dassault Systèmes ou de ses filiales aux USA et/ou dans d'autres pays.

 

Postuler à cette offre

Postuler sur le site du recruteur
Dépôt CV
Montrez vos talents, 15 000 recruteurs vous attendent

Je dépose mon CV dans la CV-thèque

Doc, Docx, rtf, pdf (3 Mo. max)

D'autres offres vous attendent sur Cadremploi
Continuez sur votre lancée ! Découvrez d'autres offres similaires à celle-ci
OU
Continuer ma recherche
Soyez le premier prévenu !

Recevez les offres similaires à cette annonce

En créant votre alerte, vous acceptez les conditions d'utilisation

Alerte active Vous recevrez par email les offres correspondant à la recherche

Gérer mes alertes