agohra et bpp : génération de ressources linguistiques dans le...
Post on 17-Jul-2020
2 Views
Preview:
TRANSCRIPT
AGOHRA et BPP : génération de ressources linguistiques dans le
domaine de l’e-recrutementRémy Kessler
Séminaire École des Mines d’Alès 14 décembre 2017
2
Contexte du projet BPP➢ Objectif : le projet BPP1 a pour but d'améliorer l'appariement entre des candidats
et des offres d’emploi en étudiant comment les développements récents du web peuvent aider à résoudre ces problématiques.
➢ Rédaction d’une demande de financement CRSNG de 3 ans en collaboration avec la société Littlebigjob
➢ Projet en plusieurs volets :
• Baromètre de l'emploiMaster Recherche : Abdessamad Outerqiss
• Visualisation des parcours Chercheur : Fabrizio Gotti
• Appariement Master Recherche : Dieng Mamadou Alimou
• Génération d’une ontologie du domaine(1) : Butterfly Predictive project
AGOHRA Automatic Generation of an Ontology for Human Resource
Applications
4
Ressources➢Données sources issues du Web :
• 10 millions de profils de réseaux sociaux
• 400 000 offres d’emplois
➢ Utilisation de la modélisation ESCO1
➢ 3 niveaux :
univers
fonction
compétences
(1) https://ec.europa.eu/esco/home
business planning
Financial analyst
Web developer
financial analysis
financial reporting
mysqlHTMLPHP
Banque, finance, capital risque, fonds privés
Digital, e-commerce, big data, jeux électronique
5
Statistiques sur les profils
Canada France
Nombre de profils 2 658 467 7 484 311
Moyenne du nombre d’expériences 3.2 2.3
Moyenne du nombre de formations 1.39 1.06
Moyenne du nombre de compétences 0.17 0.12
statistiques textuelles des profils
Profil vide 9.61% 16.34%
Moins de 100 caractères 26.95% 40.53%
Moins de 300 caractères 16.18% 12.70%
Moins de 500 caractères 6.43% 4.66%
Plus de 500 caractères 40.83% 25.77%
6
Une ressource supplémentaire : 48 univers
http://www-etud.iro.umontreal.ca/~gottif/lbj/Ressources-BPP-Univers.htm
7
L'objectif
Offres d’emploi
Financial analyst
Web developer
financial analysis
financial reporting
Banque, finance, capital risque, fonds privés
Digital, e-commerce, big data, jeux électronique
mysqlHTMLPHP
Agorha*
* Automatic Generation of an Ontology for Human Resource Applications
univers
8
Offres d’emploi
Financial analyst
Recherche des compétences
Extraction des fonctions
génération de l’ontologie
Financial analyst
● financial reporting● financial analysis● business planning● ....
attribution d’univers
10. Business professionals
Normalisation des offres d’emplois
Financial analyst
Web developer
financial analysis
financial reporting
Banque, finance, capital risque, fonds privés
Digital, e-commerce, big data, jeux électronique
mysqlHTMLPHP
Recherche de Soft Skill
Base de profilsValidation
RegroupementSynonymeDictionnaire de
soft skill
Architecture du système Agohra
9
Quelques problèmes… et quelques solutions...
10
Séparer Soft Skill / Hard Skill➢ Définition :
➢ Hard skills : il s'agit de compétences formellement démontrables, nées d’un apprentissage technique, souvent d’ordre académique, et dont la preuve est apportée par l’obtention de notes, diplômes, certificats.
• Ex : Java, comptabilité, planification
➢ Soft skill : les soft skills sont vos compétences personnelles et sociales, orientées vers les interactions humaines.
● Ex : oral communication skills, travail en équipe, capacité adaptation
Constitution d’un dictionnaire sans filtrage par métier
Offres d’emploi
Recherche de soft skills
Normalisation
Dictionnaire de soft skill
Extraction des fonctions
validation
11
Validation des compétences➢ Constitution d'un dictionnaire « dynamique » pour chaque métier
– Utilisation de l’indexation Lucene des profils
– Requête “customisé” qui retourne 10 000 profils avec compétences pour
chaque métier
requête : “Financial Analyst”
Index LuceneFinancial analysis 153
Financial reporting 141Variance analysis 101Business planning 95Strategic planning 83....
On construit un dictionnaire contenant les compétences les plus fréquentes pour ce métier
12
D'autres améliorations...➢ Normalisation des fonctions et utilisation d’un arbre préfixe
Ex :
➢ Regroupement de compétences synonymes
Ex : good communication skills ↔ strong communication skills
Détection d'un plus grand nombre
de fonctions
assistant assisant assisante assisatnte assisitante
assisstant assisstante assist assistanat assistance
assistante assistation assisted assistent assisteur
assisting assitance assitant assitante asistant asistante
asistente asssistante asssitante
13
Évaluation
anglais francais
uni. bi. tri. uni. bi. tri.
N-grammes total 60 60 60 60 60 6
N-grammes pertinents 42 51 58 34 51 6
Précision* 0.7 0.85 0.96 0.56 0.85 1
➢ Évaluation manuelle en termes de précision pour 2 métiers :
analyste financier et analyste programmeur
➢ 0.79 sur l'ensemble de l'évaluation
* N'ayant pas de liste de compétences pour les métiers, nous n'avons pas calculé le rappel
14
Quelques applications de ces travaux...
15
Navigation dans l'ontologie
Statistiques
48 univers
391 métiers
3699 Hard Skill
215 Soft Skill
triplets rdf :
➢ Anglais : 46 708
➢ Français : 89 713
16
Baromètre de l'emploi
➢ Méthodologie :
● Utilisation des offres d’emplois et de l’ontologie afin de savoir qui recrute, où et dans quel domaine
● Composantes d’une offre :
nom de la compagnie, sa localisation géographique, la date de publication, les compétences requises ainsi que le salaire
● Difficultés : salaire, compétences
● Vidéo de démonstration :
https://youtu.be/imsW5aEF3wk
17
➢ Méthodologie :
● Utiliser les profils de réseaux sociaux afin de définir des parcours professionnels
● Modélisation et construction d’une base de parcours professionnels
● Pour un poste donné, on effectue un alignement des parcours
● Difficultés : variation typographiques des fonctions, sociétés
● Vidéo de démonstration :
https://youtu.be/b2Vl1uFUqpA
Parcours professionnels comptable
comptable
comptable
comptable
comptable
comptable
18
➢ AGORHA : permets de générer de façon semi-automatique des ressources linguistiques pour l'e-recrutement en français et en anglais
➢ Utilisation d'offres d'emploi afin de détecter le profil minimal pour chaque fonction
➢ Diverses améliorations (dictionnaire dynamique, synonyme, normalisation)
➢ Développement d'un navigateur spécialisé afin d'explorer l'ontologie ainsi que d’autres applications (baromètre et parcours professionnels)
➢ Utiliser le système en complément d’un processus classique de sélection des candidats actifs afin de rechercher les candidats passifs
Conclusion & Perspectives
« 43% des recruteurs avouent recourir à des recherches de type nom/prénom sur les candidats qui postulent chez eux et 8% des recruteurs interrogés déclarent avoir écarté un candidat à cause de traces jugées négatives trouvées en ligne. Les candidats doivent ainsi faire attention à leur identité numérique et réputation. »
RegionsJob (2011)
19
Conseil
20
top related