Curriculum vitæ

Ressources

TypeScript WebRTC Selfie.ts.zip
TypeScript TypeORM New_York_City_Penitentiary_Node.js_SQL.ts.zip

Curriculum vitæ

L'abandon des CVs papier, électroniques… amène les chercheurs d'emploi à la production d'une vidéo où 2 types d'information sont cruciaux : leur domaine de compétence et leur zone de mobilité. En effet, le chercheur d'emploi doit donner sa compétence principale (par exemple, soudure) et éventuellement des compétences secondaires (par exemple, soudage à l'arc électrique et soudage au laser). Il doit aussi impérativement donner sa mobilité (par exemple, préférablement à Pau et éventuellement Sud-Ouest jusqu'à Auch et La Rochelle).

Travail à faire

Extraire de l'audio les termes et expressions qui correspondent à des compétences et métiers dûment reconnus, enregistrés et accessibles via l'API de France Travail ☛. Typiquement, les termes soudure et les expressions soudage à l'arc électrique et soudage au laser doivent être isolés appariés (cf. ☛). Exemple de test en ligne avec soudure ☛.

Extraire de l'audio les termes et expressions qui correspondent à des notions ayant trait à la mobilité du chercheur d'emploi : Pau, Auch, La Rochelle, Sud-Ouest

Indexer (répérer les points temporels) dans l'audio les termes et expressions extraits en (1) et (2). Eliminer dans la mesure du possible les phases audio (et conséquemment les phases vidéo) qui ne relèvent ni du domaine de compétence ni de la zone de mobilité, la vidéo remodelée devant durer au maximum 1 min. 30.

Sauvegarder le résultat du traitement dans une base de données MySQL or MariaDB en utilisant TypeORM (script SQL ).

Technologies

La vidéo et l'audio doivent être enregistrés via une interface Web simple dans le navigateur. A titre d'illustration, le projet TypeScript Selfie.ts.zip (voir « Ressources » ci-dessus) montre l'utilisation de la technologie WebRTC pour filmer. Si la vidéo et l'audio sont dans le même fichier (format MP4, pas de gestion d'autres formats), il faut extraire l'audio de la vidéo ☛, sinon il faut gérer un fichier audio et un fichier vidéo vierge de son de façon synchrone.

Choisir une technologie d'extraction de texte à partir de l'audio ☛ ou ☛.

Le traitement de l'audio peut se faire sur la base des librairies payantes comme VoiceCue (Deepgram) ☛, AssemblyAI ☛, Google AI ☛ ou encore AWS Transcribe ☛ mais une librairie open source serait idéale comme DeepSpeech (ou toute autre)…

Considérations pratiques

Utilitaire de génération de fichier audio MP3 ☛

De façon optionnelle, on peut imaginer d'autres types d'information extractibles comme le niveau de confiance de l'orateur, son aisance à parler, le fait qu'il doute…

Problèmes pouvant amner au rejet du CV filmé (ce sont des options dans le travail à faire)

Plus d'un speaker dans l'audio et/ou plus d'une personne filmée ?