Duration: 6 months
Category: Research
Type: Internship
Contacts: camille.simon-chane@ensea.fr michel.jordan@cyu.fr
Location: ENSEA Cergy

Le contexte du stage est le développement d’un outil permettant de repérer automatiquement les altérations dangereuses sur le dos des reliures pour aider les conservateurs de bibliothèques à évaluer l’état des fonds de livres.

Description de la mission

Le contexte du stage est le développement d’un outil permettant de repérer automatiquement les altérations dangereuses sur le dos des reliures pour aider les conservateurs de bibliothèques à évaluer l’état des fonds de livres. Un premier travail a été réalisé en partenariat avec les Archives. Il a permis de mettre en place un pipeline complet (voir photo) basé sur les techniques de la segmentation sémantique pour repérer les altérations dangereuses sur les reliures des archives du Parlement de Paris, constituant un corpus très homogène d’environ 11 000 ouvrages. Un partenariat avec les Archives nationales du Québec (BanQ) nous a permis d’acquérir et d’annoter des images d’ouvrages plus récents et hétéroclites. Cette base de données est composée de 300 photographies, soit plus de 5000 ouvrages. Il s’agit désormais d’évaluer les algorithmes de segmentation des livres et de détection des altérations sur cette base de données.

L’étudiant sera responsable des tâches suivantes :

1. Évaluation des algorithmes existant sur les nouvelles images
2. Adaptation et développement de nouveaux algorithmes
3. Choix et implémentation de métriques adaptées à l’évaluation de l’état sanitaire.

En sus de l’encadrement scientifique, un dialogue continu avec une restauratrice et avec les bibliothèques guidera le travail. Ce projet permettra à l’étudiant de mettre en pratique ses connaissances en deep-learning dans un contexte avec des contraintes fortes et stimulantes.

Calendrier de travail

On prévoit un stage de 6 mois :

  • Mois 1 : bibliographie. Prise en main du travail existant
  • Mois 1 : Évaluation de la détection de livres
  • Mois 2 : Évaluation de la détection d’altérations
  • Mois 1 à 3 : Choix et implémentation de métriques
  • Mois 2 à 3 : Adaptation de l’algorithme de détection de livres
  • Mois 4 à 6 : Développement d’un nouvel algorithme de détection des altérations
  • Mois 6 : Rédaction du rapport de stage et de la documentation

Profil recherché

Nous cherchons un étudiant en master 2 ou équivalent (ingénieur) dans l’un des domaines suivants: sciences de la donnée, intelligence artificielle, machine learning. Des compétences en programmation Python sont indispensables. L’étudiant doit avoir codé, entraîné et paramétré un réseau au cours de ses études. Une expérience avec la librairie PyTorch sera appréciée. Nous cherchons également un candidat qui a une appétence pour les sciences du patrimoine.

Niveau de qualification requis

Bac + 4/5 et +

A propos du laboratoire ETIS

ETIS est une unité mixte de recherche (UMR 8051) commune à CY Cergy Paris Université, à l’ENSEA (Ecole nationale supérieure de l’électronique et de ses applications, Cergy) et au CNRS, rattachée principalement à l’INS2I. Le laboratoire mène des recherches aussi bien théoriques qu’expérimentales en vue de permettre à des systèmes de traitement de l’information d’acquérir des capacités d’autonomie. L’autonomie s’entend ici aussi bien en termes d’apprentissage et d’adaptation à l’environnement (y compris l’utilisateur), que de prise de décision et de faible consommation énergétique ou de puissance de calcul par exemple. Les domaines concernés sont l’analyse des données, l’indexation d’images, la robotique développementale, la théorie de l’information et les télécommunications. ETIS est doté d’un pôle de recherche d’excellence en intégration de données pour le patrimoine culturel qui a participé activement au LabEx Patrima et à l’EquipEx Patrimex.

Candidature

Contacter les responsables du stage, Camille Simon Chane (camille.simon-chane@ensea.fr) et Michel Jordan (michel.jordan@cyu.fr).

Date limite de candidature : 31 décembre 2022.

Début du stage : à partir du 1er mars 2023.

Sorry! This job has expired.