Arkindex propose trois zones de saisie pour l’annotation de l’image (support et/ou contenu) mais laquelle privilégier et pour quoi? ET par rapport à l’utilisation par exemple lors d’un entraînement .
-TYPES : une seule saisie (dont celle sans espace ni accent)
-ENTITY TYPES : rôle ?
-CLASSES: plusieurs entrées.
Certains éléments sélectionnés dans l’image peuvent avoir plusieurs désignation, de la plus générale (par ex : homme) à une version plus précise (par ex : Ulysse).
L’idée du projet est de mettre le plus général dans TYPES (ex : homme).
Mais : sur un corpus, on peut avoir des niveaux d’identification/annotation différents qui impliquent d’avoir un même terme de vocabulaire dans plusieurs listes (TYPES, CLASSES).
ET : comment saisir un terme placé dans une hiérarchie de termes (même si le choix des termes pour la constitution de la hiérarchie est délicat)? Ce qui revient aussi à réduire le temps de saisie.
Bonjour,
Dans Arkindex, les elements (types) sont les briques de base de l’analyse de la structure des images. Les types d’éléments doivent être suffisamment génériques pour apparaitre de multiples fois dans un corpus et doivent, dans la plupart des cas, être localisables sur l’image. Par exemple, si l’objectif est d’analyser des scènes mythologiques, on pourra créer un élément personnage, qui regroupera les hommes et les dieux. On pourrait aussi créer un élément homme et un élément dieu mais la différence sera sans doute difficile à faire pour un modèle juste en se basant sur l’image. Une séparation homme, centaure, satyre avec un élément pour chaque type serait envisageable.
Les classes, permettent de préciser un element. C’est à ce niveau que l’on pourrait par exemple chercher à préciser dieu ou homme sur un personnage. La prédiction serait alors à deux niveaux : un premier modèle pour détecter les personnages et un deuxième pour les classifier en homme versus dieux. L’avantage de cette approche en deux étapes, est que la première étape étant plus facile, un résultat intermédiaire (détection de personnage) sera exploitable, même si la différence entre un homme et un dieu est trop difficile à faire pour un modèle.
Enfin, les entités correspondent au concept d’entité nommée 'Entité nommée — Wikipédia), c’est-à-dire une expression linguistique faisant référence à des noms propres ou à un référentiel pré-défini. Dans arkindex, les entités ne sont définies que par référence à un texte, présent soit dans une transcription (sur un élément) ou dans une méta-donnée (aussi sur un élément). On utilise donc généralement les entités sur du texte.
Concernant les organisations hiérarchiques, il n’y en a pas dans arkindex, ni sur les types, ni sur les classes. Par contre, lors de la saisie de classe, une complétion automatique permet de sélectionner rapidement la classe correcte lorsque le nombre de classes est très important. C’est donc pour cette raison que le nombre de type d’elements doit rester réduit, alors que le nombre de classes peut être important.
–
Christopher
Bonjour,
Les usages d’Elements (Types) et de Classes que vous expliquez correspondent à nos conclusions après nos premiers essais. On est sur la bonne voie.
Quant au nom de personnage, il peut aller dans une Classe, comme identification quand il s’agit d’une image bien distinctive.
La hiérarchie visait plutôt à saisir plusieurs termes à la fois en les mettant au même niveau dans une Classes mais c’est probablement peu commode avec l’autocomplétion … il faut faire un choix et la solution actuelle est déjà bien.
Merci pour votre réponse bien détaillée,
Anne-Violaine