Aller au contenu principal

Création d'un projet type : Transcription

Depuis le header, je clique sur Create new project.

Screenshot 1-1

1/ Étape Project

On renseigne les champs obligatoires :

  • Client
  • Project type
  • Project name
  • Project deadline
  • Project description

Les champs non obligatoires :

  • Default markers : apparaît sur l’item plus tard
  • to delete : indique un item à supprimer
  • to check : indique un item à vérifier
  • to discuss: indique un item à discuter

On peut définir des niveaux d’accès à l’item importé à :

  • l’admin
  • le data scientist
  • l’utilisateur

Screenshot 1-2

2/ Étape Files

Screenshot 1-3

les champs :

  • Config file: fichier de config
  • Annotations file: fichier contenant les annotations liées à l’item
  • Predictions file: fichier contenant les predictions liées à l’item

Contrairement aux annotations, les prédictions viennent d’un modèle pré-entraîné. Après l’import, on pourra choisir de les garder ou non.

Quant au champ obligatoire :

  • item file : c’est une liste qu’il faut préparer à l’avance comprenant le type de l’item et une id unique

3/ Étape Labeling

On va définir ce qu’on veut faire avec notre projet.

  • Task Title : définit le nom
  • Task Type : définit le type

Screenshot 1-4

On peut ajouter un nouveau label en cliquant sur Add a new label.

Les champs :

  • Label Code : doit être unique
  • Label Name : ne doit pas forcement porter le même nom que Label Code
  • Color : définit la couleur du label
  • Hotkey : permet de créer un raccourci clavier
  • Label Description : une description du label

Screenshot 1-5

attention

Une fois ces labels définis, il n’est plus possible de les modifiers par la suite.

4/ Étape Annotation Guide

On peut ici définir des règles d’annotations.

Une fois les spécifications d’un projet renseignées, on peut cliquer sur Add a new task pour commencer à renseigner les détails d'un autre projet.

Screenshot 1-6

exemple d'un fichier de config

{
{
"text": [
{
"name": "text",
"values": [
{
"parents": [],
"exposed": true,
"type": "text",
"annotationPourcent": 100,
"annotationCount": 3,
"_id": "634837bf795c92001ed8ae54",
"project": "634837bf795c92001ed8ae53",
"value": "text",
"label": "text",
"category": "text",
"updatedAt": "2022-10-13T16:07:27.503Z",
"createdAt": "2022-10-13T16:07:27.503Z",
"__v": 0
}
]
}
],
"name": "DEMO: OCR",
"client": "LJN",
"type": "image",
"highlights": [],
"description": "test text task",
"admins": [
"admin@test.com",
"data@test.com",
],
"users": [],
"dataScientists": [],
"defaultTags": [
"To delete",
"To check",
"To discuss",
"quality",
"empty"
],
"showPredictions": true,
"prefillPredictions": true,
"filterPredictionsMinimum": 0.4,
"deadline": "2022-12-31T10:41:24.456Z",
"entitiesRelationsGroup": []
}
}

exemple d'un fichier d'items

{
{"predictions":{},
"uuid":"ec0a4c92-f5f6-11eb-a271-acde48001122",
"data":{"url":"s3://data-for-demo-ljn/invoice-parsing/data/constat_circumstance/CDN_MAYENNE1_PAPER_20210401104747_00001_001_002_CONSTAT_Page_1_0.jpg"},
"type":"image",
"metadata":{},
"description":"",
"annotated":false,
"createdAt":1665677247548,
"velocity":null,
"lastAnnotator":{},
"seenAt":"2022-10-27T04:00:48.724Z"
}

exemple d'un fichier d'annotation

{
"item": {
"uuid": "ec0a4bb6-f5f6-11eb-a271-acde48001122",
"datatype": "image",
"data": {
"url": "s3://data-for-demo-ljn/invoice-parsing/data/constat_circumstance/CDN_MAYENNE1_PAPER_20200417145911_00001_001_002_CONSTAT_Page_1_0.jpg"
}
},
"itemMetadata": {
"createdAt": 1665677247548,
"updated": "2022-10-27T04:00:17.438Z",
"seenAt": "2022-10-27T04:00:17.437Z"
},
"tags": [],
"comments": [],
"metadata": {},
"annotationMetadata": {
"annotatedBy": "admin@test.com",
"annotatedAt": "2022-10-14T01:46:43.973Z",
"createdAt": "2022-10-14T01:46:43.964Z"
},
"annotation": {
"text": {
"text": {
"entities": [
{
"value": "text",
"text": "17"
}
]
}
}
},
"historicAnnotations": []
}