Corpus Voix du Nord -> TreeTagger -> Néoveille -> Filtrage sur les phrases contenant les néologismes -> SDMC
## Détails des appels API
### Version simple
#### POST /corpus
Paramètres : Le corpus sera envoyé en paramètre ainsi que les autres paramètres.
``` javascript
{
corpus_content:
[
'Article1 de la voix du Nord',
'Article2 de la voix du Nord',
'Article3 de la voix du Nord'
],
corpus_parameters:{
lang:'fr',
author:'La voix du Nord',
date:null
}
}
```
On envoie le corpus à la BDD
La BDD nous renvoie un id correspondant qui sera utilisé pour faire le lien entre le traitement et le corpus.
À titre d'exemple, on imagine que l'id retourné est: __1DT4G__
#### POST /chaine
Paramètres :
``` javascript
{
corpus_id:'1DT4G',
treatment_chain:[
{
module_name:'Néoveille',
parameters:
[
...
]
},
{
module_name:'SDMC',
parameters:
[
{
parameter_name:'motif_type',
value:'Forme du mot seul'
},
{
parameter_name:'motif_representation',
value:'Fermés (sans sous-motifs de même fréquence)'
},
{
parameter_name:'gap',
value:["0","0"]
},
...
]
}
]
}
```
Ainsi, le dispatcher saura quel corpus traiter et possèdera aussi la liste des modules concernés dans le traitement ainsi que leur ordre et leurs paramètres.
#### POST /Neoveille/treatment
``` javascript
{
corpus_id:'1DT4G',
parameters:{
// Parameters for Neoveille
}
}
```
Cela va activer le module Néoveille afin qu'il effectue le traitement.
Tout d'abord, il doit récupérer le fichier corpus.
#### GET /corpus/1DT4G
Retourne le corpus
#### PUT /corpus/1DT4G
``` javascript
// Envoi de l'output de Néoveille à la BDD, ainsi que maj du corpus
```
* Retourne ensuite au dispatcher
#### POST /SDMC/treatment
``` javascript
{
corpus_id:'1DT4G',
parameters:{
// Parameters for SDMC
}
}
```
#### GET /corpus/1DT4G
Retourn le corpus
#### PUT /corpus/1DT4G
``` javascript
// Envoi de l'output de Néoveille à la BDD, ainsi que maj du corpus
```
* Retourne ensuite au dispatcher qui s'aperçoit que le traitement est alors terminé
GET /chaine/status/1DT4G renvoie alors 'finished'
Dans son profil, il y aura comme appel
### GET /corpus/user/MY_USER
(besoin d'un résumé juste ?)
Puis il pourra cliquer dessus pour accéder à l'outil de visualisation
@@ -39,8 +39,11 @@ See [Configuration Reference](https://cli.vuejs.org/config/).
### Display Results
* Voir comment mieux gérer le redimensionnement
* Regarder comment avoir un treeview clickable (possible ? )
* Voir comment mieux gérer le redimensionnement -> Check ?
* Regarder comment avoir un treeview clickable (possible ? ) -> DOne
* Faire une transition pour afficher ou cacher le paneau de droite
* Checker pour faire des titres (Paneau d'annotation, Panneau de document...)
- Panneau de droite : Chaque étiquette doit avoir une couleur
### Others
...
...
@@ -53,3 +56,97 @@ See [Configuration Reference](https://cli.vuejs.org/config/).
* Multiple page form: devrais-je utiliser Vuex? Stocker les paramètres dans la session ?
Besoin de garder momentanément potentiellement un fichier lourd.
* Comment gérer le json des paramètres des modules et la traduction ? (import a file, cfshared locale msg in i18n)
### Questions DEV TEAM
* Risque d'avoir du v-html pour la visualisation ?
* Quel livre se concentrer pour les webservices ?
## Morfetik
### Liste des catégories
#### Formes complexes
* Locutions verbales
* Locutions nominales
* Locutions conjonctives
* Locutions determinatives
* Locutions interjectives
* Locutions pronominales
* Locutions phrases
* Locutions prépositionnelles
* Locutions adjectivales
#### Formes simples
* Sigles
* Interjections
* Adjectifs
* Noms
* Verbes
* Adverbes
* Conjonctions
* Déterminants
* Pronoms
* Prépositions
# Next week
Pré-traitement
Export (ConLLU prêt)
Lundi 7 15h (Discussion avec Jorge API)
Mardi 8 16h (DevTeam pour avis API / Smartphone)
Mercredi 9 15h (CheneTAL)
### Annotation de NEOVEILLE
```
NEOVEILLE:NEOLOGISM
* -> Pas de néologisme détecté
_ -> Inconnu
13 -> Nombre d'occurrence du néologisme
ou
1:3 -> ID_NEOLOGISME & Nombre d'occurrences
ou
1:2:13 -> ID_NEOLOGISME, index du l'expression si néologisme de plusieurs tokens, nb d'occurrences
```
### Annotation de SDMC
```
SDMC:MOTIFS
* -> Pas de motifs détectés
_ -> Inconnu
3:15 -> ID de l'occurrence dans la phrase (Si 3 motifs dans la phrase, alors id est compris entre 1 et 3), & nombre d'occurrences du motif dans le corpus