Roadmap Gargantext
Today: plateforme pseudo collaborative d'analyse de corpus textuels plutôt homogènes et sans apprentissage
Demain: plateforme collaborative de corpus textuels non structurés hétérogènes avec apprentissage
Publics
- Etudiants (ET)
- Enseignants (ES)
- Chercheurs (CH)
- Développeurs (DV)
Utilisateurs principaux:
Total comptes sur stable ~ 200 (!) qui se répartissent en:
- (CH + DV)
- (ET + ES + CH)
- [OK] Mines ParisTech (~50 comptes)
- [KO] Saint-Etienne (~20 comptes)
- [KO] Montpellier (IRSTEA) (~3 comptes)
- (ET + ES + CH + DV)
- [OK] Sciences Po (FORCCAST)
- (CH)
- [OK] Pasteur
- [OK] CERN
- [KO] UNESCO
- Chercheurs isolés
- Doctorants (Nice)
- Labos divers
Directions:
- Utile
- fonctionnalités : débutant vs expert
- gestion des corpus, workflow, ressources
- import / export
- Ensemble
- mutualiser (autrui généralisé)
- collaborer (autrui personnalisé)
- ouvrir / fermer
- Accessible
- Ergonomie et design
- Documentation
- Cumulatif
serveurs
Today
Demain
- Sandbox (anonymous user)
- Stable (login required)
- Testing: mines.gargantext.org, pasteur.gargantext.org
- Unstable (nouvelle machine virtuelle) unstable.gargantext.org
Supports
Objectifs du Hackaton
- Bug tracker
- gogs
- bug report: forge.iscpif.fr
- bug report (already)
- irc
- Mailing-lists
- cibles
- (ET + ES + CH) utilisateurs
- développeurs
- solutions
- Wiki
- CVS
Publication
- Ouverture du code
- (CH) Publications scientifiques
- (CH) Axe: le big n'est pas seulement big, il est aussi diversifié d'où une chaîne intégrée collaborative.
CODE voyage
Infrastructure (global targets)
- sessions
- code lisibility / refactor / documentation
- base de données : resize node
- design module collaboration
- framework: ergonomie / design
Modules / workflow
- Web Framework
- Nous recrutons
- Languages
- Messages (avec renvois et ids)
- Login/logout page
- CSS
- LDAP
- Terms of use
- Error message
- Init psswd
- Welcome new user (sandbox)
- error 500 false passwd
- About page
- CSS for core team images
- Add scientific references
- Workflow
- Import
- More verbose error reports for import
- Import should work for zip only
- Request translate
- by default : I have no file.zip
- multi-API
- request field larger
- Max number request
- if user then N=1000
- if admin then N=5000
- sampling = ?
- Import/Parsing
- Bug JSTOR (RIS)
- Bug Scopus (RIS)
- Bibtex
- API
- documentation with parameters
- advanced (number of years)
- scrappers_pubmed > scrappers
- sources
- API CERN
- API HAL
- API Twitter
- API ISC WOS/PUBMED ?
- Ngrams Workflow
- pos-tagging
- user can choose ?
- Stanford (java en server) + SEM
- Learning feature (BDD)
- Chunking
- Regex TINA à intégrer
- User should have the choice
- simple
- exhaustive (tina)
- verbs
- Amélioration des listes de termes par défaut
- global TFIDF to check
- partage des listes / mots
- Hapax threshold
- c-value to optimize
- Ticket dans la queue + Kill workflow function
- Data Management
- Documents view
- Document view
- add favoris function
- ngrams annotation
- see map terms
- create new ngrams
- update tfidf
- index node_ngram
- Journal view
- do "filter by journals" vs "select time"
- Ngrams table
- loading too long
- check/split grouped ngrams
- Corpus Management
- Bug Node deletion
- rename
- merge
- split
- Export
- exporter les favoris en bibtex
- export la liste de mots (map etc.)
- Viz
- Advanced chart
- lenteurs depuis facto
- changer le type de diagramme
- adapter la légende
- intégrer les groupes de ngrams
- as api: possiblité de connecter n'importe quelle fonction
- hétérogéinité textuelle diachronique
- Graphe Explorer (TinaWebJS)
meso++ et meso-- > distri && conditional, liens curseur
- bridgeness slider
- maj TinaWebJS (ergo)
- Legend as TreeMap
- voisins -> tagcloud-items
- rajouter l'accélération temporelle des termes sur la carte (Axa)
- DOI
- Phylomemie
- [~OK] Fonction
- [KO] Tubes viz