Commit 09453191 authored by David's avatar David

presentation EasISTEX

parents 6f98a530 23e60e7e
......@@ -38,7 +38,6 @@
\begin{frame}{Our digital environment}
\begin{figure} \centering \includegraphics[width=1\textwidth]{../images/TimeScalesInMedia.png}\\ \end{figure}
\end{frame}
......@@ -84,9 +83,12 @@ px]{../images/openSource.jpg}\\ \end{figure} }
\end{frame}
\begin{frame}{Climate Change}
\begin{frame}{CERN publications in Web of Science (2013-2015) ~3 000
documents (work in progress)}
\begin{figure} \centering
\includegraphics[width=1\textwidth]{../images/climate.png}\\ \end{figure}
\includegraphics[width=1\textwidth]{../images/cern.png}\\ \end{figure}
......@@ -127,7 +129,7 @@ px]{../images/openSource.jpg}\\ \end{figure} }
production, the exploration and annotation of projects maps. It includes
text-mining and natural language processing technologies, reconstruction
methods of thematic landscape and visualisation tools. }
\only<2>{\small \item \textbf{Tina explorer } is a stand alone interface for the
\only<2>{\small \item \textbf{Graph Explorer} is a stand alone interface for the
exploration of projects maps included in Gargantext. This explorer can also be embeded online to present Gargantext outputs.}
......@@ -168,6 +170,7 @@ px]{../images/tinaweb.png}\\ \end{figure}
\item Jstor (RIS Format)
\item CSV files
\item ISTEX (CNRS, Elsevier)
\item \alert{CERN API Soon!}
\end{enumerate}
\end{frame}
......@@ -199,7 +202,7 @@ px]{../images/tinaweb.png}\\ \end{figure}
\end{enumerate}
\item Document view to read and annotate.
\begin{enumerate}
\item Chose your Miam|Stop words
\item Chose your terms
\item Manage your lists
\end{enumerate}
\item Advanced charts to explore the corpus
......@@ -277,6 +280,7 @@ px]{../images/tinaweb.png}\\ \end{figure}
\begin{frame}
\frametitle{Text-Mining}
......@@ -293,6 +297,24 @@ Parsers and taggers implemented in Gargantext:
\end{itemize}
\end{frame}
%
%
%\begin{frame}
% \frametitle{Text-Mining}
%
%
%\only<1>{ \begin{figure} \centering
%\includegraphics[width=350px]{../images/annotations.png}\\ \end{figure} }
%
%Parsers and taggers implemented in Gargantext:
% \begin{itemize}
% \item TreeTagger (Perl)
% \item NLTK (Python)
% \item Turbo Parser (C++)
% \item Melt (Python and Perl)
% \end{itemize}
%\end{frame}
%
%
......@@ -360,37 +382,37 @@ Parsers and taggers implemented in Gargantext:
%\end{frame}
\begin{frame}{Roadmap}
\begin{itemize}
\item<1-> Fiability
\begin{itemize}
\item<2-> \small \textbf{Matrix view} : Adjacency matrix management
\item<3-> \small \textbf{Network view} : Multipartite heterogeneous
\item<4-> \small \textbf{Dynamics and temporal view}: Phylogenies landscapes
\end{itemize}
\item<5-> Agility
\begin{itemize}
\item<6-> \small \textbf{Keep simple and reactive}
\item<7-> \small \textbf{Miam|Stop list|words manager (available)}
\item<8-> \small \textbf{Manage easily resources}
\end{itemize}
\item<9-> Collaborative
\begin{itemize}
\item<10-> \small \textbf{Platform}: collaborative workplace
\item<11-> \small \textbf{Share ressources}: collaborative workplace
\item<12-> \small \textbf{Protect ressources}: collaborative workplace
\end{itemize}
\end{itemize}
\end{frame}
%\begin{frame}{Roadmap}
%
%\begin{itemize}
% \item<1-> Fiability
% \begin{itemize}
% \item<2-> \small \textbf{Matrix view} : Adjacency matrix management
% \item<3-> \small \textbf{Network view} : Multipartite heterogeneous
% \item<4-> \small \textbf{Dynamics and temporal view}: Phylogenies landscapes
% \end{itemize}
%
% \item<5-> Agility
% \begin{itemize}
% \item<6-> \small \textbf{Keep simple and reactive}
% \item<7-> \small \textbf{Miam|Stop list|words manager (available)}
% \item<8-> \small \textbf{Manage easily resources}
% \end{itemize}
%
% \item<9-> Collaborative
% \begin{itemize}
% \item<10-> \small \textbf{Platform}: collaborative workplace
% \item<11-> \small \textbf{Share ressources}: collaborative workplace
% \item<12-> \small \textbf{Protect ressources}: collaborative workplace
% \end{itemize}
%
%\end{itemize}
%
%\end{frame}
%
\begin{frame}
\frametitle{Sponsors}
\frametitle{Partners and supports}
\begin{figure}
......@@ -403,8 +425,9 @@ Parsers and taggers implemented in Gargantext:
\includegraphics[width=1.5cm]{/srv/gargantext/static/img/sponsors/forccast.png}~
\\ \bigskip
\includegraphics[width=3cm]{/srv/gargantext/static/img/sponsors/pasteur.png}~
\includegraphics[width=1cm]{/srv/gargantext/static/img/sponsors/ademe.png}
\includegraphics[width=1cm]{/srv/gargantext/static/img/sponsors/ademe.png}~
\bigskip
\includegraphics[width=1.5cm]{../images/CERN-logo2.jpg}~
\visible<2>{\textit{ Synergies with CorTexT, the digital plateform of IFRIS }}
\end{figure}
......
\documentclass[10pt,mathsans]{beamer}
\usepackage[final]{pdfpages}
\usepackage[utf8]{inputenc}
\usepackage{amsmath,amssymb}
\usepackage{multicol}
\usepackage{epstopdf}
\usepackage{fancyhdr}
\usefonttheme{serif}
\usepackage{graphicx}
\setbeamercovered{dynamic}
\title[Gargantext]{
{\sc Gargantext} \\
\normalsize Collaborative Web Platform\\
for Text-Analytics\\
http://gargantext.org\\
Alexandre Delanoë \& David Chavalarias
}
\setbeamertemplate{navigation symbols}{}%remove navigation symbols
\addtobeamertemplate{navigation symbols}{}{%
\usebeamerfont{footline}%
\usebeamercolor[fg]{footline}%
\hspace{1em}%
\insertframenumber/\inserttotalframenumber
}
\begin{document}
\begin{frame}{}
\begin{center}
{\sc \LARGE \textcolor{blue}{ Gargantext}} \\
\normalsize Plateforme collaborative pour l'analyse de corpus\\
\bigskip
projet EasISTEX
\bigskip
http://gargantext.org\\
\bigskip
David Chavalarias \& Alexandre Delanoë \\
Complex Systems Institute of Paris Île-de-France
\end{center}
\begin{figure}
\includegraphics[width=.49\textwidth]{../images/logo_CNRS_ISC-PIF.pdf}
\end{figure}
\end{frame}
\begin{frame}
\begin{columns}
\column{.4\textwidth}
\sc \Large Ubiquité des données textuelles\\ \& opportunités pour le TDM
\column{.6\textwidth}
\begin{figure}[h] \centering \includegraphics[width=1\textwidth]{../../images/hdr/TimeScales.pdf} \end{figure}
\end{columns}
\end{frame}
\begin{frame}{Comment représenter la connaissance ?}
\begin{quotation}
\only<1>{
[...] rassembler dans le plus petit espace possible, \& à placer, pour ainsi dire, le Philosophe \textbf{au-dessus de ce vaste labyrinthe dans un point de vûe fort élevé} d’où il puisse apercevoir à la fois les Sciences \& les Arts principaux ; voir d’un coup d’œil les objets de ses spéculations, \& les opérations qu’il peut faire sur ces objets ; distinguer les branches générales des connoissances humaines, les points qui les séparent ou qui les unissent ; \& entrevoir même quelquefois les routes secrètes qui les rapprochent. C’est \textbf{une espèce de Mappemonde } qui doit montrer les principaux pays, leur position \& leur dépendance mutuelle, le chemin en ligne droite qu’il y a de l’un à l’autre ; chemin souvent coupé par mille obstacles, qui ne peuvent être connus dans chaque pays que des habitans ou des voyageurs, \& qui ne sauroient être montrés que dans des cartes particulières fort détaillées. Ces cartes particulieres seront les différens articles de notre Encyclopédie, \& l’arbre ou système figuré en sera la mappemonde.}
\only<2->{
Mais comme dans les cartes générales du globe que nous habitons, les objets sont plus ou moins rapprochés, \& présentent un coup d’œil différent selon le point de vûe où l’œil est placé par le Géographe qui construit la carte, de même la forme de \textbf{l’arbre encyclopédique dépendra du point de vûe où l’on se mettra pour envisager l’univers littéraire. On peut donc imaginer autant de systèmes différens de la connoissance humaine, que de Mappemondes de différentes projections} ; \& chacun de ces systèmes pourra même avoir, à l’exclusion des autres, quelque avantage particulier. }
\visible<3->{D'Alembert (1751) L’Encyclopédie/1re édition/Discours préliminaire}
\end{quotation}
\end{frame}
\begin{frame}{Comment interagir avec les représentations \\de la connaissance ?}
\begin{itemize}
\item<1-> ``\textit{distinguer les branches générales des connoissances humaines}'' et donner accès à ``\textit{des cartes particulières fort détaillées}'' \\ $\rightarrow$ \textbf{\footnotesize représentations haut-niveau \& navigation multi-échelle},
\item<2-> ``\textit{chemin souvent coupé par mille obstacles, qui ne peuvent être connus dans chaque pays que des habitans ou des voyageurs} \\ $\rightarrow$ \textbf{\footnotesize favoriser le collaboratif \& la diversité des expertises},
\item<3-> ``\textit{autant de systèmes différens de la connoissance humaine, que de Mappemondes de différentes projections} \\ $\rightarrow$ \textbf{\footnotesize naviger entre différents systèmes de représentation}
\end{itemize}
\end{frame}
{
\usebackgroundtemplate{\includegraphics[width=1\paperwidth]{../images/tweetoscopeAfr.png}}
\begin{frame}
\textcolor{white}{\Large \sc Les labyrinthes de la connaissance }\\
\vspace{6cm}
\textcolor{white}{\textit{http://tweetoscope.iscpif.fr}}
\end{frame}
}
\begin{frame}
\begin{figure}
\includegraphics[width=1.1\textwidth]{../images/gargantext_banner.png}
\end{figure}
\begin{figure}
\centering
\includegraphics[width=1\textwidth]{../images/GargantextCoordinators.png}
\end{figure}
With contributions of Mathieu Rodic, Samuel Castillo, Maziyar Panahi, Elias Showk, Simon Murail, Nicolas Pouillard, Romain Loth, Constance Quatrebarbes.
\end{frame}
%
%\begin{frame}
% \frametitle{Partners and supports}
%
%
%\begin{figure}
% \includegraphics[width=.8\textwidth]{../images/gargPartners.png}
%\end{figure}
%
%
%\begin{figure}
% \includegraphics[width=3cm]{../images/idf.jpg}~
% \includegraphics[width=1cm]{../images/CERN-logo2.jpg}~
%\end{figure}
%\end{frame}
%\begin{frame}{Objectifs de Gargantext}
%
%{\textbf{\sc Proposer un nouveau rapport aux corpus textuels} }
%
%\begin{itemize}
% \item <1-> Proposer différentes représentations du même ensemble de textes plutôt que LA carte,
% \item <2-> Placer le travail collaboratif et la connaissance cumulative au cœur du dispositif,
%\item <3-> Permettre de passer à tout moment du niveau agrégé (les cartes) au niveau micro (la sélection des documents/Ngrams) et inversement,
%\item <4-> Permettre la comparaison de corpus.
%\end{itemize}
%\end{frame}
\begin{frame}{Cartographie interactive de la connaissance}
\begin{columns}
\column{.6\textwidth}
\begin{itemize}
\item<1-> \small \textbf{Manipulation de corpus non structurés}
\item<2-> \small \textbf{Interactivité} Vous vous faites votre propre idée, l'utilisateur reste dans la boucle de production de représentations,
\item<3-> \small \textbf{Collaboratif} et connaissance cumulative,
% \item<4-> \small \textbf{Easy-to-use \& user-friendly} novices can play immediatly, become quickly confirmed users,
\item<4-> \small \textbf{Interopérabilité avec d'autres logiciels et bases de données} plusieurs formats d'importation et d'exportation, compraison de corpus et système d'APIs.
\end{itemize}
\column{.4\textwidth}
\only<1>{ \begin{figure} \centering
\includegraphics[width=120px]{../images/docNgram.jpg}\\ \end{figure} }
\only<2>{ \begin{figure} \centering
\includegraphics[width=160px]{../images/interaction.jpg}\\ \end{figure} }
%\only<3>{ \begin{figure} \centering \includegraphics[width=110px]{../images/babel.jpg}\\ \end{figure} }
\only<3>{ \begin{figure} \centering \includegraphics[width=110px]{../images/userfriendly.png}\\ \end{figure} }
\only<4>{ \begin{figure} \centering \includegraphics[width=110
px]{../images/openSource.jpg}\\ \end{figure} }
\end{columns}
\end{frame}
\begin{frame}{Workflow}
\begin{figure} \centering \includegraphics[width=1\textwidth]{../images/workflow.png}\\ \end{figure}
\end{frame}
\begin{frame}
\frametitle{Gargantext est agnostique }
\textbf{APIs :}
\begin{enumerate}
\item ISTEX: littérature académique interdisciplinaire
\item PubMeb : principale archive de la recherche bio-médicale
\item SCOAP : archives pour la physique des particules
\item REPEC : archives pour les sciences économiques
\item HAL : archives des EPST français,
\item ISIDORE : accès unifié aux données de la recherche dans les sciences humaines et sociales.
\end{enumerate}
\visible<2>{
\textbf{En import uniquement}
\begin{enumerate}
\item Web Of Science (ISI Format)
\item Scopus (RIS Format)
\item Europress (HTML Format)
\item Zotero (RIS Format)
\item Jstor (RIS Format)
\item CSV files
\end{enumerate}}
\end{frame}
%\begin{frame}
% \frametitle{Gargantext is Language agnostic}
% \begin{itemize}
% \item English
% \item Français
% \item Spanish
% \item Italian
% \item Deutsh
% \item Dutch
% \item Português
% \item Polish
% \item Persan
% \end{itemize}
%\end{frame}
%\begin{frame}{209 publications on mentioning ``Higgs Boson''}
% \begin{figure} \centering
%\includegraphics[width=1\textwidth]{../images/Higgs.png}\\ \end{figure}
%\end{frame}
%
\begin{frame}{Mapping projects with Gargantext}
\only<1>{ \begin{figure} \centering \includegraphics[width=.7\textwidth]{../images/methodo.png}\\ \end{figure}}
\begin{figure} \centering \includegraphics[width=1\textwidth]{../images/higgMap.jpg}\\ \end{figure}
\end{frame}
\begin{frame}{Perspective dans EasIstex}
\begin{itemize}
\item Développer l'aspect collaboratif,
\item Développer l'aspect cumulatif et l'intelligence collective (communicabilité des éléments qui constituent une carte, mutualisation des annotation, etc.)
\item Passage à l'échelle de la plateforme Gargantext.
\end{itemize}
\end{frame}
{\setbeamercolor{background canvas}{bg=}
\includepdf[pages=1-1]{../images/PhyloQuantumComputer0.pdf}}
{\setbeamercolor{background canvas}{bg=}
\includepdf[pages=1-1]{../images/PhyloQuantumComputerAlt.pdf}}
%
%
%\begin{frame}
% \frametitle{Community}
% \begin{itemize}
% \item Mailing-lists:
% \begin{itemize}
% \item User mailing-list: (soon)
% \item Devel mailing-list: (soon)
% \end{itemize}
% \item Interactive forum:
% \begin{itemize}
% \item IRC: \#gargantext channel on OFTC
% \end{itemize}
% \item Code access:
% \begin{itemize}
% \item Licence: AGPL,
% \item GIT access ( with the first publication on Gargantext, follow us @ISC-PIF !)
% \end{itemize}
% \end{itemize}
%\end{frame}
\end{document}
This diff is collapsed.
This diff is collapsed.
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta http-equiv="Content-Style-Type" content="text/css" />
<meta name="generator" content="pandoc" />
<title></title>
<style type="text/css">code{white-space: pre;}</style>
</head>
<body>
<h1 id="roadmap-gargantext">Roadmap Gargantext</h1>
<h1 id="quest-ce-que-gargantext">Qu'est-ce que <a href="http://gargantext.org">Gargantext</a> ?</h1>
<p><strong>Today</strong>: plateforme <del>pseudo</del> collaborative d'analyse de corpus textuels <del>plutôt homogènes et sans apprentissage</del></p>
<p><strong>Demain</strong>: plateforme <em>collaborative</em> de corpus textuels non structurés <em>hétérogènes</em> avec apprentissage</p>
<h2 id="publics">Publics</h2>
<ul class="incremental">
<li>Etudiants (ET)</li>
<li>Enseignants (ES)</li>
<li>Chercheurs (CH)</li>
<li>Développeurs (DV)</li>
</ul>
<h3 id="utilisateurs-principaux">Utilisateurs principaux:</h3>
<p>Total comptes sur stable ~ 200 (!) qui se répartissent en:</p>
<ul class="incremental">
<li><strong>(CH + DV)</strong>
<ul class="incremental">
<li>ISC</li>
</ul></li>
<li><strong>(ET + ES + CH)</strong>
<ul class="incremental">
<li>[OK] Mines ParisTech (~50 comptes)</li>
<li>[KO] Saint-Etienne (~20 comptes)</li>
<li>[KO] Montpellier (IRSTEA) (~3 comptes)</li>
</ul></li>
<li><strong>(ET + ES + CH + DV)</strong>
<ul class="incremental">
<li>[OK] Sciences Po (FORCCAST)</li>
</ul></li>
<li><strong>(CH)</strong>
<ul class="incremental">
<li>[OK] Pasteur</li>
<li>[OK] CERN</li>
<li>[KO] UNESCO</li>
<li>Chercheurs isolés</li>
<li>Doctorants (Nice)</li>
<li>Labos divers
<ul class="incremental">
<li>Strasbourg (prospection)</li>
</ul></li>
</ul></li>
</ul>
<h2 id="directions">Directions:</h2>
<ul class="incremental">
<li>Utile
<ul class="incremental">
<li>fonctionnalités : débutant vs expert</li>
<li>gestion des corpus, workflow, ressources</li>
<li>import / export</li>
</ul></li>
<li>Ensemble
<ul class="incremental">
<li>mutualiser (autrui généralisé)</li>
<li>collaborer (autrui personnalisé)</li>
<li>ouvrir / fermer</li>
</ul></li>
<li>Accessible
<ul class="incremental">
<li>Ergonomie et design</li>
<li>Documentation</li>
<li>Cumulatif</li>
</ul></li>
</ul>
<h2 id="serveurs">serveurs</h2>
<h3 id="today">Today</h3>
<ul class="incremental">
<li><a href="http://gargantext.org">Stable</a>, <a href="http://garg-stable.iscpif.fr">Stable-ISC</a></li>
<li><a href="http://dev.gargantext.org">Dev</a>, <a href="http://garg-dev.iscpif.fr">Dev-ISC</a></li>
</ul>
<h3 id="demain">Demain</h3>
<ol class="incremental" start="0" style="list-style-type: decimal">
<li>Sandbox (anonymous user)</li>
<li>Stable (login required)</li>
<li>Testing: mines.gargantext.org, pasteur.gargantext.org</li>
<li>Unstable (nouvelle machine virtuelle) unstable.gargantext.org</li>
</ol>
<h2 id="supports">Supports</h2>
<p><strong>Objectifs du Hackaton</strong></p>
<ul class="incremental">
<li>Bug tracker
<ul class="incremental">
<li>gogs</li>
<li>bug report: forge.iscpif.fr</li>
<li>bug report (already)</li>
</ul></li>
<li>irc</li>
<li>Mailing-lists
<ul class="incremental">
<li>cibles
<ul class="incremental">
<li>(ET + ES + CH) utilisateurs</li>
<li><ol class="incremental" start="505" style="list-style-type: upper-roman">
<li>développeurs</li>
</ol></li>
</ul></li>
<li>solutions
<ul class="incremental">
<li>mailman</li>
<li>odoo</li>
</ul></li>
</ul></li>
<li>Wiki
<ul class="incremental">
<li>gogs</li>
<li><a href="https://www.dokuwiki.org/features">DocuWiki</a></li>
</ul></li>
<li>CVS
<ul class="incremental">
<li>gitolite</li>
<li>gogs</li>
<li>github</li>
</ul></li>
</ul>
<h2 id="publication">Publication</h2>
<ul class="incremental">
<li><ol class="incremental" start="505" style="list-style-type: upper-roman">
<li>Ouverture du code</li>
</ol></li>
<li>(CH) Publications scientifiques
<ul class="incremental">
<li>JADT</li>
<li>IEEE</li>
</ul></li>
<li>(CH) Axe: le big n'est pas seulement big, il est aussi diversifié d'où une chaîne intégrée collaborative.</li>
</ul>
<h1 id="code-voyage">CODE voyage</h1>
<h2 id="infrastructure-global-targets">Infrastructure (global targets)</h2>
<ul class="incremental">
<li>sessions</li>
<li>code lisibility / refactor / documentation</li>
<li>base de données : resize node</li>
<li>design module collaboration</li>
<li>framework: ergonomie / design</li>
</ul>
<h2 id="modules-workflow">Modules / workflow</h2>
<ul class="incremental">
<li>Web Framework
<ul class="incremental">
<li>Nous recrutons</li>
<li>Languages
<ul class="incremental">
<li>english</li>
<li>french</li>
</ul></li>
<li>Messages (avec renvois et ids)</li>
<li>Login/logout page
<ul class="incremental">
<li>CSS</li>
<li>LDAP</li>
<li>Terms of use</li>
<li>Error message</li>
<li>Init psswd</li>
<li>Welcome new user (sandbox)</li>
<li>error 500 false passwd</li>
</ul></li>
<li>About page
<ul class="incremental">
<li>CSS for core team images</li>
<li>Add scientific references</li>
</ul></li>
<li>Workflow
<ul class="incremental">
<li>indicateurs d'étapes</li>
</ul></li>
</ul></li>
<li>Import
<ul class="incremental">
<li>More verbose error reports for import</li>
<li>Import should work for zip only
<ul class="incremental">
<li>Warning if not zipped</li>
</ul></li>
<li>Request translate
<ul class="incremental">
<li>by default : I have no file.zip</li>
<li>multi-API</li>
<li>request field larger</li>
</ul></li>
<li>Max number request
<ul class="incremental">
<li>if user then N=1000</li>
<li>if admin then N=5000</li>
<li>sampling = ?</li>
</ul></li>
<li>Import/Parsing
<ul class="incremental">
<li>Bug JSTOR (RIS)</li>
<li>Bug Scopus (RIS)</li>
<li>Bibtex</li>
</ul></li>
<li>API
<ul class="incremental">
<li>documentation with parameters</li>
<li>advanced (number of years)</li>
<li>scrappers_pubmed &gt; scrappers</li>
<li>sources
<ol class="incremental" style="list-style-type: decimal">
<li>API CERN</li>
<li>API HAL</li>
<li>API Twitter</li>
<li>API ISC WOS/PUBMED ?</li>
</ol></li>
</ul></li>
</ul></li>
<li>Ngrams Workflow
<ul class="incremental">
<li>pos-tagging
<ul class="incremental">
<li>user can choose ?</li>
<li>Stanford (java en server) + SEM</li>
<li>Learning feature (BDD)
<ul class="incremental">
<li>word snow</li>
<li>Zombi server</li>
</ul></li>
</ul></li>
<li>Chunking
<ul class="incremental">
<li>Regex TINA à intégrer</li>
<li>User should have the choice
<ul class="incremental">
<li>simple</li>
<li>exhaustive (tina)</li>
<li>verbs</li>
</ul></li>
</ul></li>
<li>Amélioration des listes de termes par défaut
<ul class="incremental">
<li>global TFIDF to check</li>
<li>partage des listes / mots
<ul class="incremental">
<li>WOS</li>
<li>DBpedia</li>
<li>Ontologies</li>
</ul></li>
<li>Hapax threshold</li>
<li>c-value to optimize</li>
</ul></li>
<li>Ticket dans la queue + Kill workflow function</li>
</ul></li>
<li>Data Management
<ul class="incremental">
<li>Documents view
<ul class="incremental">
<li>see/select favoris</li>
</ul></li>
<li>Document view
<ul class="incremental">
<li>add favoris function</li>
<li>ngrams annotation
<ul class="incremental">
<li>see map terms</li>
<li>create new ngrams
<ul class="incremental">
<li>update tfidf</li>
<li>index node_ngram</li>
</ul></li>
</ul></li>
</ul></li>
<li>Journal view
<ul class="incremental">
<li>do &quot;filter by journals&quot; vs &quot;select time&quot;</li>
</ul></li>
<li>Ngrams table
<ul class="incremental">
<li>loading too long</li>
<li>check/split grouped ngrams</li>
</ul></li>
<li>Corpus Management
<ul class="incremental">
<li>Bug Node deletion</li>
<li>rename</li>
<li>merge</li>
<li>split</li>
</ul></li>
<li>Export
<ul class="incremental">
<li>exporter les favoris en bibtex</li>
<li>export la liste de mots (map etc.)</li>
</ul></li>
</ul></li>
<li>Viz
<ul class="incremental">
<li>Advanced chart
<ul class="incremental">
<li>lenteurs depuis facto</li>
<li>changer le type de diagramme</li>
<li>adapter la légende</li>
<li>intégrer les groupes de ngrams</li>
<li>as api: possiblité de connecter n'importe quelle fonction
<ul class="incremental">
<li>hétérogéinité textuelle diachronique</li>
</ul></li>
</ul></li>
<li>Graphe Explorer (TinaWebJS)
<ul class="incremental">
<li><del>meso++</del> et <del>meso--</del> &gt; distri &amp;&amp; conditional, liens curseur</li>
<li>bridgeness slider</li>
<li>maj TinaWebJS (ergo)</li>
<li>Legend as TreeMap</li>
<li>voisins -&gt; tagcloud-items</li>
<li>rajouter l'accélération temporelle des termes sur la carte (Axa)</li>
<li>DOI</li>
</ul></li>
<li>Phylomemie
<ul class="incremental">
<li>[~OK] Fonction</li>
<li>[KO] Tubes viz</li>
</ul></li>
</ul></li>
</ul>
</body>
</html>
Roadmap Gargantext
==================
# Qu'est-ce que [Gargantext](http://gargantext.org) ?
**Today**: plateforme ~~pseudo~~ collaborative d'analyse de corpus
textuels ~~plutôt homogènes et sans apprentissage~~
**Demain**: plateforme *collaborative* de corpus textuels
non structurés *hétérogènes* avec apprentissage
## Publics
* Etudiants (ET)
* Enseignants (ES)
* Chercheurs (CH)
* Développeurs (DV)
###Utilisateurs principaux:
Total comptes sur stable ~ 200 (!) qui se répartissent en:
- **(CH + DV)**
- ISC
- **(ET + ES + CH)**
- [OK] Mines ParisTech (~50 comptes)
- [KO] Saint-Etienne (~20 comptes)
- [KO] Montpellier (IRSTEA) (~3 comptes)
- **(ET + ES + CH + DV)**
- [OK] Sciences Po (FORCCAST)
- **(CH)**
- [OK] Pasteur
- [OK] CERN
- [KO] UNESCO
- Chercheurs isolés
- Doctorants (Nice)
- Labos divers
- Strasbourg (prospection)
## Directions:
* Utile
* fonctionnalités : débutant vs expert
* gestion des corpus, workflow, ressources
* import / export
* Ensemble
* mutualiser (autrui généralisé)
* collaborer (autrui personnalisé)
* ouvrir / fermer
* Accessible
* Ergonomie et design
* Documentation
* Cumulatif
## serveurs
### Today
- [Stable](http://gargantext.org), [Stable-ISC](http://garg-stable.iscpif.fr)
- [Dev](http://dev.gargantext.org), [Dev-ISC](http://garg-dev.iscpif.fr)
### Demain
0. Sandbox (anonymous user)
1. Stable (login required)
2. Testing: mines.gargantext.org, pasteur.gargantext.org
3. Unstable (nouvelle machine virtuelle) unstable.gargantext.org
## Supports
**Objectifs du Hackaton**
- Bug tracker
- gogs
- bug report: forge.iscpif.fr
- bug report (already)
- irc
- Mailing-lists
- cibles
- (ET + ES + CH) utilisateurs
- (DV) développeurs
- solutions
- mailman
- odoo
- Wiki
- gogs
- [DocuWiki](https://www.dokuwiki.org/features)
- CVS
- gitolite
- gogs
- github
## Publication
* (DV) Ouverture du code
* (CH) Publications scientifiques
* JADT
* IEEE
* (CH) Axe: le big n'est pas seulement big, il est aussi
diversifié d'où une chaîne intégrée collaborative.
# CODE voyage
## Infrastructure (global targets)
- sessions
- code lisibility / refactor / documentation
- base de données : resize node
- design module collaboration
- framework: ergonomie / design
## Modules / workflow
- Web Framework
- Nous recrutons
- Languages
- english
- french
- Messages (avec renvois et ids)
- Login/logout page
- CSS
- LDAP
- Terms of use
- Error message
- Init psswd
- Welcome new user (sandbox)
- error 500 false passwd
- About page
- CSS for core team images
- Add scientific references
- Workflow
- indicateurs d'étapes
- Import
- More verbose error reports for import
- Import should work for zip only
- Warning if not zipped
- Request translate
- by default : I have no file.zip
- multi-API
- request field larger
- Max number request
- if user then N=1000
- if admin then N=5000
- sampling = ?
- Import/Parsing
- Bug JSTOR (RIS)
- Bug Scopus (RIS)
- Bibtex
- API
- documentation with parameters
- advanced (number of years)
- scrappers_pubmed > scrappers
- sources
1. API CERN
2. API HAL
3. API Twitter
4. API ISC WOS/PUBMED ?
- Ngrams Workflow
- pos-tagging
- user can choose ?
- Stanford (java en server) + SEM
- Learning feature (BDD)
- word snow
- Zombi server
- Chunking
- Regex TINA à intégrer
- User should have the choice
- simple
- exhaustive (tina)
- verbs
- Amélioration des listes de termes par défaut
- global TFIDF to check
- partage des listes / mots
- WOS
- DBpedia
- Ontologies
- Hapax threshold
- c-value to optimize
- Ticket dans la queue + Kill workflow function
- Data Management
- Documents view
- see/select favoris
- Document view
- add favoris function
- ngrams annotation
- see map terms
- create new ngrams
- update tfidf
- index node_ngram
- Journal view
- do "filter by journals" vs "select time"
- Ngrams table
- loading too long
- check/split grouped ngrams
- Corpus Management
- Bug Node deletion
- rename
- merge
- split
- Export
- exporter les favoris en bibtex
- export la liste de mots (map etc.)
- Viz
- Advanced chart
- lenteurs depuis facto
- Bug si plusieurs ngram n > 1: Q = 0
- changer le type de diagramme
- adapter la légende
- intégrer les groupes de ngrams
- as api: possiblité de connecter n'importe quelle fonction
- hétérogéinité textuelle diachronique
- Graphe Explorer (TinaWebJS)
- ~~meso++~~ et ~~meso--~~ > distri && conditional, liens curseur
- bridgeness slider
- maj TinaWebJS (ergo)
- Legend as TreeMap
- voisins -> tagcloud-items
- rajouter l'accélération temporelle des termes sur la carte (Axa)
- DOI
- Phylomemie
- [~OK] Fonction
- [KO] Tubes viz
This source diff could not be displayed because it is too large. You can view the blob instead.
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment