[TYPOS]

6ec787fe · Administrator · 2c8ae069 · 6ec787fe · 6ec787fe · 6ec787fe
Commit 6ec787fe authored Mar 11, 2015 by Administrator
Hide whitespace changes
Inline Side-by-side

Showing with 16 additions and 15 deletions

db.py gargantext_web/db.py +1 -1

views_optimized.py gargantext_web/views_optimized.py +2 -1

EuropressFileParser.py parsing/FileParsers/EuropressFileParser.py +13 -13

No files found.
--- a/gargantext_web/db.py
+++ b/gargantext_web/db.py
@@ -149,7 +149,7 @@ class ModelCache(dict):
                key = getattr(element, column_name)
                self[key] = element
-class Cache:
+class Cache():
    def __getattr__(self, key):
        try:

--- a/gargantext_web/views_optimized.py
+++ b/gargantext_web/views_optimized.py
@@ -81,7 +81,7 @@ def project(request, project_id):
    # deal with the form
    if request.method == 'POST':
-        # fomr validation
+        # form validation
        form = CustomForm(request.POST, request.FILES)
        if form.is_valid():
            # extract information from the form
@@ -89,6 +89,7 @@ def project(request, project_id):
            thefile = form.cleaned_data['file']
            print("thetype:",form.cleaned_data['type']) # <-- e.g: im receiving "isi" 
            resourcetype = cache.ResourceType[form.cleaned_data['type']] # e.g: here it converts to "pubmed" idk why
+            print("resourcetype:", resourcetype)
            # which default language shall be used?
            if resourcetype.name == "europress_french":
                language_id = cache.Language['fr'].id

--- a/parsing/FileParsers/EuropressFileParser.py
+++ b/parsing/FileParsers/EuropressFileParser.py
@@ -94,10 +94,10 @@ class EuropressFileParser(FileParser):
                            format_journal = re.compile('(.*), (.*)', re.UNICODE)
                            test_journal = format_journal.match(name.text)
                            if test_journal is not None:
-                                metadata['source'] = test_journal.group(1)
+                                metadata['journal'] = test_journal.group(1)
                                metadata['volume'] = test_journal.group(2)
                            else:
-                                metadata['source'] = name.text.encode(codif)
+                                metadata['journal'] = name.text.encode(codif)
                    for header in html_article.xpath(header_xpath):
                        try:
@@ -169,7 +169,7 @@ class EuropressFileParser(FileParser):
                            metadata['page'] = test_page.group(1).encode(codif)
                    metadata['title'] = html_article.xpath(title_xpath).encode(codif)
-                    metadata['text']  = html_article.xpath(text_xpath)
+                    metadata['abstract']  = html_article.xpath(text_xpath)
                    line = 0
                    br_tag = 10
@@ -215,25 +215,25 @@ class EuropressFileParser(FileParser):
                    metadata['publication_year']  = metadata['publication_date'].strftime('%Y')
                    metadata['publication_month'] = metadata['publication_date'].strftime('%m')
                    metadata['publication_day']  = metadata['publication_date'].strftime('%d')
-                    metadata['publication_date'] = ""
+                    metadata.pop('publication_date')
-                    if len(metadata['text'])>0 and format_europresse == 50: 
+                    if len(metadata['abstract'])>0 and format_europresse == 50: 
-                        metadata['doi'] = str(metadata['text'][-9])
+                        metadata['doi'] = str(metadata['abstract'][-9])
-                        metadata['text'].pop()
+                        metadata['abstract'].pop()
 # Here add separator for paragraphs
-                        metadata['text'] = str(' '.join(metadata['text']))
+                        metadata['abstract'] = str(' '.join(metadata['abstract']))
-                        metadata['text'] = str(re.sub('Tous droits réservés.*$', '', metadata['text']))
+                        metadata['abstract'] = str(re.sub('Tous droits réservés.*$', '', metadata['abstract']))
                    elif format_europresse == 1:
                        metadata['doi'] = ' '.join(html_article.xpath(doi_xpath))
-                        metadata['text'] = metadata['text'][:-9]
+                        metadata['abstract'] = metadata['abstract'][:-9]
 # Here add separator for paragraphs
-                        metadata['text'] = str(' '.join(metadata['text']))
+                        metadata['abstract'] = str(' '.join(metadata['abstract']))
                    else: 
                        metadata['doi'] = "not found"
-                    metadata['length_words'] = len(metadata['text'].split(' '))
+                    metadata['length_words'] = len(metadata['abstract'].split(' '))
-                    metadata['length_letters'] = len(metadata['text'])
+                    metadata['length_letters'] = len(metadata['abstract'])
                    metadata['bdd']  = u'europresse'
                    metadata['url']  = u''