# Without this, we couldn't use the Django environment
from admin.env import *
#from ngram.stemLem import *

from admin.utils import PrintException,DebugTime

from gargantext_web.db import NodeNgram,NodeNodeNgram,NodeNgramNgram
from gargantext_web.db import get_or_create_node, get_session, bulk_insert

from sqlalchemy.sql import func
from sqlalchemy import desc, asc, or_, and_, Date, cast, select
from sqlalchemy import literal_column
from sqlalchemy.orm import aliased

from ngram.tools import insert_ngrams
import csv

def compute_mapList(corpus,limit=500,n=1, mysession=None):
    '''
    According to Specificities and stoplist,
    '''
    
 
    monograms_part = 0.005
    monograms_limit = round(limit * monograms_part)
    multigrams_limit = limit - monograms_limit

    dbg = DebugTime('Corpus #%d - computing Miam' % corpus.id)

    node_miam  = get_or_create_node(nodetype='MiamList', corpus=corpus, mysession=mysession)
    node_stop  = get_or_create_node(nodetype='StopList', corpus=corpus, mysession=mysession)
    node_group = get_or_create_node(nodetype='Group', corpus=corpus, mysession=mysession)
    
    node_spec  = get_or_create_node(nodetype='Specificity', corpus=corpus, mysession=mysession)

    Miam=aliased(NodeNgram)
    Stop=aliased(NodeNgram)
    Group=aliased(NodeNgramNgram)
    
    Spec=aliased(NodeNodeNgram)

    query = (mysession.query(Spec.ngram_id, Spec.score)
                .join(Miam, Spec.ngram_id == Miam.ngram_id)
                .join(Ngram, Ngram.id == Spec.ngram_id)
                #.outerjoin(Group, Group.ngramy_id == Spec.ngram_id)
                #.outerjoin(Stop, Stop.ngram_id == Spec.ngram_id)
                .filter(Miam.node_id == node_miam.id)
                #.filter(Group.node_id == node_group.id)
                #.filter(Stop.node_id == node_stop.id)
                .filter(Spec.nodex_id == node_spec.id)
            )

    top_monograms = (query
                .filter(Ngram.n == 1)
                .order_by(desc(Spec.score))
                .limit(monograms_limit)
               )
    
    top_multigrams = (query
                .filter(Ngram.n >= 2)
                .order_by(desc(Spec.score))
                .limit(multigrams_limit)
               )
    
    stop_ngrams = (mysession.query(NodeNgram.ngram_id)
                         .filter(NodeNgram.node_id == node_stop.id)
                         .all()
                 )

    grouped_ngrams = (mysession.query(NodeNgramNgram.ngramy_id)
                             .filter(NodeNgramNgram.node_id == node_group.id)
                             .all()
                    )
    
    node_mapList = get_or_create_node(nodetype='MapList', corpus=corpus, mysession=mysession)
    mysession.query(NodeNgram).filter(NodeNgram.node_id==node_mapList.id).delete()
    mysession.commit()
    
    data = zip(
        [node_mapList.id for i in range(1,limit)]
        , [n[0] for n in list(top_multigrams) + list(top_monograms)
                if (n[0],) not in list(stop_ngrams) 
            ]
        , [1 for i in range(1,limit)]
    )
    #print([d for d in data])
    bulk_insert(NodeNgram, ['node_id', 'ngram_id', 'weight'], [d for d in data])

    dbg.show('MapList computed')

def insert_miam(corpus, ngrams=None, path_file_csv=None, mysession=None):
    
    dbg = DebugTime('Corpus #%d - computing Miam' % corpus.id)
    
    node_miam = get_or_create_node(nodetype='MiamList', corpus=corpus, mysession=mysession)
    mysession.query(NodeNgram).filter(NodeNgram.node_id==node_miam.id).delete()
    mysession.commit()
    
    stop_words = set()
    miam_words = set()
    
    if path_file_csv is not None:
        file_csv = open(path_file_csv, "r")
    reader = csv.reader(file_csv, delimiter=',')

    for line in reader:
        word = line[0]
        tag  = line[4]
        if tag == '1':
            miam_words.add((word, 1))
        elif tag == '0':
            stop_words.add((word, 1))
    
    miam_ids = insert_ngrams(miam_words)
    print(miam_ids)
    limit = len(list(miam_words))
    data = zip(
        [node_miam.id for i in range(1,limit)]
        , [miam_ids[n] for n in miam_ids.keys()]
        , [1 for i in range(1,limit)]
    )
    #print([d for d in data])
    bulk_insert(NodeNgram, ['node_id', 'ngram_id', 'weight'], [d for d in data])
    file_csv.close()
    dbg.show('Miam computed')