Hoja de vida

Par evaluador reconocido por Colciencias.
Categoría Investigador Junior (IJ) (con vigencia hasta 2019-12-05 00:00:00.0) - Convocatoria 781 de 2017
Nombre Sergio Gonzalo Jiménez Vargas
Nombre en citaciones JIMÉNEZ VARGAS, SERGIO GONZALO
Nacionalidad Colombiana
Sexo Masculino

Formación Académica

  •  
  • Doctorado UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA
    Doctorado en Ingeniería de Sistemas y Computación
    Enerode2010 - Noviembrede 2015
    Text Comparison Using Soft Cardinality
  •  
  • Maestría/Magister UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA
    Magister en Ingeniería de Sistemas y Computación
    Enerode2006 - Marzode 2009
    A Knowledge-Based Information Extraction Prototype for Data-Rich Documents in the Information Technology Domain
  •  
  • Pregrado/Universitario UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA
    INGENIERIA DE SISTEMAS
    Enerode1988 - Juliode 1993
    Arquitectura de los Sistemas de Bases de Datos Orientados por Objetos y Elaboración de un Prototipo Ilustrado

    Formación Complementaria

  •  
  • Cursos de corta duración UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA
    Advanced Algorithms - International Engineering Seminar
    Juniode2008 - Juliode 2008

    Experiencia profesional

  •  
  • INSTITUTO CARO Y CUERVO
    Dedicación: 40 horas Semanales Febrero de 2017 Noviembre de 2017

    Actividades de investigación
    -   Investigación y Desarrollo - Titulo:  Desarrollo de una WordNet para el español colombiano y/o latinoamericano Febrero 2017 Noviembre 2017
  •  
  • INSTITUTO CARO Y CUERVO
    Dedicación: 9 horas Semanales Septiembre de 2016 Septiembre de 2016

  •  
  • INSTITUTO CARO Y CUERVO
    Dedicación: 25 horas Semanales Octubre de 2015 Diciembre de 2015

    Actividades de docencia
    -   Postgrado - Nombre del curso:  Diplomado Análisis Computacional del Lenguaje, 20 Octubre 2015 Diciembre 2015
  •  
  • UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA
    Dedicación: 20 horas Semanales Noviembre de 2011 Febrero de 2015

    Actividades de investigación
    -   Investigación y Desarrollo - Titulo:  Sistema de recomendación basado en conocimiento obtenido de manera automática para ambientes de comercio electrónico. Financiado por Colciencias convocatoria 521 de 2010 proyecto 1101-521-28465 Noviembre 2011 Febrero 2015
  •  
  • APLICACIONES INFORMATICAS PROFESIONALES LTDA
    Dedicación: 48 horas Semanales Mayo de 1991 Diciembre de 2005

    Actividades de administración
    -  Otra actividad técnico-científica relevante - Cargo: Otra actividad técnico-científica relevante Mayo de 1991 Diciembre de 2005

    Áreas de actuación

  •  Ciencias Naturales -- Computación y Ciencias de la Información -- Ciencias de la Computación
  •  Humanidades -- Idiomas y Literatura -- Lingüística
  • Idiomas

      Habla Escribe Lee Entiende
  •  Francés
  • Bueno Aceptable Bueno Bueno
  •  Inglés
  • Bueno Bueno Bueno Bueno
  •  Español
  • Bueno Bueno Bueno Bueno

    Líneas de investigación

  •  Procesamiento del lenguaje natural, Activa:Si
  •  Comercio Electrónico, Activa:Si
  •  Sistemas de Recomendación, Activa:Si
  •  Lingüística Computacional, Activa:Si
  •  Lingüística de Corpus, Activa:Si
  • Reconocimientos

  • Tesis de Doctorado con Distincion Laureada,UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA - Juniode 2016
  • Tesis de Maestría Laureada (Resolución 032 de 2017, Acta 06 del 25 de Julio, Consejo Académico),UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA - Juliode 2017
  • Best Paper, MICAI 2011,SOCIEDAD MEXICANA DE INTELIGENCIA ARTIFICIAL - Noviembrede 2011
  • Tesis de Maestría con Mención Meritoria,UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA - Marzode 2009
  •  
    Los ítems de producción con la marca corresponden a productos avalados y validados para la última Convocatoria Nacional para el Reconocimiento y Medición de Grupos de Investigación, Desarrollo Tecnológico o de Innovación y para el Reconocimiento de Investigadores del SNCTeI

    Cursos de corta duración

  • Producción técnica - Cursos de corta duración dictados - Extensión extracurricular
  • SERGIO GONZALO JIMENEZ VARGAS, Diplomado en Análisis Computacional del Lenguaje, Finalidad: . En: Colombia  ,2015,  ,.  participación: Docente , 8 semanas 

    Trabajos dirigidos/tutorías

  • Trabajos dirigidos/Tutorías - Trabajo de grado de maestría o especialidad médica
  • SERGIO GONZALO JIMENEZ VARGAS, JULIA MARLEN BAQUERO VELASQUEZ, PREDICCIÓN AUTOMÁTICA DE LA DIFICULTAD DE PREGUNTAS ABIERTAS DE RESPUESTA CORTA CON PROPÓSITOS EDUCATIVOS  UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA  Estado: Tesis concluida  MAESTRÍA EN EDUCACIÓN  ,2014,  . Persona orientada: George Enrique Dueñas Luna  , Dirigió como: Tutor principal,  meses  
    Areas:
    Humanidades -- Idiomas y Literatura -- Lingüística, Ciencias Sociales -- Ciencias de la Educación -- Educación General (Incluye Capacitación, Pedagogía),
  • Trabajos dirigidos/Tutorías - Trabajo de grado de maestría o especialidad médica
  • SERGIO GONZALO JIMENEZ VARGAS, DIALECTONOS: BÚSQUEDA DE FRONTERAS DIALECTALES ESTADÍSTICAMENTE SIGNIFICATIVAS USANDO CORPUS LÉXICOS GEOLOCALIZADOS  INSTITUTO CARO Y CUERVO  Estado: Tesis concluida  Maestría en Lingüística  ,2014,  . Persona orientada: Carlos Alberto Rodríguez Díaz  , Dirigió como: Tutor principal,  meses  
  • Trabajos dirigidos/Tutorías - Trabajo de grado de maestría o especialidad médica
  • SERGIO GONZALO JIMENEZ VARGAS, ALEXANDER GELBUKH, AUTOMATIC EXTRACTION OF REGIONAL WORDS FROM SOCIAL NETWORKS https://tesis.ipn.mx/handle/123456789/25258?show=full  CENTRO DE INVESTIGACION EN COMPUTACION IPN  Estado: Tesis concluida  Maestría en Computación  ,2015,  . Persona orientada: SERGIO ANDRÉS MANCERA NOMESQUE  , Dirigió como: Coturor/asesor,  meses  
    Areas:
    Ciencias Naturales -- Computación y Ciencias de la Información -- Ciencias de la Computación, Humanidades -- Idiomas y Literatura -- Lingüística,
     

    Jurado en comités de evaluación

  • Datos complementarios - Jurado/Comisiones evaluadoras de trabajo de grado - Maestría
  • SERGIO GONZALO JIMENEZ VARGAS, Titulo: Automatic authorship analysis using deep neural networks Tipo de trabajo presentado: Trabajo de grado/tesis en:  UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA  programa académico Magister en Ingeniería de Sistemas y Computación  Nombre del orientado: Sebastián Ernesto Sierra Loaiza  

    Par evaluador

    Ámbito: Nacional  Par evaluador de: Material para publicación científica  Revista: Ingeniería y Competitividad,  2017,  Enero  
    Ámbito: Internacional  Par evaluador de: Material para publicación científica  Revista: Computación y Sistemas,  2017,  Enero  
    Ámbito: Nacional  Par evaluador de: Material para publicación científica  Revista: Investigación & Desarrollo,  2015,  Agosto  
    Ámbito: Internacional  Par evaluador de: Material para publicación científica  Revista: Ieee Transactions On Learning Technologies,  2018,  Noviembre  
    Ámbito: Internacional  Par evaluador de: Material para publicación científica  Revista: Expert Systems With Applications,  2017,  Diciembre  
    Ámbito: Internacional  Par evaluador de: Material para publicación científica  Revista: Fuzzy Sets And Systems,  2014,  Diciembre  
    Ámbito: Internacional  Par evaluador de: Material para publicación científica  Revista: Fuzzy Information And Engineering,  2017,  Noviembre  
    Ámbito: Internacional  Par evaluador de: Material para publicación científica  Revista: Neural Computing &Amp; Applications,  2017,  Septiembre  
    Ámbito: Internacional  Par evaluador de: Material para publicación científica  Revista: Expert Systems With Applications,  2017,  Agosto  

    Eventos científicos

    1 Nombre del evento: CICLING09 10th International Conference on Intelligent Text Processing and Computational Linguistics  Tipo de evento: Congreso  Ámbito: Internacional  Realizado el:2009-01-01 00:00:00.0,    en Ciudad de México   - CIC-IPN México D.F.  
    Instituciones asociadas
    • Nombre de la institución:CENTRO DE INVESTIGACION EN COMPUTACION IPN Tipo de vinculaciónPatrocinadora
    Participantes
    • Nombre: SERGIO GONZALO JIMENEZ VARGAS Rol en el evento: Organizador
    2 Nombre del evento: 17th String Processing and Information Retrieval Symposium, SPIRE'2010  Tipo de evento: Congreso  Ámbito: Internacional  Realizado el:2010-10-11 00:00:00.0,  2010-10-13 00:00:00.0   en Los Cabos   - Los Cabos, Mexico  
    Productos asociados
    • Nombre del producto:Text Comparison Using Soft Cardinality Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
    Instituciones asociadas
    • Nombre de la institución:DEPARTAMENTO DE INGENIERIA DE SISTEMAS Tipo de vinculaciónPatrocinadora
    Participantes
    • Nombre: SERGIO GONZALO JIMENEZ VARGAS Rol en el evento: Ponente
    3 Nombre del evento: 10th Mexican International Conference on Artificial Intelligence, MICAI 2011  Tipo de evento: Congreso  Ámbito: Internacional  Realizado el:2011-11-26 00:00:00.0,  2011-12-04 00:00:00.0   en Puebla   - Benemérita Universidad Autónoma de Puebla  
    Productos asociados
    • Nombre del producto:SC Spectra: A Linear-Time Soft Cardinality Approximation for Text Comparison Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
    Instituciones asociadas
    • Nombre de la institución:SOCIEDAD MEXICANA DE INTELIGENCIA ARTIFICIAL Tipo de vinculaciónPatrocinadora
    Participantes
    • Nombre: SERGIO GONZALO JIMENEZ VARGAS Rol en el evento: Ponente
    4 Nombre del evento: *SEM 2013: The Second Joint Conference on Lexical and Computational Semantics  Tipo de evento: Congreso  Ámbito: Internacional  Realizado el:2013-06-13 00:00:00.0,  2013-06-14 00:00:00.0   en Atlanta, GA   - Atlanta, Georgia, USA  
    Productos asociados
    • Nombre del producto:SOFTCARDINALITY-CORE: Improving Text Overlap with Distributional Measures for Semantic Textual Similarity Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
    • Nombre del producto:SOFTCARDINALITY: Learning to Identify Directional Cross-Lingual Entailment from Cardinalities and SMT Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
    • Nombre del producto:SOFTCARDINALITY: Hierarchical Text Overlap for Student Response Analysis Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
    • Nombre del producto:UNAL: Discriminating between Literal and Figurative Phrasal Usage Using Distributional Statistics and POS tags Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
    Instituciones asociadas
    • Nombre de la institución:ASSOCIATION FOR COMPUTATIONAL LINGUISTICS Tipo de vinculaciónPatrocinadora
    Participantes
    • Nombre: ALEXANDER GELBUKH Rol en el evento: Ponente
    • Nombre: CLAUDIA JEANNETH BECERRA CORTES Rol en el evento: Ponente
    • Nombre: SERGIO GONZALO JIMENEZ VARGAS Rol en el evento: Ponente
    5 Nombre del evento: *SEM 2012: The First Joint Conference on Lexical and Computational Semantics  Tipo de evento: Congreso  Ámbito: Internacional  Realizado el:2012-06-07 00:00:00.0,  2014-06-12 00:00:00.0   en Montreal   - Montreal, Canadá  
    Productos asociados
    • Nombre del producto:Soft Cardinality: A Parameterized Similarity Function for Text Comparison Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
    • Nombre del producto:Soft Cardinality + ML: Learning Adaptive Similarity Functions for Cross-lingual Textual Entailment Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
    Instituciones asociadas
    • Nombre de la institución:ASSOCIATION FOR COMPUTATIONAL LINGUISTICS Tipo de vinculaciónPatrocinadora
    Participantes
    • Nombre: SERGIO GONZALO JIMENEZ VARGAS Rol en el evento: Ponente
    6 Nombre del evento: *SEM 2014: Third Joint Conference on Lexical and Computational Semantics  Tipo de evento: Congreso  Ámbito: Internacional  Realizado el:2014-08-23 00:00:00.0,  2014-08-24 00:00:00.0   en Dublin   - Dublin, Ireland  
    Productos asociados
    • Nombre del producto:UNAL-NLP: Combining Soft Cardinality Features for Semantic Textual Similarity, Relatedness and Entailment Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
    • Nombre del producto:NTNU: Measuring Semantic Similarity with Sublexical Feature Representations and Soft Cardinality Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
    Instituciones asociadas
    • Nombre de la institución:ASSOCIATION FOR COMPUTATIONAL LINGUISTICS Tipo de vinculaciónPatrocinadora
    Participantes
    • Nombre: SERGIO GONZALO JIMENEZ VARGAS Rol en el evento: Ponente
    7 Nombre del evento: ERROR --------------  Tipo de evento: Congreso  Ámbito: Internacional  Realizado el:2014-08-23 00:00:00.0,  2014-08-24 00:00:00.0   en BUENOS AIRES   - Dublin, Ireland  
    Instituciones asociadas
    • Nombre de la institución: Tipo de vinculaciónPatrocinadora
    Participantes
    • Nombre: SERGIO GONZALO JIMENEZ VARGAS Rol en el evento: Ponente
    8 Nombre del evento: International Workshop on Semantic Evaluation (SemEval-2016)  Tipo de evento: Taller  Ámbito: Internacional  Realizado el:2015-06-16 00:00:00.0,  2015-06-17 00:00:00.0   en San Diego, CA   -  
    Productos asociados
    • Nombre del producto:SERGIOJIMENEZ at SemEval-2016 Task 1: Effectively Combining Paraphrase Database, String Matching, WordNet, and Word Embedding for Semantic Textual Similarity. Tipo de producto:Producción técnica - Presentación de trabajo - Ponencia
    Instituciones asociadas
    • Nombre de la institución:ASSOCIATION FOR COMPUTATIONAL LINGUISTICS Tipo de vinculaciónPatrocinadora
    Participantes
    • Nombre: SERGIO GONZALO JIMENEZ VARGAS Rol en el evento: Ponente
    9 Nombre del evento: 2008 International Conference on Information & Knowledge Engineering, IKE 2008, July 14-17, 2008, Las Vegas, Nevada  Tipo de evento: Otro  Ámbito:   Realizado el:2008-07-01 00:00:00.0,    en   -  
    Productos asociados
    • Nombre del producto:Knowledge-based Information Extraction Using Fuzzy String Searching and Word Sense Disambiguation for IT Product Data-sheets Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Resumen
    Participantes
    • Nombre: SERGIO GONZALO JIMENEZ VARGAS Rol en el evento: Asistente
    10 Nombre del evento: 3CCC, Tercer Congreso Colombiano de Computación  Tipo de evento: Congreso  Ámbito: Nacional  Realizado el:2008-01-01 00:00:00.0,    en MEDELLÍN   - Universidad EAFIT-Medellín Colombia  
    Instituciones asociadas
    • Nombre de la institución:UNIVERSIDAD EAFIT Tipo de vinculaciónPatrocinadora
    Participantes
    • Nombre: SERGIO GONZALO JIMENEZ VARGAS Rol en el evento: Organizador
    11 Nombre del evento: Congreso Internacional de Inteligencia Computacional CIIC 2007  Tipo de evento: Congreso  Ámbito: Internacional  Realizado el:2007-01-01 00:00:00.0,    en BOGOTÁ, D.C.   - Bogotá  
    Instituciones asociadas
    • Nombre de la institución:UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA Tipo de vinculaciónPatrocinadora
    Participantes
    • Nombre: SERGIO GONZALO JIMENEZ VARGAS Rol en el evento: Organizador
    12 Nombre del evento: 11th International Workshop on Semantic Evaluation (SemEval-2017)  Tipo de evento: Taller  Ámbito: Internacional  Realizado el:2017-08-03 00:00:00.0,  2017-08-04 00:00:00.0   en Vancouver   -  
    Productos asociados
    • Nombre del producto:RUFINO at SemEval-2017 Task 2: Cross-lingual lexical similarity by extending PMI and word embeddings systems with a Swadesh's-like list Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
    Instituciones asociadas
    • Nombre de la institución:ASSOCIATION FOR COMPUTATIONAL LINGUISTICS Tipo de vinculaciónPatrocinadora
    Participantes
    • Nombre: SERGIO GONZALO JIMENEZ VARGAS Rol en el evento: Ponente

    Artículos

  • Producción bibliográfica - Artículo - Publicado en revista especializada
  • SERGIO GONZALO JIMENEZ VARGAS, FABIO AUGUSTO GONZALEZ OSORIO, ALEXANDER GELBUKH, "Soft Cardinality in Semantic Text Processing: Experience of the SemEval International Competitions" . En: México 
    Polibits  ISSN: 1870-9044  ed: 
    v.51 fasc. p.63 - 72 ,2015,  DOI: http://dx.doi.org/10.17562/PB-51-9
    Palabras:
    Afinidad Semántica, Soft Cardinality, Soft computing, Text Comparison, natural language processing, semantics, sets cardinality,
  • Producción bibliográfica - Artículo - Publicado en revista especializada
  • SERGIO GONZALO JIMENEZ VARGAS, ALEXANDER GELBUKH, CLAUDIA JEANNETH BECERRA CORTES, FABIO AUGUSTO GONZALEZ OSORIO, "Recomendación de productos a partir de perfiles de usuario interpretables" . En: Colombia 
    Tecnura  ISSN: 0123-921X  ed: Fondo Editorial Universidad Distrital Francisco Jose De Caldas
    v.19 fasc.45 p.89 - 100 ,2015,  DOI:  http://dx.doi.org/10.14483/udistrital.jour.tecnura.2015.3.a07
    Palabras:
    etiquetado social, filtrado colaborativo, interfaces de usuario, sistemas de etiquetado colaborativo, sistemas de recomendación,
  • Producción bibliográfica - Artículo - Publicado en revista especializada
  • SERGIO GONZALO JIMENEZ VARGAS, ALEXANDER GELBUKH, "Baselines for Natural Language Processing Tasks Based on Soft Cardinality Spectra" . En: Azerbaiyán 
    Applied And Computational Mathematics. An International Journal  ISSN: 1683-3511  ed: 
    v.11 fasc.2 p.180 - 199 ,2012,  DOI: 
  • Producción bibliográfica - Artículo - Publicado en revista especializada
  • SERGIO GONZALO JIMENEZ VARGAS, GEORGE ENRIQUE DUENAS LUNA, "G-WordNet: Moving WordNet 3.0 and Its Resources to a Graph Database" . En: Colombia 
    Communications In Computer And Information Science  ISSN: 1865-0929  ed: Springer-Verlag Berlin/Heidelberg
    v.735 fasc. p.100 - 114 ,2017,  DOI: https://doi.org/10.1007/978-3-319-66562-7_8
    Palabras:
    WordNet, Lexical Databases, Graph Databases, Neo4j, Semantic Lexical Similarity,
  • Producción bibliográfica - Artículo - Publicado en revista especializada
  • SERGIO GONZALO JIMENEZ VARGAS, ALEXANDER GELBUKH, FABIO AUGUSTO GONZALEZ OSORIO, "Text Comparison Using Soft Cardinality" . En: Alemania 
    Lecture Notes In Computer Science  ISSN: 0302-9743  ed: Springer
    v.6393 fasc.2010 p.297 - 302 ,2010,  DOI: 
    Palabras:
    Búsqueda Aproximada de Cadenas, Soft Cardinality, Text Comparison, sets cardinality,
  • Producción bibliográfica - Artículo - Publicado en revista especializada
  • SERGIO GONZALO JIMENEZ VARGAS, ALEXANDER GELBUKH, "SC Spectra: A Linear-Time Soft Cardinality Approximation for Text Comparison" . En: Alemania 
    Lecture Notes In Computer Science  ISSN: 0302-9743  ed: Springer
    v.7095 fasc. p.213 - 224 ,2011,  DOI: 10.1007/978-3-642-25330-0_19
    Palabras:
    Búsqueda Aproximada de Cadenas, Similarity measure, Soft Cardinality,
  • Producción bibliográfica - Artículo - Publicado en revista especializada
  • SERGIO GONZALO JIMENEZ VARGAS, CLAUDIA JEANNETH BECERRA CORTES, FABIO AUGUSTO GONZALEZ OSORIO, ALEXANDER GELBUKH, "Generalized Mongue-Elkan Method for Approximate Text String Comparison" . En: Alemania 
    Lecture Notes In Computer Science  ISSN: 0302-9743  ed: Springer
    v.5449 fasc.n/a p.559 - 570 ,2009,  DOI: 
    Palabras:
    Búsqueda Aproximada de Cadenas,
  • Producción bibliográfica - Artículo - Publicado en revista especializada
  • SERGIO GONZALO JIMENEZ VARGAS, FABIO AUGUSTO GONZALEZ OSORIO, "An Ontology-Based Information Extractor for Data-Rich Documents in the Information Tecnology Domain" . En: Colombia 
    Avances En Sistemas E Informática  ISSN: 1657-7663  ed: Universidad Nacional De Colombia Sede Medellin
    v.5 fasc.1 p.47 - 54 ,2008,  DOI: 
    Palabras:
    Búsqueda Aproximada de Cadenas, Extracción de Información, Afinidad Semántica, Desambigüación de sentidos de palabras, Ontologías, Gestión del conocimento,
  • Producción bibliográfica - Artículo - Publicado en revista especializada
  • SERGIO GONZALO JIMENEZ VARGAS, "Mathematical properties of soft cardinality: Enhancing Jaccard, Dice and cosine similarity measures with element-wise distance" . En: Estados Unidos 
    Information Sciences  ISSN: 0020-0255  ed: 
    v.367 fasc.N/A p.373 - 389 ,2016,  DOI: http://dx.doi.org/10.1016/j.ins.2016.06.012
  • Producción bibliográfica - Artículo - Publicado en revista especializada
  • SERGIO GONZALO JIMENEZ VARGAS, "Automatically Assessing Children¿s Writing Skills Based on Age-Supervised Datasets" . En: Alemania 
    Lecture Notes In Computer Science  ISSN: 0302-9743  ed: Springer
    v.8404 fasc.N/A p.566 - 577 ,2014,  DOI: 10.1007/978-3-642-54903-8_47
  • Producción bibliográfica - Artículo - Publicado en revista especializada
  • GEORGE ENRIQUE DUENAS LUNA, SERGIO GONZALO JIMENEZ VARGAS, ALEXANDER GELBUKH, "Automatic Detection of Regional Words for Pan-Hispanic Spanish on Twitter" . En: Suiza 
    Lecture Notes In Computer Science  ISSN: 0302-9743  ed: Springer
    v.11238 fasc. p.404 - 416 ,2018,  DOI: 10.1007/978-3-030-03928-8_33
    Palabras:
    Spanish regionalisms, automatic regional words detection, regionalisms meaning, HSIC, TF-IDF, word2vec,
  • Producción bibliográfica - Artículo - Publicado en revista especializada
  • GEORGE ENRIQUE DUENAS LUNA, SERGIO GONZALO JIMENEZ VARGAS, "LAR-WordNet: A Machine-Translated, Pan-Hispanic and Regional WordNet for Spanish" . En: Suiza 
    Lecture Notes In Computer Science  ISSN: 0302-9743  ed: Springer
    v.11238 fasc. p.392 - 403 ,2018,  DOI: 10.1007/978-3-030-03928-8_32
    Palabras:
    Spanish WordNet, machine-translated WordNet, WordNet, Semantic Lexical Similarity, cross-lingual textual similarity,
  • Producción bibliográfica - Artículo - Publicado en revista especializada
  • SERGIO GONZALO JIMENEZ VARGAS, FABIO AUGUSTO GONZALEZ OSORIO, GEORGE ENRIQUE DUENAS LUNA, ALEXANDER GELBUKH, "BM25-CTF: Improving TF and IDF factors in BM25 by using collection term frequencies" . En: Países Bajos 
    Journal Of Intelligent &Amp; Fuzzy Systems  ISSN: 1064-1246  ed: IOS Press
    v.34 fasc.N/A p.2887 - 2899 ,2018,  DOI: 10.3233/JIFS-169475
    Palabras:
    BM25, TF-IDF, collection term frequency, information retrieval heuristics, TREC collections, deviation from randomness,

    Capitulos de libro

  • Tipo: Capítulo de libro
    SERGIO GONZALO JIMENEZ VARGAS, Tipo: Capítulo de libro
    FABIO AUGUSTO GONZALEZ OSORIO, "ZETEMA: A web service for automatic short-answer questions grading" Computing Colombian Conference (10ccc), 2015 10th . En: Estados Unidos  ISBN: 978-1-4673-9464-2  ed: IEEE Publications , v. , p.504 - 508  ,2015
  • Tipo: Capítulo de libro
    SERGIO GONZALO JIMENEZ VARGAS, Tipo: Capítulo de libro
    GEORGE ENRIQUE DUENAS LUNA, Tipo: Capítulo de libro
    JULIA MARLEN BAQUERO VELASQUEZ, "Automatic prediction of item difficulty for short-answer questions" Computing Colombian Conference (10ccc), 2015 10th . En: Estados Unidos  ISBN: 978-1-4673-9464-2  ed: IEEE Publications , v. , p.478 - 485  ,2015
  • Tipo: Capítulo de libro
    NELLY ESPERANZA MORENO CORDOBA, Tipo: Capítulo de libro
    SERGIO GONZALO JIMENEZ VARGAS, Tipo: Capítulo de libro
    JULIA MARLEN BAQUERO VELASQUEZ, "Automatically Assessing Children¿s Writing Skills Based on Age-Supervised Datasets" Computational Linguistics And Intelligent Text Processing . En: Colombia  ISBN: 978-3-642-54902-1  ed: Springer-Verlag Berlin/Heidelberg , v. , p.566 - 577  ,2014
  • Tipo: Otro capítulo de libro publicado
    SERGIO GONZALO JIMENEZ VARGAS, Tipo: Otro capítulo de libro publicado
    ALEXANDER GELBUKH, "SC Spectra: A Linear-Time Soft Cardinality Approximation for Text Comparison" Micai'11 Proceedings Of The 10th International Conference On Artificial Intelligence: Advances In Soft Computing - Volume Part Ii . En: México  ISBN: 978-3-642-25329-4  ed: Springer-Verlag Berlin/Heidelberg , v. , p.213 - 224  ,2011
  • Softwares

  • Producción técnica - Softwares - Computacional
  • SERGIO GONZALO JIMENEZ VARGAS, COMPUCOMPRA-CRM, Nombre comercial: COMPUCOMPRA-CRM, contrato/registro: , . En: Colombia,  ,2005,  .plataforma: PC,  .ambiente: Windows,
  • Producción técnica - Softwares - Computacional
  • SERGIO GONZALO JIMENEZ VARGAS, PROCONTA/PROVENTA, Nombre comercial: PROCONTA/PROVENTA, contrato/registro: , . En: Colombia,  ,1995,  .plataforma: PC,  .ambiente: DOS,

    Proyectos

    Tipo de proyecto: Investigación y desarrollo 
    Investigación en temas avanzados del Procesamiento del Lenguaje Natural y la Sociolingüística Computacional
    Inicio: Febrero  2018 Fin: Noviembre  2018 Duración 
    Resumen

    El Procesamiento del lenguaje natural y su evolución hacia la Sociolingüística computacional son un tema emergente en la comunidad científica. Los resultados y recursos fruto de la investigación en el 2017 en el Instituto Caro y Cuervo (G-WordNet, Corpus de Twitter del Español, LA-WordNet), así como resultados de la formación académica previa de los investigadores propuestos (tesis doctoral de Sergio Jiménez y de maestría de George Dueñas), proveen un conjunto de temas con el potencial de producir publicaciones en revistas de alto impacto a nivel internacional en estas áreas de la investigación. Por otra parte, Colciencias ha establecido las directrices para la medición de la producción científica de los procesos de investigación en Colombia. Estos modelos al ser aplicados al Instituto Caro y Cuervo han dado como resultado una medida de rendimiento baja que no corresponde a la realidad de calidad y tradición investigativa del Instituto. En el año 2018, buscamos focalizar los esfuerzos en materia de producción de artículos de nuevo conocimiento con el fin de maximizar el impacto en el modelo de medición de Colciencias. Así, al mejorar los indicadores bibliométricos del Grupo de Investigación en Lingüística, se mejoran las perspectivas para su participación futura en convocatorias nacionales e internacionales para la consecución de recursos, así como mejorar la categorización de sus miembros. Adicionalmente, al mejorar dichos indicadores, esperamos que también mejore la percepción que tienen del Instituto las instituciones a las cuales este debe rendir cuentas y el público en general.

    Tipo de proyecto: Investigación y desarrollo 
    UNA VERSIÓN DE WORDNET PARA EL ESPAÑOL COLOMBIANO Y/O LATINOAMERICANO
    Inicio: Febrero  2017 Fin: Noviembre  2017 Duración 
    Resumen

    WordNet es el recurso léxico basado en conocimiento más importante usado en investigaciones y desarrollo en las áreas del procesamiento del lenguaje natural y la lingüística computacional, por ejemplo, en tareas como: extracción de información, resumen automático, búsquedas de respuestas, entre otras. Aunque WordNet puede ser utilizada por humanos como un diccionario, ya que contiene información sobre nombres, verbos, adjetivos, adverbios, etc., su principal cualidad es que es asequible por sistemas automáticos. WordNet se refiere usualmente a la red semántica que fue desarrollada para el idioma inglés desde la década de los 80 en la Universidad de Princeton, la cual actualmente está en su versión 3.01. Una idea del impacto de WordNet en la comunidad de la lingüística computacional es que 1,353 artículos de los casi 38,000 que existen en la antología de la Association for Computational Linguistics (aclweb.org/anthology/) la mencionan en el título o en el abstract. Dada su importancia, investigadores de todo el mundo han querido desarrollar versiones equivalentes en otras lenguas . La iniciativa Global WordNet (globalwordnet.org) pretende unificar las WordNet desarrolladas para otras lenguas en un espacio semántico multilingüe común. Tres iniciativas de desarrollo de WordNets han incluido la lengua española: EuroWordnet (1998), Multilingual Central Repository (España 2004) y MultiWordnet (Italia 2002). Estas son únicamente representativas del español de España, haciendo que el español latinoamericano no esté representado en esta iniciativa global a pesar de contar con la mayoría de los hablantes. En Latinoamérica el español se caracteriza por estar en contacto con otras lenguas nativas, enriqueciéndolo con nuevas palabras y, por tanto, diferenciándolo del dialecto europeo. Esta riqueza lingüística no está representada en WordNet, excluyendo a los latinoamericanos de un paradigma global con el consecuente rezago en investigación y desarrollo. Esto afecta indirectamente a millones de hablantes del español quienes interactúan a diario con nuevas tecnologías del lenguaje y podrían encontrarse en desventaja competitiva en un mundo globalizado debido a esta situación. El Instituto Caro y Cuervo ha sido un líder a nivel latinoamericano en la creación de diccionarios y otros recursos léxicos y lingüísticos. Ha participado en la creación de obras como el Diccionario de construcción y régimen de la lengua castellana de Rufino José Cuervo, Diccionario electrónico sáliba-español, Diccionario de Señas, realizado en convenio con el Instituto Nacional para Sordos (INSOR), el Léxico de la Violencia en Colombia, el Diccionario de Colombianismos, que se realiza en convenio con la Academia Colombiana de la Lengua. Por lo tanto, es el escenario ideal para la creación de la primera WordNet en Latinoamérica.

    Tipo de proyecto: Investigación y desarrollo 
    Sistema de recomendación basado en conocimiento obtenido de manera automática para ambientes de comercio electrónico
    Inicio: Octubre  2011 Fin: Marzo  2015 Duración 
    Resumen