Hoja de vida |
Par evaluador reconocido por Minciencias. |
Categoría |
Investigador Asociado (I) con vigencia
hasta la publicación de los resultados de la siguiente convocatoria
|
Nombre |
Sergio Gonzalo Jiménez Vargas
|
Nombre en citaciones |
JIMÉNEZ VARGAS, SERGIO GONZALO |
Nacionalidad |
Colombiana |
Sexo |
Masculino |
|
Formación Académica |
|
Doctorado
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA
Doctorado en Ingeniería de Sistemas y Computación
Enerode2010 - Noviembrede 2015
Text Comparison Using Soft Cardinality |
|
Maestría/Magister
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA
Magister en Ingeniería de Sistemas y Computación
Enerode2006 - Marzode 2009
A Knowledge-Based Information Extraction Prototype for Data-Rich Documents in the Information Technology Domain |
|
Pregrado/Universitario
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA
INGENIERIA DE SISTEMAS
Enerode1988 - Juliode 1993
Arquitectura de los Sistemas de Bases de Datos Orientados por Objetos y Elaboración de un Prototipo Ilustrado |
|
Formación Complementaria |
|
Cursos de corta duración
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA
Advanced Algorithms - International Engineering Seminar
Juniode2008 - Juliode 2008
|
|
Experiencia profesional |
|
Instituto Caro Y Cuervo
Dedicación: 40 horas Semanales
Febrero de 2017
Noviembre de 2017
Actividades de investigación
-
Investigación y Desarrollo
- Titulo: Desarrollo de una WordNet para el español colombiano y/o latinoamericano
Febrero 2017
Noviembre 2017
|
|
Instituto Caro Y Cuervo
Dedicación: 9 horas Semanales
Septiembre de 2016
Septiembre de 2016
|
|
Instituto Caro Y Cuervo
Dedicación: 25 horas Semanales
Octubre de 2015
Diciembre de 2015
Actividades de docencia
-
Postgrado
- Nombre del curso: Diplomado Análisis Computacional del Lenguaje, 20
Octubre 2015
Diciembre 2015
|
|
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA
Dedicación: 20 horas Semanales
Noviembre de 2011
Febrero de 2015
Actividades de investigación
-
Investigación y Desarrollo
- Titulo: Sistema de recomendación basado en conocimiento obtenido de manera automática para ambientes de comercio electrónico. Financiado por Colciencias convocatoria 521 de 2010 proyecto 1101-521-28465
Noviembre 2011
Febrero 2015
|
|
APLICACIONES INFORMATICAS PROFESIONALES LTDA.
Dedicación: 48 horas Semanales
Mayo de 1991
Diciembre de 2005
Actividades de administración
- Otra actividad técnico-científica relevante
- Cargo: Otra actividad técnico-científica relevante
Mayo de 1991
Diciembre de 2005
|
|
Áreas de actuación |
Ciencias Naturales -- Computación y Ciencias de la Información -- Ciencias de la Computación |
Humanidades -- Idiomas y Literatura -- Lingüística |
|
Idiomas |
|
Habla |
Escribe |
Lee |
Entiende |
Francés |
Bueno |
Aceptable |
Bueno |
Bueno |
Inglés |
Bueno |
Bueno |
Bueno |
Bueno |
Español |
Bueno |
Bueno |
Bueno |
Bueno |
|
Líneas de investigación |
Procesamiento del lenguaje natural, Activa:Si |
Comercio Electrónico, Activa:Si |
Sistemas de Recomendación, Activa:Si |
Lingüística Computacional, Activa:Si |
Lingüística de Corpus, Activa:Si |
|
Reconocimientos |
Tesis de Doctorado con Distincion Laureada,UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA - Juniode 2016 |
Tesis de Maestría Laureada (Resolución 032 de 2017, Acta 06 del 25 de Julio, Consejo Académico),UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA - Juliode 2017 |
Best Paper, MICAI 2011,Sociedad Mexicana de Inteligencia Artificial - Noviembrede 2011 |
Tesis de Maestría con Mención Meritoria,UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA - Marzode 2009 |
Tesis Laureada https://www.caroycuervo.gov.co/Noticias/veinte-estudiantes-obtuvieron-su-titulo-de-maestria-en-el-caro-y-cuervo/,Instituto Caro Y Cuervo - Noviembrede 2018 |
Tesis meritoria,Instituto Caro Y Cuervo - Noviembrede 2020 |
|
|
Los ítems de producción con la marca corresponden a productos avalados y validados para la última Convocatoria Nacional para el Reconocimiento y Medición de Grupos de Investigación, Desarrollo Tecnológico o de Innovación y para el Reconocimiento de Investigadores del SNCTeI |
|
Cursos de corta duración |
Producción técnica - Cursos de corta duración dictados - Extensión extracurricular |
SERGIO GONZALO JIMENEZ VARGAS,
Diplomado en Análisis Computacional del Lenguaje,
Finalidad:
. En: Colombia
,2015,
,.
participación: Docente
, 8 semanas
|
|
Trabajos dirigidos/tutorías |
Trabajos dirigidos/Tutorías - Trabajo de grado de maestría o especialidad clínica
|
SERGIO GONZALO JIMENEZ VARGAS,
JULIA MARLEN BAQUERO VELASQUEZ,
PREDICCIÓN AUTOMÁTICA DE LA DIFICULTAD DE PREGUNTAS ABIERTAS DE RESPUESTA CORTA CON PROPÓSITOS EDUCATIVOS
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA
Estado: Tesis concluida
MAESTRÍA EN EDUCACIÓN
,2014,
. Persona orientada: George Enrique Dueñas Luna
, Dirigió como: Tutor principal,
meses
Areas:
Humanidades -- Idiomas y Literatura -- Lingüística,
Ciencias Sociales -- Ciencias de la Educación -- Educación General (Incluye Capacitación, Pedagogía),
|
Trabajos dirigidos/Tutorías - Trabajo de grado de maestría o especialidad clínica
|
SERGIO GONZALO JIMENEZ VARGAS,
GEORGE ENRIQUE DUENAS LUNA,
TOWARDS THE EVALUATION OF WRITTEN PROFICIENCY ON A COLLABORATIVE SOCIAL NETWORK FOR LEARNING LANGUAGES: YASK
Instituto Caro Y Cuervo
Estado: Tesis concluida
Maestría en Lingüística
,2014,
. Persona orientada: FABIO NELSON SILVA PENAGOS
, Dirigió como: Tutor principal,
meses
|
Trabajos dirigidos/Tutorías - Trabajo de grado de maestría o especialidad clínica
|
SERGIO GONZALO JIMENEZ VARGAS,
DIALECTONOS: BÚSQUEDA DE FRONTERAS DIALECTALES ESTADÍSTICAMENTE SIGNIFICATIVAS USANDO CORPUS LÉXICOS GEOLOCALIZADOS
Instituto Caro Y Cuervo
Estado: Tesis concluida
Maestría en Lingüística
,2014,
. Persona orientada: Carlos Alberto Rodríguez Díaz
, Dirigió como: Tutor principal,
meses
Areas:
Humanidades -- Idiomas y Literatura -- Lingüística,
|
Trabajos dirigidos/Tutorías - Trabajo de grado de maestría o especialidad clínica
|
SERGIO GONZALO JIMENEZ VARGAS,
ALEXANDER GELBUKH,
AUTOMATIC EXTRACTION OF REGIONAL WORDS FROM SOCIAL NETWORKS https://tesis.ipn.mx/handle/123456789/25258?show=full
Centro de Investigación en Computación - IPN
Estado: Tesis concluida
Maestría en Computación
,2015,
. Persona orientada: SERGIO ANDRÉS MANCERA NOMESQUE
, Dirigió como: Coturor/asesor,
meses
Areas:
Ciencias Naturales -- Computación y Ciencias de la Información -- Ciencias de la Computación,
Humanidades -- Idiomas y Literatura -- Lingüística,
|
|
|
Jurado en comités de evaluación |
Datos complementarios - Jurado/Comisiones evaluadoras de trabajo de grado - Maestría |
SERGIO GONZALO JIMENEZ VARGAS,
Titulo: Automatic authorship analysis using deep neural networks
Tipo de trabajo presentado: Trabajo de grado/tesis
en: UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA
programa académico Magister en Ingeniería de Sistemas y Computación
Nombre del orientado: Sebastián Ernesto Sierra Loaiza
|
|
|
Par evaluador |
Ámbito: Nacional
Par evaluador de: Material para publicación científica
Revista: Ingeniería y Competitividad,
2017,
Enero
|
Ámbito: Internacional
Par evaluador de: Material para publicación científica
Revista: Computación y Sistemas,
2017,
Enero
|
Ámbito: Nacional
Par evaluador de: Material para publicación científica
Revista: Investigación & Desarrollo,
2015,
Agosto
|
Ámbito: Internacional
Par evaluador de: Material para publicación científica
Revista: IEEE Transactions on Learning Technologies,
2018,
Noviembre
|
Ámbito: Internacional
Par evaluador de: Material para publicación científica
Revista: Expert Systems with Applications,
2017,
Diciembre
|
Ámbito: Internacional
Par evaluador de: Material para publicación científica
Revista: Fuzzy Sets and Systems,
2014,
Diciembre
|
Ámbito: Internacional
Par evaluador de: Material para publicación científica
Revista: Fuzzy Information and Engineering,
2017,
Noviembre
|
Ámbito: Internacional
Par evaluador de: Material para publicación científica
Revista: Neural Computing '&' Applications,
2017,
Septiembre
|
Ámbito: Internacional
Par evaluador de: Material para publicación científica
Revista: Expert Systems with Applications,
2017,
Agosto
|
|
|
|
Eventos científicos |
1 Nombre del evento: ERROR --------------
Tipo de evento: Congreso
Ámbito: Internacional
Realizado el:2014-08-23 00:00:00.0,
2014-08-24 00:00:00.0
en BUENOS AIRES - Dublin, Ireland
|
|
Instituciones asociadas
- Nombre de la institución:
Tipo de vinculaciónPatrocinadora
|
Participantes
- Nombre: SERGIO GONZALO JIMENEZ VARGAS
Rol en el evento: Ponente
|
|
2 Nombre del evento: International Workshop on Semantic Evaluation (SemEval-2016)
Tipo de evento: Taller
Ámbito: Internacional
Realizado el:2015-06-16 00:00:00.0,
2015-06-17 00:00:00.0
en San Diego, CA -
|
Productos asociados
- Nombre del producto:SERGIOJIMENEZ at SemEval-2016 Task 1: Effectively Combining Paraphrase Database, String Matching, WordNet, and Word Embedding for Semantic Textual Similarity.
Tipo de producto:Producción técnica - Presentación de trabajo - Ponencia
|
Instituciones asociadas
- Nombre de la institución:Association for Computational Linguistics
Tipo de vinculaciónPatrocinadora
|
Participantes
- Nombre: SERGIO GONZALO JIMENEZ VARGAS
Rol en el evento: Ponente
|
|
3 Nombre del evento: *SEM 2013: The Second Joint Conference on Lexical and Computational Semantics
Tipo de evento: Congreso
Ámbito: Internacional
Realizado el:2013-06-13 00:00:00.0,
2013-06-14 00:00:00.0
en Atlanta, GA - Atlanta, Georgia, USA
|
Productos asociados
- Nombre del producto:SOFTCARDINALITY-CORE: Improving Text Overlap with Distributional Measures for Semantic Textual Similarity
Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
- Nombre del producto:SOFTCARDINALITY: Learning to Identify Directional Cross-Lingual Entailment from Cardinalities and SMT
Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
- Nombre del producto:SOFTCARDINALITY: Hierarchical Text Overlap for Student Response Analysis
Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
- Nombre del producto:UNAL: Discriminating between Literal and Figurative Phrasal Usage Using Distributional Statistics and POS tags
Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
|
Instituciones asociadas
- Nombre de la institución:Association for Computational Linguistics
Tipo de vinculaciónPatrocinadora
|
Participantes
- Nombre: ALEXANDER GELBUKH
Rol en el evento: Ponente
- Nombre: CLAUDIA JEANNETH BECERRA CORTES
Rol en el evento: Ponente
- Nombre: SERGIO GONZALO JIMENEZ VARGAS
Rol en el evento: Ponente
|
|
4 Nombre del evento: 10th Mexican International Conference on Artificial Intelligence, MICAI 2011
Tipo de evento: Congreso
Ámbito: Internacional
Realizado el:2011-11-26 00:00:00.0,
2011-12-04 00:00:00.0
en Puebla - Benemérita Universidad Autónoma de Puebla
|
Productos asociados
- Nombre del producto:SC Spectra: A Linear-Time Soft Cardinality Approximation for Text Comparison
Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
|
Instituciones asociadas
- Nombre de la institución:Sociedad Mexicana de Inteligencia Artificial
Tipo de vinculaciónPatrocinadora
|
Participantes
- Nombre: SERGIO GONZALO JIMENEZ VARGAS
Rol en el evento: Ponente
|
|
5 Nombre del evento: *SEM 2012: The First Joint Conference on Lexical and Computational Semantics
Tipo de evento: Congreso
Ámbito: Internacional
Realizado el:2012-06-07 00:00:00.0,
2014-06-12 00:00:00.0
en Montreal - Montreal, Canadá
|
Productos asociados
- Nombre del producto:Soft Cardinality: A Parameterized Similarity Function for Text Comparison
Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
- Nombre del producto:Soft Cardinality + ML: Learning Adaptive Similarity Functions for Cross-lingual Textual Entailment
Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
|
Instituciones asociadas
- Nombre de la institución:Association for Computational Linguistics
Tipo de vinculaciónPatrocinadora
|
Participantes
- Nombre: SERGIO GONZALO JIMENEZ VARGAS
Rol en el evento: Ponente
|
|
6 Nombre del evento: 17th String Processing and Information Retrieval Symposium, SPIRE'2010
Tipo de evento: Congreso
Ámbito: Internacional
Realizado el:2010-10-11 00:00:00.0,
2010-10-13 00:00:00.0
en Los Cabos - Los Cabos, Mexico
|
Productos asociados
- Nombre del producto:Text Comparison Using Soft Cardinality
Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
|
Instituciones asociadas
- Nombre de la institución:
Tipo de vinculaciónPatrocinadora
|
Participantes
- Nombre: SERGIO GONZALO JIMENEZ VARGAS
Rol en el evento: Ponente
|
|
7 Nombre del evento: *SEM 2014: Third Joint Conference on Lexical and Computational Semantics
Tipo de evento: Congreso
Ámbito: Internacional
Realizado el:2014-08-23 00:00:00.0,
2014-08-24 00:00:00.0
en Dublin - Dublin, Ireland
|
Productos asociados
- Nombre del producto:UNAL-NLP: Combining Soft Cardinality Features for Semantic Textual Similarity, Relatedness and Entailment
Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
- Nombre del producto:NTNU: Measuring Semantic Similarity with Sublexical Feature Representations and Soft Cardinality
Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
|
Instituciones asociadas
- Nombre de la institución:Association for Computational Linguistics
Tipo de vinculaciónPatrocinadora
|
Participantes
- Nombre: SERGIO GONZALO JIMENEZ VARGAS
Rol en el evento: Ponente
|
|
8 Nombre del evento: 2008 International Conference on Information & Knowledge Engineering, IKE 2008, July 14-17, 2008, Las Vegas, Nevada
Tipo de evento: Otro
Ámbito:
Realizado el:2008-07-01 00:00:00.0,
en -
|
Productos asociados
- Nombre del producto:Knowledge-based Information Extraction Using Fuzzy String Searching and Word Sense Disambiguation for IT Product Data-sheets
Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Resumen
|
|
Participantes
- Nombre: SERGIO GONZALO JIMENEZ VARGAS
Rol en el evento: Asistente
|
|
9 Nombre del evento: 3CCC, Tercer Congreso Colombiano de Computación
Tipo de evento: Congreso
Ámbito: Nacional
Realizado el:2008-01-01 00:00:00.0,
en MEDELLÍN - Universidad EAFIT-Medellín Colombia
|
|
Instituciones asociadas
- Nombre de la institución:UNIVERSIDAD EAFIT
Tipo de vinculaciónPatrocinadora
|
Participantes
- Nombre: SERGIO GONZALO JIMENEZ VARGAS
Rol en el evento: Organizador
|
|
10 Nombre del evento: CICLING09 10th International Conference on Intelligent Text Processing and Computational Linguistics
Tipo de evento: Congreso
Ámbito: Internacional
Realizado el:2009-01-01 00:00:00.0,
en Ciudad de México - CIC-IPN México D.F.
|
|
Instituciones asociadas
- Nombre de la institución:Centro de Investigación en Computación - IPN
Tipo de vinculaciónPatrocinadora
|
Participantes
- Nombre: SERGIO GONZALO JIMENEZ VARGAS
Rol en el evento: Organizador
|
|
11 Nombre del evento: Congreso Internacional de Inteligencia Computacional CIIC 2007
Tipo de evento: Congreso
Ámbito: Internacional
Realizado el:2007-01-01 00:00:00.0,
en BOGOTÁ, D.C. - Bogotá
|
|
Instituciones asociadas
- Nombre de la institución:UNIVERSIDAD NACIONAL DE COLOMBIA SEDE BOGOTA
Tipo de vinculaciónPatrocinadora
|
Participantes
- Nombre: SERGIO GONZALO JIMENEZ VARGAS
Rol en el evento: Organizador
|
|
12 Nombre del evento: 11th International Workshop on Semantic Evaluation (SemEval-2017)
Tipo de evento: Taller
Ámbito: Internacional
Realizado el:2017-08-03 00:00:00.0,
2017-08-04 00:00:00.0
en Vancouver -
|
Productos asociados
- Nombre del producto:RUFINO at SemEval-2017 Task 2: Cross-lingual lexical similarity by extending PMI and word embeddings systems with a Swadesh's-like list
Tipo de producto:Producción bibliográfica - Trabajos en eventos (Capítulos de memoria) - Completo
|
Instituciones asociadas
- Nombre de la institución:Association for Computational Linguistics
Tipo de vinculaciónPatrocinadora
|
Participantes
- Nombre: SERGIO GONZALO JIMENEZ VARGAS
Rol en el evento: Ponente
|
|
|
|
|
|
|
|
|
|
|
|
|
Artículos |
Producción bibliográfica - Artículo - Publicado en revista especializada
|
SERGIO GONZALO JIMENEZ VARGAS,
FABIO AUGUSTO GONZALEZ OSORIO,
ALEXANDER GELBUKH,
"Soft Cardinality in Semantic Text Processing: Experience of the SemEval International Competitions"
. En: México
Polibits
ISSN: 1870-9044
ed:
v.51
fasc.
p.63
- 72
,2015,
DOI: http://dx.doi.org/10.17562/PB-51-9
Palabras:
Afinidad Semántica,
Soft Cardinality,
Soft computing,
Text Comparison,
natural language processing,
semantics,
sets cardinality,
|
Producción bibliográfica - Artículo - Publicado en revista especializada
|
SERGIO GONZALO JIMENEZ VARGAS,
ALEXANDER GELBUKH,
CLAUDIA JEANNETH BECERRA CORTES,
FABIO AUGUSTO GONZALEZ OSORIO,
"Recomendación de productos a partir de perfiles de usuario interpretables"
. En: Colombia
Tecnura
ISSN: 0123-921X
ed: Editorial UD (Editorial Universidad Distrital Francisco José de Caldas)
v.19
fasc.45
p.89
- 100
,2015,
DOI: http://dx.doi.org/10.14483/udistrital.jour.tecnura.2015.3.a07
Palabras:
etiquetado social,
filtrado colaborativo,
interfaces de usuario,
sistemas de etiquetado colaborativo,
sistemas de recomendación,
|
Producción bibliográfica - Artículo - Publicado en revista especializada
|
SERGIO GONZALO JIMENEZ VARGAS,
ALEXANDER GELBUKH,
"Baselines for Natural Language Processing Tasks Based on Soft Cardinality Spectra"
. En: Azerbaiyán
Applied and Computational Mathematics
ISSN: 1683-3511
ed: Azerbaycan Dovlet Iqtisad Universiteti
v.11
fasc.2
p.180
- 199
,2012,
DOI:
|
Producción bibliográfica - Artículo - Publicado en revista especializada
|
SERGIO GONZALO JIMENEZ VARGAS,
GEORGE ENRIQUE DUENAS LUNA,
"G-WordNet: Moving WordNet 3.0 and Its Resources to a Graph Database"
. En: Colombia
Communications in Computer and Information Science
ISSN: 1865-0929
ed: Springer-Verlag London Ltd.
v.735
fasc.
p.100
- 114
,2017,
DOI: https://doi.org/10.1007/978-3-319-66562-7_8
Palabras:
WordNet,
Lexical Databases,
Graph Databases,
Neo4j,
Semantic Lexical Similarity,
|
Producción bibliográfica - Artículo - Publicado en revista especializada
|
SERGIO GONZALO JIMENEZ VARGAS,
ALEXANDER GELBUKH,
FABIO AUGUSTO GONZALEZ OSORIO,
"Text Comparison Using Soft Cardinality"
. En: Alemania
Lecture Notes in Computer Science
ISSN: 0302-9743
ed: Springer-Verlag London Ltd.
v.6393
fasc.2010
p.297
- 302
,2010,
DOI:
Palabras:
Búsqueda Aproximada de Cadenas,
Soft Cardinality,
Text Comparison,
sets cardinality,
|
Producción bibliográfica - Artículo - Publicado en revista especializada
|
SERGIO GONZALO JIMENEZ VARGAS,
ALEXANDER GELBUKH,
"SC Spectra: A Linear-Time Soft Cardinality Approximation for Text Comparison"
. En: Alemania
Lecture Notes in Computer Science
ISSN: 0302-9743
ed: Springer-Verlag London Ltd.
v.7095
fasc.
p.213
- 224
,2011,
DOI: 10.1007/978-3-642-25330-0_19
Palabras:
Búsqueda Aproximada de Cadenas,
Similarity measure,
Soft Cardinality,
|
Producción bibliográfica - Artículo - Publicado en revista especializada
|
SERGIO GONZALO JIMENEZ VARGAS,
CLAUDIA JEANNETH BECERRA CORTES,
FABIO AUGUSTO GONZALEZ OSORIO,
ALEXANDER GELBUKH,
"Generalized Mongue-Elkan Method for Approximate Text String Comparison"
. En: Alemania
Lecture Notes in Computer Science
ISSN: 0302-9743
ed: Springer-Verlag London Ltd.
v.5449
fasc.n/a
p.559
- 570
,2009,
DOI:
Palabras:
Búsqueda Aproximada de Cadenas,
|
Producción bibliográfica - Artículo - Publicado en revista especializada
|
SERGIO GONZALO JIMENEZ VARGAS,
YOULIN YANDIRIA AVILA,
GEORGE ENRIQUE DUENAS LUNA,
ALEXANDER GELBUKH,
"Automatic prediction of citability of scientific articles by stylometry of their titles and abstracts"
. En: Países Bajos
Scientometrics
ISSN: 0138-9130
ed: Springer Netherlands
v.125
fasc.N/A
p.3187
- 3232
,2020,
DOI: 10.1007/s11192-020-03526-1
Palabras:
Bibliometrics,
Citation prediction,
Paper retrieval,
Stylometry,
|
Producción bibliográfica - Artículo - Publicado en revista especializada
|
SERGIO GONZALO JIMENEZ VARGAS,
FABIO AUGUSTO GONZALEZ OSORIO,
"An Ontology-Based Information Extractor for Data-Rich Documents in the Information Tecnology Domain"
. En: Colombia
Avances En Sistemas E Informática
ISSN: 1657-7663
ed: Universidad Nacional De Colombia Sede Medellin
v.5
fasc.1
p.47
- 54
,2008,
DOI:
Palabras:
Búsqueda Aproximada de Cadenas,
Extracción de Información,
Afinidad Semántica,
Desambigüación de sentidos de palabras,
Ontologías,
Gestión del conocimento,
|
Producción bibliográfica - Artículo - Publicado en revista especializada
|
SERGIO GONZALO JIMENEZ VARGAS,
"Mathematical properties of soft cardinality: Enhancing Jaccard, Dice and cosine similarity measures with element-wise distance"
. En: Estados Unidos
Information Sciences
ISSN: 0020-0255
ed: Elsevier Bv
v.367
fasc.N/A
p.373
- 389
,2016,
DOI: http://dx.doi.org/10.1016/j.ins.2016.06.012
|
Producción bibliográfica - Artículo - Publicado en revista especializada
|
SERGIO GONZALO JIMENEZ VARGAS,
"Automatically Assessing Children¿s Writing Skills Based on Age-Supervised Datasets"
. En: Alemania
Lecture Notes in Computer Science
ISSN: 0302-9743
ed: Springer-Verlag London Ltd.
v.8404
fasc.N/A
p.566
- 577
,2014,
DOI: 10.1007/978-3-642-54903-8_47
|
Producción bibliográfica - Artículo - Publicado en revista especializada
|
SERGIO GONZALO JIMENEZ VARGAS,
GEORGE ENRIQUE DUENAS LUNA,
CLAUDIA JEANNETH BECERRA CORTES,
"An Ontology-Based Recommender System with an Application to the Star Trek Television Franchise"
. En: Suiza
Future Internet
ISSN: 1999-5903
ed: Multidisciplinary Digital Publishing Institute (MDPI)
v.11
fasc.9
p.1
- 23
,2019,
DOI: 10.3390/fi11090182
Palabras:
Ontological engineering,
sistemas de recomendación,
Sistemas de recomendación basados en conocimi,
|
Producción bibliográfica - Artículo - Publicado en revista especializada
|
SERGIO GONZALO JIMENEZ VARGAS,
ALEXANDER GELBUKH,
FABIO AUGUSTO GONZALEZ OSORIO,
GEORGE ENRIQUE DUENAS LUNA,
"word2set: WordNet-Based Word Representation Rivaling Neural Word Embedding for Lexical Similarity and Sentiment Analysis"
. En:
IEEE Computational Intelligence Magazine
ISSN: 1556-603X
ed: Institute of Electrical and Electronics Engineers
v.14
fasc.2
p.41
- 53
,2019,
DOI: 10.1109/MCI.2019.2901085
|
Producción bibliográfica - Artículo - Publicado en revista especializada
|
SERGIO GONZALO JIMENEZ VARGAS,
GEORGE ENRIQUE DUENAS LUNA,
ALEXANDER GELBUKH,
CARLOS ALBERTO RODRIGUEZ DIAZ,
JOHNATAN ESTIVEN BONILLA HUERFANO,
"Dialectones: Finding Statistically Significant Dialectal Boundaries Using Twitter Data"
. En: México
Computacion y Sistemas
ISSN: 1405-5546
ed: Editores Asociados
v.22
fasc.4
p.1213
- 1222
,2018,
DOI: 10.13053/CyS-22-4-3104
Palabras:
Dialectometry,
non-parametric methods,
corpus-based dialectometry,
Hilbert-Schmidth independence criterion,
HSIC,
Wilcoxon signed-rank test,
ecotone,
dialectone,
|
Producción bibliográfica - Artículo - Publicado en revista especializada
|
GEORGE ENRIQUE DUENAS LUNA,
SERGIO GONZALO JIMENEZ VARGAS,
ALEXANDER GELBUKH,
"Automatic Detection of Regional Words for Pan-Hispanic Spanish on Twitter"
. En: Suiza
Lecture Notes in Computer Science
ISSN: 0302-9743
ed: Springer-Verlag London Ltd.
v.11238
fasc.
p.404
- 416
,2018,
DOI: 10.1007/978-3-030-03928-8_33
Palabras:
Spanish regionalisms,
automatic regional words detection,
regionalisms meaning,
HSIC,
TF-IDF,
word2vec,
|
Producción bibliográfica - Artículo - Publicado en revista especializada
|
GEORGE ENRIQUE DUENAS LUNA,
SERGIO GONZALO JIMENEZ VARGAS,
"LAR-WordNet: A Machine-Translated, Pan-Hispanic and Regional WordNet for Spanish"
. En: Suiza
Lecture Notes in Computer Science
ISSN: 0302-9743
ed: Springer-Verlag London Ltd.
v.11238
fasc.
p.392
- 403
,2018,
DOI: 10.1007/978-3-030-03928-8_32
Palabras:
Spanish WordNet,
machine-translated WordNet,
WordNet,
Semantic Lexical Similarity,
cross-lingual textual similarity,
|
Producción bibliográfica - Artículo - Publicado en revista especializada
|
SERGIO GONZALO JIMENEZ VARGAS,
FABIO AUGUSTO GONZALEZ OSORIO,
GEORGE ENRIQUE DUENAS LUNA,
ALEXANDER GELBUKH,
"BM25-CTF: Improving TF and IDF factors in BM25 by using collection term frequencies"
. En: Países Bajos
Journal Of Intelligent '&' Fuzzy Systems
ISSN: 1064-1246
ed: IOS Press
v.34
fasc.N/A
p.2887
- 2899
,2018,
DOI: 10.3233/JIFS-169475
Palabras:
BM25,
TF-IDF,
collection term frequency,
information retrieval heuristics,
TREC collections,
deviation from randomness,
|
|
|
Capitulos de libro |
Tipo: Capítulo de libro
SERGIO GONZALO JIMENEZ VARGAS,
Tipo: Capítulo de libro
FABIO AUGUSTO GONZALEZ OSORIO,
"ZETEMA: A web service for automatic short-answer questions grading"
Computing Colombian Conference (10ccc), 2015 10th
. En: Estados Unidos
ISBN: 978-1-4673-9464-2
ed: IEEE Publications
, v.
, p.504
- 508
,2015
|
Tipo: Capítulo de libro
SERGIO GONZALO JIMENEZ VARGAS,
Tipo: Capítulo de libro
GEORGE ENRIQUE DUENAS LUNA,
Tipo: Capítulo de libro
JULIA MARLEN BAQUERO VELASQUEZ,
"Automatic prediction of item difficulty for short-answer questions"
Computing Colombian Conference (10ccc), 2015 10th
. En: Estados Unidos
ISBN: 978-1-4673-9464-2
ed: IEEE Publications
, v.
, p.478
- 485
,2015
|
Tipo: Capítulo de libro
GEORGE ENRIQUE DUENAS LUNA,
Tipo: Capítulo de libro
SERGIO GONZALO JIMENEZ VARGAS,
"G-WordNet: Moving WordNet 3.0 and its Resources to a Graph Database."
Advances in Computing
. En: Suiza
ISBN: 978-3-319-66561-0
ed: Springer Publishing Company, Inc.
, v.
, p.100
- 114
735
,2017
Palabras:
WordNet,
Lexical Databases,
Graph Databases,
Neo4j,
Semantic Lexical Similarity,
Areas:
Humanidades -- Idiomas y Literatura -- Lingüística,
Ingeniería y Tecnología -- Ingenierías Eléctrica, Electrónica e Informática -- Ingeniería de Sistemas y Comunicaciones,
Sectores:
Desarrollo de programas (software) y prestación de servicios en informática - Desarrollo de programas (software),
|
Tipo: Capítulo de libro
GEORGE ENRIQUE DUENAS LUNA,
Tipo: Capítulo de libro
SERGIO GONZALO JIMENEZ VARGAS,
"LAR-WordNet: A Machine-Translated, Pan-Hispanic and Regional WordNet for Spanish"
Advances in Artificial Intelligence - IBERAMIA 2018
. En: Suiza
ISBN: 978-3-030-03927-1
ed: Springer Publishing Company, Inc.
, v.
, p.392
- 403
11238
,2018
Palabras:
Spanish WordNet,
machine-translated WordNet,
WordNet,
Semantic Lexical Similarity,
cross-lingual textual similarity,
Areas:
Humanidades -- Idiomas y Literatura -- Lingüística,
Ciencias Naturales -- Computación y Ciencias de la Información -- Ciencias de la Computación,
Ingeniería y Tecnología -- Ingenierías Eléctrica, Electrónica e Informática -- Ingeniería de Sistemas y Comunicaciones,
Sectores:
Desarrollo de programas (software) y prestación de servicios en informática - Desarrollo de programas (software),
|
Tipo: Capítulo de libro
SERGIO GONZALO JIMENEZ VARGAS,
Tipo: Capítulo de libro
GEORGE ENRIQUE DUENAS LUNA,
Tipo: Capítulo de libro
ALEXANDER GELBUKH,
Tipo: Capítulo de libro
CARLOS ALBERTO RODRIGUEZ DIAZ,
"Automatic Detection of Regional Words for Pan-Hispanic Spanish on Twitter."
Advances in Artificial Intelligence - IBERAMIA 2018
. En: Suiza
ISBN: 978-3-030-03927-1
ed: Springer Publishing Company, Inc.
, v.
, p.404
- 416
11238
,2018
Palabras:
Spanish regionalisms,
automatic regional words detection,
regionalisms meaning,
HSIC,
Hilbert-Schmidth independence criterion,
TF-IDF,
word2vec,
Areas:
Humanidades -- Idiomas y Literatura -- Lingüística,
Ciencias Naturales -- Computación y Ciencias de la Información -- Ciencias de la Computación,
Ingeniería y Tecnología -- Ingenierías Eléctrica, Electrónica e Informática -- Ingeniería de Sistemas y Comunicaciones,
Sectores:
Desarrollo de programas (software) y prestación de servicios en informática - Desarrollo de programas (software),
|
Tipo: Capítulo de libro
SERGIO GONZALO JIMENEZ VARGAS,
"Prueba para borrar"
prueba para borrar NO USAR
. En: Colombia
ISBN: 57-15481-89-5
ed: Senal Editora Y Universidad De Medellin
, v.
, p.12
- 123
,2019
|
Tipo: Capítulo de libro
NELLY ESPERANZA MORENO CORDOBA,
Tipo: Capítulo de libro
SERGIO GONZALO JIMENEZ VARGAS,
Tipo: Capítulo de libro
JULIA MARLEN BAQUERO VELASQUEZ,
"Automatically Assessing Children¿s Writing Skills Based on Age-Supervised Datasets"
Computational Linguistics And Intelligent Text Processing
. En: Colombia
ISBN: 978-3-642-54902-1
ed: Springer-Verlag Berlin/Heidelberg
, v.
, p.566
- 577
,2014
|
Tipo: Otro capítulo de libro publicado
SERGIO GONZALO JIMENEZ VARGAS,
Tipo: Otro capítulo de libro publicado
ALEXANDER GELBUKH,
"SC Spectra: A Linear-Time Soft Cardinality Approximation for Text Comparison"
Micai'11 Proceedings Of The 10th International Conference On Artificial Intelligence: Advances In Soft Computing - Volume Part Ii
. En: México
ISBN: 978-3-642-25329-4
ed: Springer-Verlag Berlin/Heidelberg
, v.
, p.213
- 224
,2011
|
|
|
|
|
|
|
|
Softwares |
Producción técnica - Softwares - Computacional |
SERGIO GONZALO JIMENEZ VARGAS,
COMPUCOMPRA-CRM,
Nombre comercial: COMPUCOMPRA-CRM,
contrato/registro: ,
. En: Colombia,
,2005,
.plataforma: PC,
.ambiente: Windows,
|
Producción técnica - Softwares - Computacional |
SERGIO GONZALO JIMENEZ VARGAS,
PROCONTA/PROVENTA,
Nombre comercial: PROCONTA/PROVENTA,
contrato/registro: ,
. En: Colombia,
,1995,
.plataforma: PC,
.ambiente: DOS,
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Proyectos |
Tipo de proyecto: Investigación y desarrollo
Investigación en temas avanzados del Procesamiento del Lenguaje Natural y la Sociolingüística Computational II
Inicio: Febrero
2019
Fin: Diciembre
2019
Duración
Resumen
En continuidad con la iniciativa de promoción de la producción de nuevo conocimiento con verificación bibliométrica del grupo de investigación en Lingüística del ICC en 2018, proponemos cuatro investigaciones enmarcadas en el campo del Procesamiento del Lenguaje Natural y la Sociolingüística Computacional. Los temas varían desde el análisis a nivel de corpus hasta el léxico, los cuales incluyen: la adquisición natural de español como L2/LE, la evaluación de la similitud narrativa basada en ontologías, análisis lingüístico de la dificultad de las preguntas con fines educativos y la representación léxica basada en WordNet. Estas investigaciones se abordarán con metodología empírica basada en conjuntos de datos textuales de gran tamaño y con evaluaciones cuantitativas que contrastan los resultados frente al estado del arte. Adicionalmente, proponemos cuatro respectivos productos de generación de nuevo conocimiento en revistas internacionales homologadas por Colciencias, productos de apropiación social del conocimiento y desarrollo tecnológico.
|
Tipo de proyecto: Investigación y desarrollo
Estilometría para predecir la citabilidad de los trabajos a partir de títulos y resúmenes
Inicio: Febrero
2020
Fin: Diciembre
2020
Duración
Resumen
La decisión de leer un artículo de investigación se toma comúnmente al leer su título y resumen. Aunque el contenido y el mérito deben orientar esta decisión, otros factores como el estilo de escritura pueden intervenir. Eventualmente, más lecturas de un artículo podrían producir más citas. Proponemos investigar los factores estilísticos en el título y el resumen de los artículos de investigación que afectan su ¿citabilidad¿ mediante métodos del Procesamiento del Lenguaje Natural y la Cienciometría. Dado que el número de citas es la función de ranqueo preferida de varios motores de búsqueda académicos (p. ej. Google Scholar, ArtnetMiner), nuestra investigación podría aliviar la baja representación de los artículos recientes aún no citados en los resultados de las consultas. Para esta investigación, pretendemos recolectar un conjunto de datos de Scopus, destinado a serrepresentativo de toda la ciencia, es decir,se abordará con metodología empírica y con evaluaciones cuantitativas que contrastan los resultados frente al estado del arte. Para cada pareja de título y resumen en el conjunto de datos, extraeremos características estilísticas, que incluyen, entre otras, características en los niveles de carácter, sílaba, token (i.e.,palabras), oración y categorías gramaticales. El resultado de esta investigación será un producto de generación de nuevo conocimiento en revista internacional homologada por Colciencias.
|
Tipo de proyecto: Investigación y desarrollo
Investigación en temas avanzados del Procesamiento del Lenguaje Natural y la Sociolingüística Computacional
Inicio: Febrero
2018
Fin: Noviembre
2018
Duración
Resumen
El Procesamiento del lenguaje natural y su evolución hacia la Sociolingüística computacional son un tema emergente en la comunidad científica. Los resultados y recursos fruto de la investigación en el 2017 en el Instituto Caro y Cuervo (G-WordNet, Corpus de Twitter del Español, LA-WordNet), así como resultados de la formación académica previa de los investigadores propuestos (tesis doctoral de Sergio Jiménez y de maestría de George Dueñas), proveen un conjunto de temas con el potencial de producir publicaciones en revistas de alto impacto a nivel internacional en estas áreas de la investigación. Por otra parte, Colciencias ha establecido las directrices para la medición de la producción científica de los procesos de investigación en Colombia. Estos modelos al ser aplicados al Instituto Caro y Cuervo han dado como resultado una medida de rendimiento baja que no corresponde a la realidad de calidad y tradición investigativa del Instituto. En el año 2018, buscamos focalizar los esfuerzos en materia de producción de artículos de nuevo conocimiento con el fin de maximizar el impacto en el modelo de medición de Colciencias. Así, al mejorar los indicadores bibliométricos del Grupo de Investigación en Lingüística, se mejoran las perspectivas para su participación futura en convocatorias nacionales e internacionales para la consecución de recursos, así como mejorar la categorización de sus miembros. Adicionalmente, al mejorar dichos indicadores, esperamos que también mejore la percepción que tienen del Instituto las instituciones a las cuales este debe rendir cuentas y el público en general.
|
Tipo de proyecto: Investigación y desarrollo
UNA VERSIÓN DE WORDNET PARA EL ESPAÑOL COLOMBIANO Y/O LATINOAMERICANO
Inicio: Febrero
2017
Fin: Noviembre
2017
Duración
Resumen
WordNet es el recurso léxico basado en conocimiento más importante usado en investigaciones y desarrollo en las áreas del procesamiento del lenguaje natural y la lingüística computacional, por ejemplo, en tareas como: extracción de información, resumen automático, búsquedas de respuestas, entre otras. Aunque WordNet puede ser utilizada por humanos como un diccionario, ya que contiene información sobre nombres, verbos, adjetivos, adverbios, etc., su principal cualidad es que es asequible por sistemas automáticos. WordNet se refiere usualmente a la red semántica que fue desarrollada para el idioma inglés desde la década de los 80 en la Universidad de Princeton, la cual actualmente está en su versión 3.01. Una idea del impacto de WordNet en la comunidad de la lingüística computacional es que 1,353 artículos de los casi 38,000 que existen en la antología de la Association for Computational Linguistics (aclweb.org/anthology/) la mencionan en el título o en el abstract. Dada su importancia, investigadores de todo el mundo han querido desarrollar versiones equivalentes en otras lenguas . La iniciativa Global WordNet (globalwordnet.org) pretende unificar las WordNet desarrolladas para otras lenguas en un espacio semántico multilingüe común.
Tres iniciativas de desarrollo de WordNets han incluido la lengua española: EuroWordnet (1998), Multilingual Central Repository (España 2004) y MultiWordnet (Italia 2002). Estas son únicamente representativas del español de España, haciendo que el español latinoamericano no esté representado en esta iniciativa global a pesar de contar con la mayoría de los hablantes.
En Latinoamérica el español se caracteriza por estar en contacto con otras lenguas nativas, enriqueciéndolo con nuevas palabras y, por tanto, diferenciándolo del dialecto europeo. Esta riqueza lingüística no está representada en WordNet, excluyendo a los latinoamericanos de un paradigma global con el consecuente rezago en investigación y desarrollo. Esto afecta indirectamente a millones de hablantes del español quienes interactúan a diario con nuevas tecnologías del lenguaje y podrían encontrarse en desventaja competitiva en un mundo globalizado debido a esta situación. El Instituto Caro y Cuervo ha sido un líder a nivel latinoamericano en la creación de diccionarios y otros recursos léxicos y lingüísticos. Ha participado en la creación de obras como el Diccionario de construcción y régimen de la lengua castellana de Rufino José Cuervo, Diccionario electrónico sáliba-español, Diccionario de Señas, realizado en convenio con el Instituto Nacional para Sordos (INSOR), el Léxico de la Violencia en Colombia, el Diccionario de Colombianismos, que se realiza en convenio con la Academia Colombiana de la Lengua. Por lo tanto, es el escenario ideal para la creación de la primera WordNet en Latinoamérica.
|
Tipo de proyecto: Investigación y desarrollo
Sistema de recomendación basado en conocimiento obtenido de manera automática para ambientes de comercio electrónico
Inicio: Octubre
2011
Fin: Marzo
2015
Duración
Resumen
|
|