Modelado basado en datos para la clasificación semiautomática de correspondencia electrónica: Caso de estudio para la Administración Pública Colombiana (Registro nro. 21550)

000 -CABECERA
Campo de control de longitud fija 02943nmm a2200253 a 4500
008 - CAMPO FIJO DE DESCRIPCIÓN FIJA--INFORMACIÓN GENERAL
Campo de control de longitud fija 160202e2018 ck |||fq||d| 00| 0 spa d
082 04 - NÚMERO DE LA CLASIFICACIÓN DECIMAL DEWEY
Número de clasificación Decimal 006
Número de documento (Cutter) V297m
Número de edición DEWEY 23
100 1# - ENCABEZAMIENTO PRINCIPAL--NOMBRE PERSONAL
Nombre de persona Vargas Antolínez, Edwin Alberto.
9 (RLIN) 22570
245 13 - TÍTULO PROPIAMENTE DICHO
Título Modelado basado en datos para la clasificación semiautomática de correspondencia electrónica: Caso de estudio para la Administración Pública Colombiana
Medio físico [Recurso Electrónico] /
Mención de responsabilidad, etc. Edwin Alberto Vargas Antolínez.
260 ## - PUBLICACIÓN, DISTRIBUCIÓN, ETC (PIE DE IMPRENTA)
Lugar de publicación, distribución, etc. Bogotá (Colombia):
Nombre del editor, distribuidor, etc. Escuela Colombiana de Ingeniería Julio Garavito,
Fecha de publicación, distribución, etc. 2018
300 ## - DESCRIPCIÓN FÍSICA
Extensión 107 paginas.
Otros detalles físicos gráficos.
502 1# - NOTA DE TESIS
Nota de Disertaciones Tesis (Magíster en Gestión de Información)
520 1# - RESUMEN, ETC.
Nota de sumario, etc. El uso de correo electrónico a nivel de las organizaciones, como canal de comunicación en procesos de servicio y atención al cliente, ha crecido en los últimos tiempos. Por tanto, las organizaciones han debido implementar procesos focalizados en organizar dichos correos de acuerdo con la temática esencial transmitida en ellos, para así dar una respuesta eficiente ante las solicitudes de los clientes. Una manera de abordar el problema es a través de la categorización de la correspondencia electrónica mediante la extracción del contenido textual en corpus de palabras determinantes (Minería de Texto) que se usan para una posterior clasificación de los correos con técnicas de aprendizaje automático de máquinas (Machine Learning). Este proyecto presenta un enfoque metodológico que evalúa diversos algoritmos de clasificación con técnicas de muestreo aleatorio simple sobre una población de documentos (correos) del registro de correspondencia del Departamento Administrativo de la Función Pública en Colombia, como caso de estudio. La investigación se detalla en un sistema paso a paso, desde el preprocesamiento de la información, reducción de la dimensionalidad, selección de diversas muestras hasta la aplicación de algoritmos de clasificación. El modelado incluye un benchmarking entre diversos algoritmos: clasificadores de tipo Naive Bayesianos, máquinas de soporte vectorial (SVM) y Boosting. Se propone, además, una arquitectura funcional semiautomática que puede escalarse en futuro en un sistema productivo de gran manejo de datos en tiempo real (streaming) basada en R, Spark y MapReduce. El modelo se pone a prueba logrando valores de “accuracy” superiores al 90% que soportan una buena Línea Base para soluciones en producción para el enfoque empleado en esta investigación.
650 #0 - ASIENTO SECUNDARIO DE MATERIA--TÉRMINO DE MATERIA
Nombre de materia o nombre geográfico como elemento de entrada MINERÍA DE DATOS
9 (RLIN) 290
650 #0 - ASIENTO SECUNDARIO DE MATERIA--TÉRMINO DE MATERIA
Nombre de materia o nombre geográfico como elemento de entrada ALGORITMOS DE CLASIFICACIÓN
9 (RLIN) 41472
650 #0 - ASIENTO SECUNDARIO DE MATERIA--TÉRMINO DE MATERIA
Nombre de materia o nombre geográfico como elemento de entrada APRENDIZAJE DE MÁQUINA.
9 (RLIN) 2568
650 #0 - ASIENTO SECUNDARIO DE MATERIA--TÉRMINO DE MATERIA
Nombre de materia o nombre geográfico como elemento de entrada CLASIFICACIÓN DE CORRESPONDENCIA
9 (RLIN) 14302
650 #0 - ASIENTO SECUNDARIO DE MATERIA--TÉRMINO DE MATERIA
Nombre de materia o nombre geográfico como elemento de entrada TESIS Y DISERTACIONES ACADÉMICAS
9 (RLIN) 931
700 ## - ENCABEZAMIENTO SECUNDARIO--NOMBRE PERSONAL
Nombre de persona Ospina, Victoria Eugenia
Término relacionador director.
9 (RLIN) 40853
700 ## - ENCABEZAMIENTO SECUNDARIO--NOMBRE PERSONAL
Nombre de persona Conti, Dante
Término relacionador director.
9 (RLIN) 41473
856 ## - ACCESO ELECTRÓNICO
Identificador uniforme del recurso URI https://repositorio.escuelaing.edu.co/handle/001/829
942 ## - ELEMENTOS KOHA
Fuente de clasificación o esquema de ordenación en estanterías
Koha tipo de item TRABAJOS DE GRADO
Existencias
Disponibilidad Mostrar en OPAC Fuente de clasificación o esquema Tipo de Descarte Estado Localización permanente Localización actual Colección Fecha adquisición Proveedor Forma de Adq Precio normal de compra Datos del ítem (Volumen, Tomo) Préstamos totales Signatura completa Código de barras Fecha última consulta Número de ejemplar Propiedades de Préstamo KOHA Formato de Material Programa Académico
        Préstamo Normal Biblioteca Jorge Álvarez Lleras Biblioteca Jorge Álvarez Lleras Fondo general 2018-08-29 Maestría en Gestión de Información Donación 0.00 Ej.1   006 V297m Ts D001307 2018-08-29 1 TRABAJOS DE GRADO Digital Maestría en Gestión de la Información