Modelado basado en datos para la clasificación semiautomática de correspondencia electrónica: Caso de estudio para la Administración Pública Colombiana (Registro nro. 21550)
[ vista simple ]
000 -CABECERA | |
---|---|
Campo de control de longitud fija | 02943nmm a2200253 a 4500 |
008 - CAMPO FIJO DE DESCRIPCIÓN FIJA--INFORMACIÓN GENERAL | |
Campo de control de longitud fija | 160202e2018 ck |||fq||d| 00| 0 spa d |
082 04 - NÚMERO DE LA CLASIFICACIÓN DECIMAL DEWEY | |
Número de clasificación Decimal | 006 |
Número de documento (Cutter) | V297m |
Número de edición DEWEY | 23 |
100 1# - ENCABEZAMIENTO PRINCIPAL--NOMBRE PERSONAL | |
Nombre de persona | Vargas Antolínez, Edwin Alberto. |
9 (RLIN) | 22570 |
245 13 - TÍTULO PROPIAMENTE DICHO | |
Título | Modelado basado en datos para la clasificación semiautomática de correspondencia electrónica: Caso de estudio para la Administración Pública Colombiana |
Medio físico | [Recurso Electrónico] / |
Mención de responsabilidad, etc. | Edwin Alberto Vargas Antolínez. |
260 ## - PUBLICACIÓN, DISTRIBUCIÓN, ETC (PIE DE IMPRENTA) | |
Lugar de publicación, distribución, etc. | Bogotá (Colombia): |
Nombre del editor, distribuidor, etc. | Escuela Colombiana de Ingeniería Julio Garavito, |
Fecha de publicación, distribución, etc. | 2018 |
300 ## - DESCRIPCIÓN FÍSICA | |
Extensión | 107 paginas. |
Otros detalles físicos | gráficos. |
502 1# - NOTA DE TESIS | |
Nota de Disertaciones | Tesis (Magíster en Gestión de Información) |
520 1# - RESUMEN, ETC. | |
Nota de sumario, etc. | El uso de correo electrónico a nivel de las organizaciones, como canal de comunicación en procesos de servicio y atención al cliente, ha crecido en los últimos tiempos. Por tanto, las organizaciones han debido implementar procesos focalizados en organizar dichos correos de acuerdo con la temática esencial transmitida en ellos, para así dar una respuesta eficiente ante las solicitudes de los clientes. Una manera de abordar el problema es a través de la categorización de la correspondencia electrónica mediante la extracción del contenido textual en corpus de palabras determinantes (Minería de Texto) que se usan para una posterior clasificación de los correos con técnicas de aprendizaje automático de máquinas (Machine Learning). Este proyecto presenta un enfoque metodológico que evalúa diversos algoritmos de clasificación con técnicas de muestreo aleatorio simple sobre una población de documentos (correos) del registro de correspondencia del Departamento Administrativo de la Función Pública en Colombia, como caso de estudio. La investigación se detalla en un sistema paso a paso, desde el preprocesamiento de la información, reducción de la dimensionalidad, selección de diversas muestras hasta la aplicación de algoritmos de clasificación. El modelado incluye un benchmarking entre diversos algoritmos: clasificadores de tipo Naive Bayesianos, máquinas de soporte vectorial (SVM) y Boosting. Se propone, además, una arquitectura funcional semiautomática que puede escalarse en futuro en un sistema productivo de gran manejo de datos en tiempo real (streaming) basada en R, Spark y MapReduce. El modelo se pone a prueba logrando valores de “accuracy” superiores al 90% que soportan una buena Línea Base para soluciones en producción para el enfoque empleado en esta investigación. |
650 #0 - ASIENTO SECUNDARIO DE MATERIA--TÉRMINO DE MATERIA | |
Nombre de materia o nombre geográfico como elemento de entrada | MINERÍA DE DATOS |
9 (RLIN) | 290 |
650 #0 - ASIENTO SECUNDARIO DE MATERIA--TÉRMINO DE MATERIA | |
Nombre de materia o nombre geográfico como elemento de entrada | ALGORITMOS DE CLASIFICACIÓN |
9 (RLIN) | 41472 |
650 #0 - ASIENTO SECUNDARIO DE MATERIA--TÉRMINO DE MATERIA | |
Nombre de materia o nombre geográfico como elemento de entrada | APRENDIZAJE DE MÁQUINA. |
9 (RLIN) | 2568 |
650 #0 - ASIENTO SECUNDARIO DE MATERIA--TÉRMINO DE MATERIA | |
Nombre de materia o nombre geográfico como elemento de entrada | CLASIFICACIÓN DE CORRESPONDENCIA |
9 (RLIN) | 14302 |
650 #0 - ASIENTO SECUNDARIO DE MATERIA--TÉRMINO DE MATERIA | |
Nombre de materia o nombre geográfico como elemento de entrada | TESIS Y DISERTACIONES ACADÉMICAS |
9 (RLIN) | 931 |
700 ## - ENCABEZAMIENTO SECUNDARIO--NOMBRE PERSONAL | |
Nombre de persona | Ospina, Victoria Eugenia |
Término relacionador | director. |
9 (RLIN) | 40853 |
700 ## - ENCABEZAMIENTO SECUNDARIO--NOMBRE PERSONAL | |
Nombre de persona | Conti, Dante |
Término relacionador | director. |
9 (RLIN) | 41473 |
856 ## - ACCESO ELECTRÓNICO | |
Identificador uniforme del recurso URI | https://repositorio.escuelaing.edu.co/handle/001/829 |
942 ## - ELEMENTOS KOHA | |
Fuente de clasificación o esquema de ordenación en estanterías | |
Koha tipo de item | TRABAJOS DE GRADO |
Disponibilidad | Mostrar en OPAC | Fuente de clasificación o esquema | Tipo de Descarte | Estado | Localización permanente | Localización actual | Colección | Fecha adquisición | Proveedor | Forma de Adq | Precio normal de compra | Datos del ítem (Volumen, Tomo) | Préstamos totales | Signatura completa | Código de barras | Fecha última consulta | Número de ejemplar | Propiedades de Préstamo KOHA | Formato de Material | Programa Académico |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Préstamo Normal | Biblioteca Jorge Álvarez Lleras | Biblioteca Jorge Álvarez Lleras | Fondo general | 2018-08-29 | Maestría en Gestión de Información | Donación | 0.00 | Ej.1 | 006 V297m Ts | D001307 | 2018-08-29 | 1 | TRABAJOS DE GRADO | Digital | Maestría en Gestión de la Información |