Biblioteca Jorge Álvarez Lleras Koha › Detalles de: Modelado basado en datos para la clasificación semiautomática de correspondencia electrónica: Caso de estudio para la Administración Pública Colombiana

Vista normal Vista MARC Vista ISBD

Modelado basado en datos para la clasificación semiautomática de correspondencia electrónica: Caso de estudio para la Administración Pública Colombiana [Recurso Electrónico] / Edwin Alberto Vargas Antolínez.

Por: Vargas Antolínez, Edwin Alberto

Colaborador(es): Ospina, Victoria Eugenia [director.]

| Conti, Dante [director.]

Tipo de material:

Archivo de ordenadorEditor: Bogotá (Colombia): Escuela Colombiana de Ingeniería Julio Garavito, 2018Descripción: 107 paginas. gráficosTema(s): MINERÍA DE DATOS

| ALGORITMOS DE CLASIFICACIÓN

| APRENDIZAJE DE MÁQUINA

| CLASIFICACIÓN DE CORRESPONDENCIA

| TESIS Y DISERTACIONES ACADÉMICAS

Clasificación CDD: 006 Recursos en línea: Haga clic para acceso en línea Nota de disertación: Tesis (Magíster en Gestión de Información) Revisión: El uso de correo electrónico a nivel de las organizaciones, como canal de comunicación en procesos de servicio y atención al cliente, ha crecido en los últimos tiempos. Por tanto, las organizaciones han debido implementar procesos focalizados en organizar dichos correos de acuerdo con la temática esencial transmitida en ellos, para así dar una respuesta eficiente ante las solicitudes de los clientes. Una manera de abordar el problema es a través de la categorización de la correspondencia electrónica mediante la extracción del contenido textual en corpus de palabras determinantes (Minería de Texto) que se usan para una posterior clasificación de los correos con técnicas de aprendizaje automático de máquinas (Machine Learning). Este proyecto presenta un enfoque metodológico que evalúa diversos algoritmos de clasificación con técnicas de muestreo aleatorio simple sobre una población de documentos (correos) del registro de correspondencia del Departamento Administrativo de la Función Pública en Colombia, como caso de estudio. La investigación se detalla en un sistema paso a paso, desde el preprocesamiento de la información, reducción de la dimensionalidad, selección de diversas muestras hasta la aplicación de algoritmos de clasificación. El modelado incluye un benchmarking entre diversos algoritmos: clasificadores de tipo Naive Bayesianos, máquinas de soporte vectorial (SVM) y Boosting. Se propone, además, una arquitectura funcional semiautomática que puede escalarse en futuro en un sistema productivo de gran manejo de datos en tiempo real (streaming) basada en R, Spark y MapReduce. El modelo se pone a prueba logrando valores de “accuracy” superiores al 90% que soportan una buena Línea Base para soluciones en producción para el enfoque empleado en esta investigación.

Etiquetas de esta biblioteca: No hay etiquetas de esta biblioteca para este título. Ingresar para agregar etiquetas.

Existencias ( 1 )
Notas de título
Comentarios ( 0 )
Imágenes

Tipo de ítem	Ubicación actual	Signatura	Info Vol	Copia número	Estado	Fecha de vencimiento	Código de barras	Reserva de ítems
TRABAJOS DE GRADO	Biblioteca Jorge Álvarez Lleras Fondo general	006 V297m Ts (Navegar estantería)	Ej.1	1	Disponible		D001307

Total de reservas: 0

Tesis (Magíster en Gestión de Información)

El uso de correo electrónico a nivel de las organizaciones, como canal de comunicación en procesos de servicio y atención al cliente, ha crecido en los últimos tiempos. Por tanto, las organizaciones han debido implementar procesos focalizados en organizar dichos correos de acuerdo con la temática esencial transmitida en ellos, para así dar una respuesta eficiente ante las solicitudes de los clientes. Una manera de abordar el problema es a través de la categorización de la correspondencia electrónica mediante la extracción del contenido textual en corpus de palabras determinantes (Minería de Texto) que se usan para una posterior clasificación de los correos con técnicas de aprendizaje automático de máquinas (Machine Learning). Este proyecto presenta un enfoque metodológico que evalúa diversos algoritmos de clasificación con técnicas de muestreo aleatorio simple sobre una población de documentos (correos) del registro de correspondencia del Departamento Administrativo de la Función Pública en Colombia, como caso de estudio. La investigación se detalla en un sistema paso a paso, desde el preprocesamiento de la información, reducción de la dimensionalidad, selección de diversas muestras hasta la aplicación de algoritmos de clasificación. El modelado incluye un benchmarking entre diversos algoritmos: clasificadores de tipo Naive Bayesianos, máquinas de soporte vectorial (SVM) y Boosting. Se propone, además, una arquitectura funcional semiautomática que puede escalarse en futuro en un sistema productivo de gran manejo de datos en tiempo real (streaming) basada en R, Spark y MapReduce. El modelo se pone a prueba logrando valores de “accuracy” superiores al 90% que soportan una buena Línea Base para soluciones en producción para el enfoque empleado en esta investigación.

No hay comentarios en este titulo.

para colocar un comentario.

Haga clic en una imagen para verla en el visor de imágenes

Biblioteca Jorge Álvarez Lleras

Modelado basado en datos para la clasificación semiautomática de correspondencia electrónica: Caso de estudio para la Administración Pública Colombiana [Recurso Electrónico] / Edwin Alberto Vargas Antolínez.

SERVICIOS

Recursos
electrónicos

Metabuscador

Herramientas
de análisis
e impacto

Gestores
bibliográficos

Repositorio

Oferta académica

Nuestro Campus

Internacionalización

Ayuda

Biblioteca Jorge Álvarez Lleras

Modelado basado en datos para la clasificación semiautomática de correspondencia electrónica: Caso de estudio para la Administración Pública Colombiana [Recurso Electrónico] / Edwin Alberto Vargas Antolínez.

SERVICIOS

Recursoselectrónicos

Metabuscador

Herramientasde análisise impacto

Gestoresbibliográficos

Repositorio

Oferta académica

Nuestro Campus

Internacionalización

Ayuda

Recursos
electrónicos

Herramientas
de análisis
e impacto

Gestores
bibliográficos