Secure distributed workflows for biomedical data analysis / (Registro nro. 23557)
[ vista simple ]
000 -CABECERA | |
---|---|
Campo de control de longitud fija | 05760nmm a2200217 a 4500 |
008 - CAMPO FIJO DE DESCRIPCIÓN FIJA--INFORMACIÓN GENERAL | |
Campo de control de longitud fija | 151109e2023 sp ||||fq||d| 00| 0 spa d |
082 40 - NÚMERO DE LA CLASIFICACIÓN DECIMAL DEWEY | |
Número de clasificación Decimal | 610.28 |
Número de documento (Cutter) | G245s |
Número de edición DEWEY | 23 |
100 1# - ENCABEZAMIENTO PRINCIPAL--NOMBRE PERSONAL | |
Nombre de persona | Garzón Alfonso, Wilmer. |
9 (RLIN) | 8713 |
245 00 - TÍTULO PROPIAMENTE DICHO | |
Título | Secure distributed workflows for biomedical data analysis / |
Mención de responsabilidad, etc. | Wilmer Garzón Alfonso. |
260 3# - PUBLICACIÓN, DISTRIBUCIÓN, ETC (PIE DE IMPRENTA) | |
Lugar de publicación, distribución, etc. | Bogotá : |
Nombre del editor, distribuidor, etc. | Escuela Colombiana de Ingeniería Julio Garavito, |
Fecha de publicación, distribución, etc. | 2023. |
300 ## - DESCRIPCIÓN FÍSICA | |
Extensión | 239 paginas. |
Otros detalles físicos | ilustraciones. ; |
502 ## - NOTA DE TESIS | |
Nota de Disertaciones | ( Doctorado en Ingeniería) |
520 ## - RESUMEN, ETC. | |
Nota de sumario, etc. | En los últimos años, la cantidad de datos biomédicos recopilados y almacenados ha crecido significativamente. El análisis de estas grandes cantidades de datos ya no puede ser realizado por individuos u organizaciones individuales. Por lo tanto, la comunidad científica está creando esfuerzos de colaboración global para analizar estos datos. Sin embargo, los datos biomédicos están sujetos a varias restricciones legales y socioeconómicas que dificultan las posibilidades de colaboración en investigación. En esta tesis, primero investigamos y mostramos que los investigadores requieren nuevas herramientas y técnicas para abordar las restricciones y necesidades de las colaboraciones científicas globales sobre datos biomédicos geo distribuidos. En particular, identificamos tres tipos de restricciones relacionadas con las colaboraciones globales, a saber, restricciones técnicas, legales y socioeconómicas. También investigamos el estado del arte de las herramientas actuales para análisis biomédicos globales distribuidos, incluidas herramientas que utilizan técnicas de aprendizaje automático, y mostramos sus limitaciones. A partir de estos hallazgos, proponemos colaboraciones totalmente distribuidas FDC (definido en inglés como Fully Distributed Collaborations), como esfuerzos de investigación que aprovechan los medios para explotar y analizar información biomédica de forma masiva y colaborativa respetando las restricciones legales y socioeconómicas. Nosotros investigamos el concepto, las propiedades y las características de los sistemas FDC, así como los requisitos de arquitectura y las necesidades de seguridad y privacidad. Como primer ejemplo del diseño de herramientas basadas en FDC, proponemos una estrategia de aprendizaje automático completamente distribuida. La estrategia considera un algoritmo de entrenamiento de bosque aleatorio donde varios sitios distribuidos geográficamente, mantienen sus propios datos privados, entrenan un modelo global en colaboración sin compartir información privada. El algoritmo propuesto, llamado MuSiForest, mejora con respecto a otros enfoques existentes de bosques multi-sitio al mejorar el tiempo de cómputo y reducir la cantidad de datos compartidos mientras tiene una precisión de entrenamiento cercana a la de las técnicas centralizadas de bosques aleatorios. Finalmente, investigamos cómo los sistemas de flujo de trabajo se han utilizado ampliamente para especificar análisis de datos biomédicos y mostramos las limitaciones actuales de esas herramientas. Mostramos cómo ofrecen medios limitados para definir, implementar y ejecutar estudios de sitios múltiples en la infraestructura distribuida actual, respetando la propiedad de los datos y las restricciones de privacidad. A continuación, proponemos FeDeRa, un lenguaje para especificar, implementar y ejecutar flujos de trabajos legales y socioeconómicas. Nosotros investigamos el concepto, las propiedades y las características de los sistemas FDC, así como los requisitos de arquitectura y las necesidades de seguridad y privacidad. Como primer ejemplo del diseño de herramientas basadas en FDC, proponemos una estrategia de aprendizaje automático completamente distribuida. La estrategia considera un algoritmo de entrenamiento de bosque aleatorio donde varios sitios distribuidos geográficamente, mantienen sus propios datos privados, entrenan un modelo global en colaboración sin compartir información privada. El algoritmo propuesto, llamado MuSiForest, mejora con respecto a otros enfoques existentes de bosques multi-sitio al mejorar el tiempo de cómputo y reducir la cantidad de datos compartidos mientras tiene una precisión de entrenamiento cercana a la de las técnicas centralizadas de bosques aleatorios. Finalmente, investigamos cómo los sistemas de flujo de trabajo se han utilizado ampliamente para especificar análisis de datos biomédicos y mostramos las limitaciones actuales de esas herramientas. Mostramos cómo ofrecen medios limitados para definir, implementar y ejecutar estudios de sitios múltiples en la infraestructura distribuida actual, respetando la propiedad de los datos y las restricciones de privacidad. A continuación, proponemos FeDeRa, un lenguaje para especificar, implementar y ejecutar flujos de trabajo científicos multi sitio compatibles con FDC. El lenguaje está enriquecido con abstracciones para implementar análisis en infraestructuras de nube distribuidas geográficamente y con abstracciones para definir patrones de flujo de trabajo complejos a través de límites de múltiples sitios. FeDeRa admite la programación de flujo de datos y la concurrencia declarativa de forma nativa. También presentamos la implementación de un motor de tiempo de ejecución que admite la ejecución de flujos de trabajo y experimentos de FeDeRa implementados en la infraestructura de la nube. |
650 #0 - ASIENTO SECUNDARIO DE MATERIA--TÉRMINO DE MATERIA | |
Nombre de materia o nombre geográfico como elemento de entrada | ANÁLISIS BIOMÉDICOS |
Subdivisión general | DISTRIBUIDO |
9 (RLIN) | 28817 |
650 #0 - ASIENTO SECUNDARIO DE MATERIA--TÉRMINO DE MATERIA | |
Nombre de materia o nombre geográfico como elemento de entrada | LENGUAJE DE ESPECIFICACIÓN |
Subdivisión general | FLUJO DE TRABAJO |
9 (RLIN) | 2203 |
650 #0 - ASIENTO SECUNDARIO DE MATERIA--TÉRMINO DE MATERIA | |
Nombre de materia o nombre geográfico como elemento de entrada | ANÁLISIS FLUJO DE TRABAJO |
Subdivisión general | DISTRIBUIDO |
9 (RLIN) | 1895 |
700 ## - ENCABEZAMIENTO SECUNDARIO--NOMBRE PERSONAL | |
Nombre de persona | Benavides, Luis Daniel |
Término relacionador | director. |
9 (RLIN) | 13069 |
856 ## - ACCESO ELECTRÓNICO | |
Identificador uniforme del recurso URI | http://repositorio.escuelaing.edu.co/handle/001/2608 |
942 ## - ELEMENTOS KOHA | |
Fuente de clasificación o esquema de ordenación en estanterías | |
Koha tipo de item | TRABAJOS DE GRADO |
Disponibilidad | Mostrar en OPAC | Fuente de clasificación o esquema | Tipo de Descarte | Estado | Formato de Material | Localización permanente | Localización actual | Colección | Fecha adquisición | Proveedor | Forma de Adq | Precio normal de compra | Datos del ítem (Volumen, Tomo) | Préstamos totales | Signatura completa | Código de barras | Fecha última consulta | Número de ejemplar | Propiedades de Préstamo KOHA | Programa Académico |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Préstamo Normal | Digital | Biblioteca Jorge Álvarez Lleras | Biblioteca Jorge Álvarez Lleras | Fondo general | 2023-09-12 | Doctorado en Ingeniería | Donación | 0.00 | Ej.1 | 610.28 G245s | D002425 | 2023-09-12 | 1 | TRABAJOS DE GRADO | Doctorado en Ingeniería |