Galaxy
Información general
Tipo de programa software libre y de código abierto
Lanzamiento inicial 2004
Licencia Academic Free License
Información técnica
Programado en
Versiones
Última versión estable 26.0.15 de junio de 2026
Archivos legibles
Formato BED
Enlaces

Galaxy [1]​es un sistema trabajo científico de código abierto, fue diseñado para hacer que la investigación sea accesible, reproducible y transparente. El proyecto, conocido como Galaxy Proyect,[2]​ proporciona una infraestructura que permite a los investigadores ejecutar, compartir y reproducir análisis complejos sin necesidad de conocimientos avanzados de programación.

Historia y desarrollo

editar

Galaxy fue desarrollado originalmente para la biología computacional, especialmente para facilitar el análisis de datos genómicos. Con el tiempo, evolucionó hacia un marco independiente del dominio, capaz de adaptarse a diversas disciplinas científicas. Su desarrollo ha sido impulsado por una comunidad internacional de investigadores y desarrolladores, así como por instituciones académicas y centros de investigación.

Características

editar

Galaxy ofrece una combinación de herramientas que facilitan el análisis científico:

  • Interfaz gráfica de usuario (GUI): permite a los usuarios diseñar y ejecutar flujos de trabajo sin necesidad de código.
  • Flujos de trabajo reproducibles: los análisis pueden guardarse, compartirse y reutilizarse, garantizando la reproducibilidad científica.
  • Integración con líneas de comandos: usuarios avanzados pueden interactuar con Galaxy mediante scripts y automatización.
  • Ejecución en la nube: soporte para infraestructura distribuida que permite escalar análisis de grandes volúmenes de datos.
  • Gestión de datos: Incluye herramientas para almacenamiento, organización, publicación y compartición de resultados.

Áreas de aplicación

editar

Aunque inicialmente enfocado en bioinformática, Galaxy se utiliza actualmente en múltiples disciplinas. Algunos ejemplos incluyen: ciencia de datos, [3]microbiología, investigación médica, [4]neurociencia, [5]virología [6]​ y detección de brotes, [7]seguridad alimentaria, [8]​ seguimiento de aguas residuales y resistencia a los antibióticos, [9]​ secuenciación genómica de lecturas largas [10]​ y de alto rendimiento,[11]bioinformática, [12]​ y otras disciplinas científicas.

Ecosistema Integral de Galaxy

editar

Esta representación visual desglosa Galaxy en sus pilares fundamentales, desde sus características sobre software libre y transparencia, hasta sus componentes técnicos y áreas de aplicación. El diagrama permite comprender visualmente cómo se interconectan la gestión de datos, las herramientas de análisis y la amplia red de recursos comunitarios como la Galaxy Training Network

Diagrama galaxy
Diagrama galaxy

Comunidad

editar

Galaxy está diseñado para ser accesible tanto a principiantes como a expertos. La plataforma fomenta la colaboración mediante la compartición de datos y flujos de trabajo.[13]

Los servicios públicos conocidos como UseGalaxy (disponible en Estados Unidos, la Unión Europea y Australia) ofrecen acceso gratuito a la plataforma: A través de estas instancias, Galaxy da soporte a una comunidad global de más de 500,000 usuarios registrados.

Comunidad y ecosistema Galaxy
Comunidad y ecosistema Galaxy

El ecosistema comunitario incluye:

  • Galaxy Hub: portal central de información y recursos.
  • Galaxy Training Network: colección de tutoriales en línea gratuitos.
  • Eventos y conferencias: incluyendo una conferencia anual internacional.

Importancia

editar

Galaxy ha contribuido significativamente a la democratización del análisis de datos científicos, reduciendo las barreras técnicas y promoviendo prácticas de ciencia abierta. Su enfoque en la reproducibilidad y la transparencia lo ha convertido en una herramienta clave en investigaciones modernas basadas en datos.

Uso de Galaxy

editar

Áreas de uso

editar

Galaxy fue diseñado originalmente para poder realizar el análisis de datos biológicos, particularmente genómicos . Las herramientas de la plataforma se utilizan para poder analizar la expresión génica, realizar el ensamblaje del genoma, la epigenómica, la transcriptómica y muchas otras disciplinas en las áreas de estudio biológicas. El amplio conjunto de herramientas que están disponibles se han ido expandido en gran manera a lo largo de los años porque la plataforma es independiente de dominio y puede aplicarse a cualquier dominio científico como un sistema general de gestión de flujos de trabajo bioinformáticos . [14]

Por ejemplo, existen servidores y herramientas de Galaxy para análisis de imágenes, [15]aprendizaje automático e IA, [16]química computacional [17]​ y diseño de fármacos, [18]​ vuelos espaciales [19]​ y astronomía, quimioinformática, [20]proteómica, ciencias sociales, [21]​ y lingüística.

Usos y áreas de uso de Galaxy
Usos y áreas de uso de Galaxy

Casos de uso

editar

Aquí presentamos una selección de algunos casos de uso que se le da a la plataforma de manera reciente:

En 2021, miembros del equipo Galaxy realizaron una publicación de un artículo en Nature Biotechnology [22]​ en el cual se detalla un método para poder rastrear variantes de COVID-19 utilizando la función de trabajos programados de Galaxy llamada Planemo, que es capaz de procesar y monitorear cientos de miles de muestras.

Así mismo, en el año 2021, Galaxy se asoció con el Vertebrate Genomes Project (VGP), que "tiene como objetivo generar ensamblajes de genomas de referencia casi libres de errores" [23]​ para aproximadamente 70 000 especies de vertebrados.

En 2022, Goecks Lab presentó MCMICRO, una plataforma modular y escalable que es capaz de procesar imágenes multiplexadas, estas son fundamentales para el análisis de tejidos complejos en la investigación del cáncer y para mejorar la oncología de precisión. [24]

Objetivos del proyecto

editar

Galaxy es una plataforma web de código abierto para realizar investigación genómica. Su propósito principal es democratizar el acceso al análisis de datos masivos de manera accesible, reproducible y transparente.[24]

Accesibilidad

editar

La biología computacional al ser un dominio especializado a menudo requiere conocimientos de programación informática.[25]​Galaxy brinda a los investigadores biomédicos acceso a la biología computacional sin requerir experiencia en programación. [26]​ Para lograr esto, Galaxy prioriza una interfaz fácil de usar [27]​por encima de la flexibilidad para construir análisis típicos, pero hace más difícil para construir flujos de trabajo complejos que incluyan, por ejemplo, estructuras de bucles. [28]

Reproducibilidad

editar

La reproducibilidad es fundamental para la ciencia: cuando se publican resultados científicos, estos deben incluir información suficiente para que otros puedan replicar el experimento y obtener los mismos resultados. [29]

En los últimos años, se han realizado esfuerzos significativos para extender este estándar más allá de los experimentos de laboratorio tradicionales hacia la investigación computacional. Sin embargo, lograr la reproducibilidad en experimentos computacionales ha resultado ser más desafiante de lo previsto inicialmente. [30]

Galaxy apoya la reproducibilidad capturando sistemáticamente todos los detalles esenciales de un análisis computacional, asegurando que pueda ser replicado con precisión en cualquier momento en el futuro. Esto incluye el registro de todos los conjuntos de datos de entrada, intermedios y finales, así como los parámetros utilizados y la secuencia exacta de los pasos analíticos. [30]

Transparencia

editar

La transparencia es esencial en la ciencia, ya que permite la verificación, fomenta la colaboración y acelera los descubrimientos al permitir que otros construyan sobre el trabajo existente. Galaxy promueve la transparencia en la investigación científica al permitir que los investigadores compartan sus Objetos Galaxy, ya sea de forma pública o con individuos específicos. Los elementos compartidos pueden ser examinados a fondo, ejecutados de nuevo según sea necesario, y copiados o modificados para explorar nuevas hipótesis. [1]

Características en Galaxy

editar

Herramientas

editar

Galaxy es una plataforma extensible, ya que permite la integración de nuevas herramientas de líneas de comandos y su intercambio a través del Galaxy ToolShed.[31]​Un ejemplo de esta capacidad de extensión es Galaxy-P, desarrollado por el University of Minnesota Supercomputing Institute, el cual ha sido personalizado como una plataforma de análisis de datos para proteómica basada en espectrometría de masas.[32]

Galaxy ofrece una interfaz web para diversas herramientas de manipulación de texto, lo que permite a los investigadores realizar sus propios procesos de reformateo y edición personalizada sin necesidad de poseer conocimientos en programación o shell scripting. Asimismo, Galaxy incluye herramientas de manipulación de intervalos para ejecutar operaciones de teoría de conjuntos (p. ej., intersección, unión, etc.) sobre dichos intervalos. Dado que muchos formatos de archivos biológicos contienen datos de intervalos genómicos (un marco de referencia, como el nombre del cromosoma o contig, y las posiciones inicial y final), Galaxy facilita la integración y el análisis conjunto de esta información.

Objetos de Galaxy: Datasets, Workflows, Histories y Pages

editar

Los objetos de Galaxy comprenden cualquier elemento que pueda ser guardado, preservado de forma persistente y compartido dentro de la plataforma:

  • Datasets (Conjuntos de datos): Incluyen cualquier conjunto de datos de entrada (input), intermedio o de salida (output), utilizado o generado durante un análisis. La plataforma de integración de datos de Galaxy permite la carga de archivos desde el ordenador del usuario, mediante URL y directamente desde diversos recursos externos en línea (tales como UCSC Genome Browser, BioMart e InterMine). Galaxy es compatible con una amplia gama de formatos de datos biológicos de uso común, así como con la traducción entre dichos formatos y la conversión de datos (véase la sección Herramientas).
  • Workflows (Flujos de trabajo): Los flujos de trabajo son análisis computacionales que especifican todos los pasos (y parámetros) del proceso, pero sin incluir los datos en sí. Estos flujos de trabajo se utilizan para ejecutar el mismo análisis de forma consistente sobre múltiples conjuntos de datos de entrada. Galaxy es un sistema de flujos de trabajo científicos. Estos sistemas proporcionan los medios para construir análisis computacionales de múltiples pasos, de forma análoga a una receta. Por lo general, ofrecen una interfaz gráfica de usuario[33]​ para definir sobre qué datos operar, qué pasos ejecutar y en qué orden deben realizarse.
  • Histories (Historiales): Son análisis computacionales (recetas) ejecutados con conjuntos de datos de entrada, pasos computacionales y parámetros específicos. Los historiales incluyen todos los conjuntos de datos intermedios y de salida generados durante el proceso.
  • Pages (Páginas): Permiten la creación de un artículo virtual que describe el "cómo" y el "porqué" del experimento global. Los historiales, flujos de trabajo y conjuntos de datos pueden incluir anotaciones proporcionadas por el usuario. La estrecha integración de las Pages con los Histories, Workflows y Datasets es fundamental para cumplir con este objetivo.
    Características Galaxy
    Características Galaxy

Herramientas en Galaxy

editar
Categoría Descripción Herramientas representativas Funcionalidades clave Ejemplo de uso
Genomic File Manipulation Conjunto de herramientas diseñadas para procesar, transformar y manipular archivos genómicos en distintos formatos.[29] SAMtools, BEDTools, BCFtools, HTSlib Filtrado de datos, indexación de archivos, extracción de regiones específicas, manipulación de metadatos Extraer lecturas alineadas de una región cromosómica específica para análisis posterior
FASTA/FASTQ Formatos básicos para almacenar secuencias biológicas. FASTA contiene secuencias sin información de calidad, mientras que FASTQ incluye puntajes de calidad por base.[25] SeqKit, BioPython, FASTX-Toolkit Lectura y escritura de secuencias, filtrado, recorte (trimming), conversión entre formatos Filtrar secuencias por longitud mínima antes de ensamblaje
FASTQ Quality Control Herramientas para evaluar la calidad de lecturas de secuenciación, detectando errores, sesgos y problemas técnicos en los datos.[26] FastQC, MultiQC, fastp Análisis de calidad por base, contenido GC, duplicación, detección de adaptadores Evaluar la calidad de lecturas Illumina antes de alineamiento
SAM/BAM Formatos para almacenar alineamientos de secuencias contra un genoma de referencia. SAM es texto plano, BAM es su versión binaria comprimida.[27] SAMtools, Picard, Sambamba Ordenamiento, indexación, filtrado por calidad, eliminación de duplicados Ordenar e indexar un archivo BAM para visualización en un genome browser
BED Formato ligero para representar regiones genómicas mediante coordenadas.[28] BEDTools, bedops Intersección de regiones, unión, complementos, cálculo de cobertura Encontrar regiones genómicas solapadas entre genes y picos de ChIP-seq
VCF/BCF Formatos para almacenar variantes genéticas como SNPs e indels.[30] VCFtools, BCFtools, GATK Filtrado de variantes, anotación, comparación entre muestras Filtrar SNPs por calidad y frecuencia alélica en estudios poblacionales
Nanopore Herramientas para procesar datos de secuenciación de lectura larga generados por tecnologías de Oxford Nanopore.[34] MinKNOW, Guppy, Nanopolish Basecalling, corrección de errores, ensamblaje de lecturas largas Convertir señales eléctricas en secuencias de DNA y corregir errores
Convert Formats Herramientas que permiten transformar archivos entre distintos formatos genómicos.[35] SeqKit, SAMtools, BEDTools, Picard Conversión entre FASTQ, FASTA, SAM, BAM, VCF y BED Convertir un archivo SAM a BAM comprimido para optimizar almacenamiento
Lift-Over Herramientas para convertir coordenadas genómicas entre diferentes ensamblajes de referencia.[36] UCSC LiftOver, CrossMap Mapeo de coordenadas, conversión entre ensamblajes, validación de regiones Convertir coordenadas de hg19 a hg38 en un análisis comparativo

Dentro de la sección de herramientas de Galaxy, podemos encontrar el apartado de análisis genómicos:

Categoría Descripción Herramientas representativas
Assembly Consiste en ordenar y unir fragmentos de DNA para reconstruir el genoma original. MitoHiFi: Ensamblar mitogenomas a partir de lecturas Pacbio HiFi. [37]

NextDenovo: Ensamblador de novo basado en grafos de cadenas para lecturas largas. [38]

Annotation Proceso de identificar y marcar las partes importantes dentro de un genoma ya ensamblado, y asignarles una función biológica. Antismash: Permite la identificación, anotación y análisis a nivel genómico de los grupos de genes de biosíntesis de metabolitos secundarios.  [39]

BUSCO: Evaluar la completitud del ensamblaje y la anotación del genoma. [40]

Mapping Proceso de alinear fragmentos de ADN secuenciados (reads) contra un genoma de referencia para saber de dónde proviene cada fragmento dentro del genoma. Align sequences: Alineamiento de secuencias a una referencia utilizando un algoritmo de alineación de codones. [41]

STAR-Fusion: detectar genes de fusión en datos de RNA-Seq. [42]

ChIP-Seq Sirve para identificar en qué partes del ADN se unen proteínas específicas, como factores de transcripción o histonas modificadas. ChIPseeker: para la anotación y visualización de picos de ChIP. [43]

MutiGPS: analiza colecciones de datos ChIP-seq de múltiples condiciones. [44]

Herramientas de Dominio Específico en Galaxy:

Categoría Descripción Herramientas representativas
Proteomics Análisis de datos de espectrometría de masas para la identificación y cuantificación de proteínas y péptidos a gran escala. MaxQuant: Cuantificación y análisis de datos MS.[45]

Search GUI: Gestión de múltiples motores de búsqueda de péptidos.[46]

PeptideShaker: Interpretación y visualización de identificaciones proteicas. [46]

Metabolomics Procesamiento de perfiles metabólicos para detectar moléculas pequeñas y cambios bioquímicos en sistemas biológicos. XCMS: Pre-procesamiento y alineación de picos en LC/MS.[47]

CAMERA.annotate: Anotación de isótopos y aductos químicos.[48]

MS-DIAL: Desconvolución de espectros y cuantificación no dirigida. [49]

Genome Annotation Proceso multinivel para identificar unidades funcionales en el genoma, como genes codificantes y RNAs estructurales. Prokka: Anotación rápida de genomas procariotas. [50]

Augustus: Predicción de genes eucariotas basada en modelos ocultos de Markov. [51]

MAKER: Pepeline para la anotación automatizada y basada en evidencia. [52]

Computational Chemistry Modelado molecular, dinámica y predicción de afinidades químicas. GROMACS: Simulaciones de dinámica molecular de alto rendimiento. [53]

VINA Docking: Predicción de interacciones ligando-proteína. [54]

OpenBabel: Conversión y manipulación de formatos de datos químicos. [55]

Climate Analysis Procesamiento de grandes volúmenes de datos geofísicos y meteorológicos. CDO:(Copernicus Climate Data Store): Operadores para procesar datos en formatos NetCDF y GRIB.[56]

CTSM/FATES-EMERALD: Simulador de ecosistemas terrestres ensamblados funcionalmente

Panoply: Visualizador interactivo de datos georreferenciados. [57]

Ecology Análisis de biodiversidad y estudios de comunidades microbianas. QIIME 2: Plataforma integrada para ciencia de datos de microbioma. [58]

Mothur: Suite para el procesamiento de datos de 16S rRNA. [59]

DADA2: Inferencia de variantes de secuencia (ASVs) de alta resolución. [60]

Imaging Extracción de datos cuantitativos a partir de imágenes biológicas. CellProfiler: Análisis automatizado de fenotipos celulares en grandes lotes.[61]

Ilastik: Segmentación de imágenes mediante aprendizaje automático.[62]

Fiji (ImageJ): Herramienta versátil de procesamiento y análisis de imágenes 2D/3D.[63]

Categoría Descripción Herramientas representativas
Mothur Paquete integral para el procesamiento de secuencias, desde la limpieza (trimming) hasta la asignación de OTUs y análisis de diversidad α y β.[64] Align.seqs: Alinea las secuencias contra una base de datos de referencia (como SILVA) usando el algoritmo NAST.[65]

Classify.seqs: Asigna una identidad taxonómica (Reino → Género) utilizando el clasificador de Bayes de RDP.[66]

QIIME2 Utiliza archivos .qza que contienen el dataset y metadatos exhaustivos (procedencia, citas y entorno de ejecución).[67] Q2-demux: Realiza el demultiplexado de las lecturas basadas en códigos de barras (barcodes).[68]

Q2-phylogeny: Genera alineamientos de secuencias y construye árboles filogenéticos de novo.[69]

Picard Comandos para la manipulación de datos de secuenciación de alto rendimiento (HTS) en formatos como SAM, BAM, CRAM y VCF.[70] MarkDuplicates: Identifica y marca lecturas de PCR o duplicados ópticos para evitar sesgos en el llamado de variantes.[71]

CollectAlignmentSummaryMetrics: Genera métricas detalladas sobre la calidad del alineamiento, distribución de insertos y cobertura.[72]

DeepTools Herramientas intuitivas (user-friendly) para la normalización y visualización de datos de secuenciación masiva (deep-sequencing).[73] BamCoverage: Convierte archivos de alineamiento (BAM) en perfiles de cobertura (bigWig), permitiendo normalizaciones por RPKM, CPM o BPM.[74]

BamCompare: Permite normalizar y comparar dos muestras (p. ej., IP vs. Control) mediante el cálculo de log2 ratios o diferencias sustraídas.[74]

EMBOSS Una suite diversa de herramientas para el análisis de secuencias; muchos de sus programas son análogos a GCG y cuenta con ayuda contextual para cada herramienta.[75] Getorf: Encuentra marcos de lectura abiertos (ORFs) en secuencias de nucleótidos.[76]

Cpgplot: Identifica y grafica islas CpG en secuencias genómicas.[76]

Transeq: Traduce secuencias de ácido nucleico a proteínas.[76]

NCBI BLAST+ Es una herramienta que encuentran regiones de similitud entre secuencias biológicas, comparando secuencias de nucleótidos o proteínas contra bases de datos de secuencias y calculan su significancia estadística.[77] Blastn: Mapeo de genes, identificación de especies.[78]

Blastp: Identificación de dominios y funciones proteicas.[79]

Blastx: Encontrar genes codificantes en ADN genómico.[77]

HyPhy Paquete de software para el análisis de secuencias genéticas utilizando técnicas de filogenética, evolución molecular y aprendizaje automático (machine learning).[80] HyPhy-aBSREL: Es un método potente para detectar la selección positiva episódica. Identifica casos en los que una proporción de sitios a lo largo de ramas o linajes específicos de una filogenia han experimentado selección positiva.[81]

HyPhy-MEME: Detecta selección positiva episódica, identificando sitios específicos que han mutado para adaptarse en ramas puntuales de la filogenia, incluso si el resto del gen está conservado.[81]

RSeQC Paquete especializado en el Control de Calidad de RNA-seq. Evalúa sesgos de cobertura, integridad del transcrito, especificidad de la cadena y saturación de la secuenciación.[82] GeneBody_coverage: Evalúa la cobertura de lecturas a lo largo de los cuerpos de los genes.[82]

Tin.py: Calcula el Número de Integridad del Transcrito (TIN).[83]

MiModD Herramienta integral para el mapeo, identificación y anotación de mutaciones fenotípicas en organismos modelo a partir de datos de secuenciación de genoma completo (WGS).[84] MiModD NacreousMap: Mapea variantes seleccionadas fenotípicamente mediante el análisis de ligamiento multivariante.[85]

MiModD Read Alignment: Mapea las lecturas de secuenciación a un genoma de referencia utilizando SNAP.[85]

HCA-Scanpy Conjunto de herramientas escalable para el análisis de datos de expresión génica de célula única.[86] Scanpy BBKNN: Herramienta de eliminación de efectos de lote (batch effects) para datos de RNA-Seq de célula única que puede utilizarse directamente en el flujo de trabajo de Scanpy.[87]

Scanpy ComBat: Herramienta que ajusta la expresión para variables que podrían introducir efectos de lote.[86]

HiCExplorer Servidor web para el análisis, control de calidad y visualización reproducible de datos de Hi-C, capture Hi-C y Hi-C de célula única (scHi-C).[88]

Disponibilidad de Galaxy

editar

Galaxy se encuentra disponible a través de diversas modalidades donde resaltan las siguientes:

  • Servidor web público y gratuito: Respaldado por el Galaxy Project, este servidor web integra una amplia variedad de herramientas bioinformáticas que son esenciales para la investigación genómica.[89]​ Los usuarios tienen la posibilidad de crear cuentas personalizadas que les permiten almacenar historiales, flujos de trabajo y conjuntos de datos, los cuales también pueden compartirse con otros colaboradores.[89]
  • Software de código abierto: Galaxy también puede descargarse, instalarse y personalizarse según necesidades específicas.[90]​ Permite una implementación flexible, tanto de manera local como mediante el uso de infraestructuras presentes en la nube.[91]
  • Servidores públicos de terceros: Diversas organizaciones con infraestructura propia de Galaxy han habilitado sus servidores para el uso de la comunidad externa.[92]
Disponibilidad de Galaxy
Disponibilidad de Galaxy

Implementación de Galaxy

editar

Galaxy es un software de código abierto desarrollado principalmente en el lenguaje de programación Python.[90]​ Su evolución ha sido liderada por el equipo del Galaxy Project en colaboración con diversas instituciones de prestigio, entre las cuales destacan:

Además de estas instituciones, el proyecto Galaxy se enriquece de manera continua mediante las contribuciones de una comunidad global de desarrolladores.[90]

Ecosistema de Galaxy

editar

La comunidad de Galaxy constituye una red global e interdisciplinaria de investigadores, educadores y desarrolladores comprometidos con una bioinformática de manera accesible, reproducible y colaborativa.[89]​ Con integrantes provenientes de la academia, el gobierno y la industria, esta red mantiene servidores públicos, desarrolla nuevas herramientas y promueve la ciencia abierta mediante listas de correo, un centro comunitario [89]​ y la realización de conferencias anuales.[95]

Galaxy Training Network (GTN)

editar

La Galaxy Training Network (GTN) es una parte fundamental de Galaxy, ya que proporciona materiales de formación que son de acceso abierto enfocados en flujos de trabajo bioinformáticos y biología computacional.[96]​ Entre los recursos que ofrece se incluyen:

  • Tutoriales prácticos: Cubren desde el análisis de datos de secuenciación hasta aplicaciones de aprendizaje automático en genómica.[96]
  • Recursos interactivos: Incluyen instrucciones paso a paso y lecciones basadas en entornos tipo Jupyter, adecuados tanto para el autoaprendizaje como para cursos estructurados.[96]

A través de iniciativas como la Galaxy Community Conference (GCC), la Academia de Entrenamiento, el desarrollo de hackatones y proyectos colaborativos, la comunidad de Galaxy busca garantizar que herramientas bioinformáticas de vanguardia puedan estar disponibles para investigadores de todos los niveles de experiencia técnica.[97]

Galaxy GTN
Galaxy GTN

Ejemplos de flujo de trabajo para análisis bioinformáticos

editar

Se muestra un ejemplo de flujo de trabajo para el análisis de datos de RNA-Seq utilizando la plataforma Galaxy, además se muestran las herramientas y los archivos de entrada y salida que se necesita para cada herramienta.

Flujo de trabajo de RNA-seq en Galaxy
Flujo de trabajo de RNA-seq en Galaxy

Referencias

editar
  1. a b The Galaxy Community (20 de mayo de 2024). «The Galaxy platform for accessible, reproducible, and collaborative data analyses: 2024 update». Nucleic Acids Research 52 (Web Server Issue): W83-W94. PMC 11223835. PMID 38769056. doi:10.1093/nar/gkae410. 
  2. «Galaxy Community Hub». galaxyproject.org (en inglés). Consultado el 28 de abril de 2026. 
  3. Pireddu, Luca; Leo, Simone; Soranzo, Nicola; Zanetti, Gianluigi (20 de septiembre de 2014). «A Hadoop-Galaxy adapter for user-friendly and scalable data-intensive bioinformatics in Galaxy». Proceedings of the 5th ACM Conference on Bioinformatics, Computational Biology, and Health Informatics. BCB '14. New York, NY, USA: Association for Computing Machinery. pp. 184-191. ISBN 978-1-4503-2894-4. doi:10.1145/2649387.2649429. 
  4. Foschini, Maria P.; Morandi, Luca; Sanchez, Alejandro M.; Santoro, Angela; Mulè, Antonino; Zannoni, Gian Franco; Varga, Zsuzsanna; Moskovszky, Linda et al. (17 de junio de 2020). «Methylation Profile of X-Chromosome–Related Genes in Male Breast Cancer». Frontiers in Oncology (en inglés) 10. ISSN 2234-943X. PMC 7313421. PMID 32626651. doi:10.3389/fonc.2020.00784. 
  5. Mitolo, Micaela; Zoli, Matteo; Testa, Claudia; Morandi, Luca; Rochat, Magali Jane; Zaccagna, Fulvio; Martinoni, Matteo; Santoro, Francesca et al. (3 de junio de 2022). «Neuroplasticity Mechanisms in Frontal Brain Gliomas: A Preliminary Study». Frontiers in Neurology (en inglés) 13. ISSN 1664-2295. PMC 9204970. PMID 35720068. doi:10.3389/fneur.2022.867048. 
  6. Lo, Chien-Chi; Shakya, Migun; Connor, Ryan; Davenport, Karen; Flynn, Mark; Gutiérrez, Adán Myers y; Hu, Bin; Li, Po-E et al. (13 de mayo de 2022). «EDGE COVID-19: a web platform to generate submission-ready genomes from SARS-CoV-2 sequencing efforts». Bioinformatics 38 (10): 2700-2704. ISSN 1367-4803. PMC 9113274. PMID 35561186. doi:10.1093/bioinformatics/btac176. 
  7. Bogaerts, Bert; Van Braekel, Julien; Van Uffelen, Alexander; D'aes, Jolien; Godfroid, Maxime; Delcourt, Thomas; Kelchtermans, Michael; Milis, Kato et al. (8 de enero de 2025). «Galaxy @Sciensano: a comprehensive bioinformatics portal for genomics-based microbial typing, characterization, and outbreak detection». BMC Genomics (en inglés) 26 (1): 20. ISSN 1471-2164. PMC 11715294. PMID 39780046. doi:10.1186/s12864-024-11182-5. 
  8. Gangiredla, Jayanthi; Rand, Hugh; Benisatto, Daniel; Payne, Justin; Strittmatter, Charles; Sanders, Jimmy; Wolfgang, William J.; Libuit, Kevin et al. (10 de febrero de 2021). «GalaxyTrakr: a distributed analysis tool for public health whole genome sequence data accessible to non-bioinformaticians». BMC Genomics 22 (1): 114. ISSN 1471-2164. PMC 7877046. PMID 33568057. doi:10.1186/s12864-021-07405-8. 
  9. Yin, Xiaole; Zheng, Xiawan; Li, Liguan; Zhang, An-Ni; Jiang, Xiao-Tao; Zhang, Tong (1 de agosto de 2023). «ARGs-OAP v3.0: Antibiotic-Resistance Gene Database Curation and Analysis Pipeline Optimization». Engineering 27: 234-241. Bibcode:2023Engin..27..234Y. ISSN 2095-8099. doi:10.1016/j.eng.2022.10.011. 
  10. de Koning, Willem; Miladi, Milad; Hiltemann, Saskia; Heikema, Astrid; Hays, John P; Flemming, Stephan; van den Beek, Marius; Mustafa, Dana A et al. (20 de octubre de 2020). «NanoGalaxy: Nanopore long-read sequencing data analysis in Galaxy». GigaScience 9 (10). ISSN 2047-217X. PMC 7568507. PMID 33068114. doi:10.1093/gigascience/giaa105. 
  11. Thiel, William H (2016). «Galaxy Workflows for Web-based Bioinformatics Analysis of Aptamer High-throughput Sequencing Data». Molecular Therapy: Nucleic Acids (en inglés) 5 (8). PMC 5023399. PMID 28131286. doi:10.1038/mtna.2016.54. 
  12. Thiel, William H.; Giangrande, Paloma H. (15 de marzo de 2016). «Analyzing HT-SELEX data with the Galaxy Project tools – A web based bioinformatics platform for biomedical research». Methods. Nucleic Acid Aptamers 97: 3-10. ISSN 1046-2023. PMC 4792767. PMID 26481156. doi:10.1016/j.ymeth.2015.10.008. 
  13. The Galaxy Community; Abueg, Linelle Ann L; Afgan, Enis; Allart, Olivier; Awan, Ahmed H; Bacon, Wendi A; Baker, Dannon; Bassetti, Madeline et al. (5 de julio de 2024). «The Galaxy platform for accessible, reproducible, and collaborative data analyses: 2024 update». Nucleic Acids Research (en inglés) 52 (W1): W83-W94. ISSN 0305-1048. PMC 11223835. PMID 38769056. doi:10.1093/nar/gkae410. Consultado el 28 de abril de 2026. 
  14. «Galaxy Community Hub - Galaxy Platform Directory». 
  15. «biotools Galaxy Image Analysis». 
  16. «Galaxy Machine Learning». ml.usegalaxy.eu. Consultado el 2 de marzo de 2025. 
  17. Hildebrandt, A. K.; Stöckel, D; Fischer, N. M.; de la Garza, L; Krüger, J; Nickels, S; Röttig, M; Schärfe, C et al. (2014). «Ballaxy: Web services for structural bioinformatics». Bioinformatics 31 (1): 121-2. PMID 25183489. doi:10.1093/bioinformatics/btu574. 
  18. «OSDDlinux». Archivado desde el original el 7 de mayo de 2016. Consultado el 17 de noviembre de 2014. 
  19. «GeneLab - Galaxy Community Hub». Galaxy Community Hub. 4 de octubre de 2021. Consultado el 2 de marzo de 2025. 
  20. Bray, Simon A.; Lucas, Xavier; Kumar, Anup; Grüning, Björn A. (1 de junio de 2020). «The ChemicalToolbox: reproducible, user-friendly cheminformatics analysis on the Galaxy platform». Journal of Cheminformatics 12 (1): 40. PMC 7268608. PMID 33431029. doi:10.1186/s13321-020-00442-7. 
  21. «Galaxy». 
  22. Maier, Wolfgang; Bray, Simon; van den Beek, Marius; Bouvier, Dave; Coraor, Nathan; Miladi, Milad; Singh, Babita; De Argila, Jordi Rambla et al. (October 2021). «Ready-to-use public infrastructure for global SARS-CoV-2 monitoring». Nature Biotechnology (en inglés) 39 (10): 1178-1179. ISSN 1546-1696. PMC 8845060. PMID 34588690. doi:10.1038/s41587-021-01069-1. 
  23. «Vertebrate Genomes Project». Vertebrate Genomes Project (en inglés estadounidense). 3 de abril de 2023. Consultado el 21 de febrero de 2025. 
  24. a b Schapiro, Denis; Sokolov, Artem; Yapp, Clarence; Chen, Yu-An; Muhlich, Jeremy L.; Hess, Joshua; Creason, Allison L.; Nirmal, Ajit J. et al. (March 2022). «MCMICRO: a scalable, modular image-processing pipeline for multiplexed tissue imaging». Nature Methods (en inglés) 19 (3): 311-315. ISSN 1548-7105. PMC 8916956. PMID 34824477. doi:10.1038/s41592-021-01308-y. 
  25. a b «The Sanger FASTQ file format for sequences with quality scores». Bioinformatics. 2010. doi:10.1093/bioinformatics/btq092. 
  26. a b FastQC: a quality control tool for high throughput sequence data. 2010. 
  27. a b «The Sequence Alignment/Map format and SAMtools». Bioinformatics. 2009. doi:10.1093/bioinformatics/btp352. 
  28. a b «BEDTools: a flexible suite of utilities for comparing genomic features». Bioinformatics. 2010. doi:10.1093/bioinformatics/btq033. 
  29. a b «BEDTools: a flexible suite of utilities for comparing genomic features». Bioinformatics. 2010. doi:10.1093/bioinformatics/btq033. 
  30. a b c «The Variant Call Format and VCFtools». Bioinformatics. 2011. doi:10.1093/bioinformatics/btr330. 
  31. Blankenberg, Daniel; Von Kuster, Gregory; Bouvier, Emil; Baker, Dannon; Afgan, Enis; Stoler, Nicholas; Galaxy Team; Taylor, James et al. (20 de febrero de 2014). «Dissemination of scientific software with Galaxy ToolShed». Genome Biology (en inglés) 15 (2). ISSN 1474-760X. PMC 4038738. PMID 25001293. doi:10.1186/gb4161. Consultado el 30 de abril de 2026. 
  32. Sheynkman, Gloria M; Johnson, James E; Jagtap, Pratik D; Shortreed, Michael R; Onsongo, Getiria; Frey, Brian L; Griffin, Timothy J; Smith, Lloyd M (2014-12). «Using Galaxy-P to leverage RNA-Seq for the discovery of novel protein variations». BMC Genomics (en inglés) 15 (1). ISSN 1471-2164. doi:10.1186/1471-2164-15-703. Consultado el 30 de abril de 2026. 
  33. Schatz, Michael C (2010). «The missing graphical user interface for genomics». Genome Biology (en inglés) 11 (8): 128. ISSN 1465-6906. doi:10.1186/gb-2010-11-8-128. Consultado el 30 de abril de 2026. 
  34. «Nanopore sequencing and assembly of a human genome with ultra-long reads». Nature Biotechnology. 2018. doi:10.1038/nbt.4060. 
  35. «The Sequence Alignment/Map format and SAMtools». Bioinformatics. 2009. doi:10.1093/bioinformatics/btp352. 
  36. «The UCSC Genome Browser database». Nucleic Acids Research. 2002. doi:10.1093/nar/30.1.38. 
  37. Uliano-Silva, Marcela; Gabriel R. N. Ferreira, João; Krasheninnikova, Ksenia; Darwin Tree of Life Consortium; Formenti, Giulio; Abueg, Linelle; Torrance, James; Myers, Eugene W. (23 de diciembre de 2022), MitoHiFi: a python pipeline for mitochondrial genome assembly from PacBio High Fidelity reads (en inglés), doi:10.1101/2022.12.23.521667, consultado el 29 de abril de 2026 .
  38. Nextomics/NextDenovo, GrandOmics, 15 de abril de 2026, consultado el 29 de abril de 2026 .
  39. Weber, Tilmann; Blin, Kai; Duddela, Srikanth; Krug, Daniel; Kim, Hyun Uk; Bruccoleri, Robert; Lee, Sang Yup; Fischbach, Michael A. et al. (1 de julio de 2015). «antiSMASH 3.0—a comprehensive resource for the genome mining of biosynthetic gene clusters». Nucleic Acids Research (en inglés) 43 (W1): W237-W243. ISSN 0305-1048. PMC 4489286. PMID 25948579. doi:10.1093/nar/gkv437. Consultado el 29 de abril de 2026. 
  40. Simão, Felipe A.; Waterhouse, Robert M.; Ioannidis, Panagiotis; Kriventseva, Evgenia V.; Zdobnov, Evgeny M. (9 de junio de 2015). «BUSCO: assessing genome assembly and annotation completeness with single-copy orthologs». Bioinformatics 31 (19): 3210-3212. ISSN 1367-4811. doi:10.1093/bioinformatics/btv351. Consultado el 29 de abril de 2026. 
  41. Pond, Sergei L. Kosakovsky; Frost, Simon D. W.; Muse, Spencer V. (27 de octubre de 2004). «HyPhy: hypothesis testing using phylogenies». Bioinformatics 21 (5): 676-679. ISSN 1367-4811. doi:10.1093/bioinformatics/bti079. Consultado el 29 de abril de 2026. 
  42. Haas, Brian J. (24 de marzo de 2017). «STAR-Fusion: Fast and Accurate Fusion Transcript Detection from RNA-Seq». doi.org. Consultado el 29 de abril de 2026. 
  43. Yu, Guangchuang; Wang, Li-Gen; He, Qing-Yu (15 de julio de 2015). «ChIPseeker: an R/Bioconductor package for ChIP peak annotation, comparison and visualization». Bioinformatics (en inglés) 31 (14): 2382-2383. ISSN 1367-4811. doi:10.1093/bioinformatics/btv145. Consultado el 29 de abril de 2026. 
  44. Mahony, Shaun; Edwards, Matthew D.; Mazzoni, Esteban O.; Sherwood, Richard I.; Kakumanu, Akshay; Morrison, Carolyn A.; Wichterle, Hynek; Gifford, David K. (2014). An Integrated Model of Multiple-Condition ChIP-Seq Data Reveals Predeterminants of Cdx2 Binding. Springer International Publishing. pp. 175-176. ISBN 978-3-319-05268-7. Consultado el 29 de abril de 2026. 
  45. Tyanova, Stefka; Temu, Tikira; Cox, Juergen (2016-12). «The MaxQuant computational platform for mass spectrometry-based shotgun proteomics». Nature Protocols (en inglés) 11 (12): 2301-2319. ISSN 1754-2189. doi:10.1038/nprot.2016.136. Consultado el 30 de abril de 2026. 
  46. a b Barsnes, Harald; Vaudel, Marc; Colaert, Niklaas; Helsens, Kenny; Sickmann, Albert; Berven, Frode S.; Martens, Lennart (8 de marzo de 2011). «compomics-utilities: an open-source Java library for computational proteomics». BMC Bioinformatics (en inglés) 12 (1): 70. ISSN 1471-2105. PMC 3060842. PMID 21385435. doi:10.1186/1471-2105-12-70. Consultado el 30 de abril de 2026. 
  47. Smith, Colin A.; Want, Elizabeth J.; O'Maille, Grace; Abagyan, Ruben; Siuzdak, Gary (1 de febrero de 2006). «XCMS: Processing Mass Spectrometry Data for Metabolite Profiling Using Nonlinear Peak Alignment, Matching, and Identification». Analytical Chemistry 78 (3): 779-787. ISSN 0003-2700. doi:10.1021/ac051437y. Consultado el 30 de abril de 2026. 
  48. pubs.acs.org. doi:10.1021/ac202450g https://pubs.acs.org/action/cookieAbsent |url= sin título (ayuda). Consultado el 30 de abril de 2026. 
  49. Tsugawa, Hiroshi; Cajka, Tomas; Kind, Tobias; Ma, Yan; Higgins, Brendan; Ikeda, Kazutaka; Kanazawa, Mitsuhiro; VanderGheynst, Jean et al. (2015-06). «MS-DIAL: data-independent MS/MS deconvolution for comprehensive metabolome analysis». Nature Methods 12 (6): 523-526. ISSN 1548-7105. PMC 4449330. PMID 25938372. doi:10.1038/nmeth.3393. Consultado el 30 de abril de 2026. 
  50. Seemann, Torsten (15 de julio de 2014). «Prokka: rapid prokaryotic genome annotation». Bioinformatics (Oxford, England) 30 (14): 2068-2069. ISSN 1367-4811. PMID 24642063. doi:10.1093/bioinformatics/btu153. Consultado el 30 de abril de 2026. 
  51. Stanke, Mario; Schöffmann, Oliver; Morgenstern, Burkhard; Waack, Stephan (9 de febrero de 2006). «Gene prediction in eukaryotes with a generalized hidden Markov model that uses hints from external sources». BMC Bioinformatics (en inglés) 7 (1): 62. ISSN 1471-2105. PMC 1409804. PMID 16469098. doi:10.1186/1471-2105-7-62. Consultado el 30 de abril de 2026. 
  52. Cantarel, Brandi L.; Korf, Ian; Robb, Sofia M. C.; Parra, Genis; Ross, Eric; Moore, Barry; Holt, Carson; Sánchez Alvarado, Alejandro et al. (2008-01). «MAKER: an easy-to-use annotation pipeline designed for emerging model organism genomes». Genome Research 18 (1): 188-196. ISSN 1088-9051. PMC 2134774. PMID 18025269. doi:10.1101/gr.6743907. Consultado el 30 de abril de 2026. 
  53. Abraham, Mark James; Murtola, Teemu; Schulz, Roland; Páll, Szilárd; Smith, Jeremy C.; Hess, Berk; Lindahl, Erik (2015-09). «GROMACS: High performance molecular simulations through multi-level parallelism from laptops to supercomputers». SoftwareX (en inglés). 1-2: 19-25. doi:10.1016/j.softx.2015.06.001. Consultado el 30 de abril de 2026. 
  54. Trott, Oleg; Olson, Arthur J. (30 de enero de 2010). «AutoDock Vina: Improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading». Journal of Computational Chemistry (en inglés) 31 (2): 455-461. ISSN 0192-8651. PMC 3041641. PMID 19499576. doi:10.1002/jcc.21334. Consultado el 30 de abril de 2026. 
  55. Shawan, Mohammad Mahfuz Ali Khan; Sharma, Ashish Ranjan; Halder, Sajal Kumar; Arian, Tawsif Al; Shuvo, Md Nazmussakib; Sarker, Satya Ranjan; Hasan, Md Ashraful (2023). «Advances in Computational and Bioinformatics Tools and Databases for Designing and Developing a Multi-Epitope-Based Peptide Vaccine». International Journal of Peptide Research and Therapeutics 29 (4): 60. ISSN 1573-3149. PMC 10203685. PMID 37251529. doi:10.1007/s10989-023-10535-0. Consultado el 30 de abril de 2026. 
  56. doi.org https://doi.org/10.1117/12.2576497.6189601246001 |url= sin título (ayuda). Consultado el 30 de abril de 2026. 
  57. «Galaxy Training!». Galaxy Training Network (en inglés). 1 de enero de 1970. Consultado el 30 de abril de 2026. 
  58. Bolyen, Evan; Rideout, Jai Ram; Dillon, Matthew R.; Bokulich, Nicholas A.; Abnet, Christian C.; Al-Ghalith, Gabriel A.; Alexander, Harriet; Alm, Eric J. et al. (2019-08). «Reproducible, interactive, scalable and extensible microbiome data science using QIIME 2». Nature Biotechnology 37 (8): 852-857. ISSN 1546-1696. PMC 7015180. PMID 31341288. doi:10.1038/s41587-019-0209-9. Consultado el 30 de abril de 2026. 
  59. Pérez Hernández, Valetín; Hernández Guzmán, Mario (22 de noviembre de 2023). «Identificación de Microorganismos en Muestras Ambientales: Análisis Bioinformático del Gen 16S RRNA Mediante QIIME2». Ciencia Latina Revista Científica Multidisciplinar 7 (5): 8074-8102. ISSN 2707-2215. doi:10.37811/cl_rcm.v7i5.8382. Consultado el 30 de abril de 2026. 
  60. Callahan, Benjamin J.; McMurdie, Paul J.; Rosen, Michael J.; Han, Andrew W.; Johnson, Amy Jo A.; Holmes, Susan P. (2016-07). «DADA2: High-resolution sample inference from Illumina amplicon data». Nature Methods 13 (7): 581-583. ISSN 1548-7105. PMC 4927377. PMID 27214047. doi:10.1038/nmeth.3869. Consultado el 30 de abril de 2026. 
  61. Brezovjakova, Helena; Tomlinson, Chris; Mohd Naim, Noor; Swiatlowska, Pamela; Erasmus, Jennifer C.; Huveneers, Stephan; Gorelik, Julia; Bruche, Susann et al. (3 de diciembre de 2019). «Junction Mapper is a novel computer vision tool to decipher cell-cell contact phenotypes». eLife 8: e45413. ISSN 2050-084X. PMC 7034980. PMID 31793877. doi:10.7554/eLife.45413. Consultado el 30 de abril de 2026. 
  62. Seo, Hyunseok; Badiei Khuzani, Masoud; Vasudevan, Varun; Huang, Charles; Ren, Hongyi; Xiao, Ruoxiu; Jia, Xiao; Xing, Lei (2020-06). «Machine learning techniques for biomedical image segmentation: An overview of technical aspects and introduction to state-of-art applications». Medical Physics 47 (5): e148-e167. ISSN 2473-4209. PMC 7338207. PMID 32418337. doi:10.1002/mp.13649. Consultado el 30 de abril de 2026. 
  63. Schindelin, Johannes; Arganda-Carreras, Ignacio; Frise, Erwin; Kaynig, Verena; Longair, Mark; Pietzsch, Tobias; Preibisch, Stephan; Rueden, Curtis et al. (2012-07). «Fiji: an open-source platform for biological-image analysis». Nature Methods (en inglés) 9 (7): 676-682. ISSN 1548-7091. PMC 3855844. PMID 22743772. doi:10.1038/nmeth.2019. Consultado el 30 de abril de 2026. 
  64. Schloss, Patrick D.; Westcott, Sarah L.; Ryabin, Thomas; Hall, Justine R.; Hartmann, Martin; Hollister, Emily B.; Lesniewski, Ryan A.; Oakley, Brian B. et al. (2009-12). «Introducing mothur: Open-Source, Platform-Independent, Community-Supported Software for Describing and Comparing Microbial Communities». Applied and Environmental Microbiology 75 (23): 7537-7541. doi:10.1128/AEM.01541-09. Consultado el 30 de abril de 2026. 
  65. «align.seqs». https://mothur.org (en inglés). Consultado el 30 de abril de 2026. 
  66. «classify.seqs». https://mothur.org (en inglés). Consultado el 30 de abril de 2026. 
  67. «{{ngMeta['og:title']}}». bio.tools (en inglés). {{ngMeta['datePublished']}}. Consultado el 30 de abril de 2026. 
  68. Bolyen, Evan (24 de octubre de 2018). «QIIME 2: Reproducible, interactive, scalable, and extensible microbiome data science». doi.org. Consultado el 30 de abril de 2026. 
  69. «Galaxy». usegalaxy.org. Consultado el 30 de abril de 2026. 
  70. «{{ngMeta['og:title']}}». bio.tools (en inglés). {{ngMeta['datePublished']}}. Consultado el 30 de abril de 2026. 
  71. «Tool documentation». broadinstitute.github.io. Consultado el 30 de abril de 2026. 
  72. «Tool documentation». broadinstitute.github.io. Consultado el 30 de abril de 2026. 
  73. Ramírez, Fidel; Dündar, Friederike; Diehl, Sarah; Grüning, Björn A.; Manke, Thomas (5 de mayo de 2014). «deepTools: a flexible platform for exploring deep-sequencing data». Nucleic Acids Research 42 (W1): W187-W191. ISSN 1362-4962. PMC 4086134. PMID 24799436. doi:10.1093/nar/gku365. Consultado el 30 de abril de 2026. 
  74. a b Ramírez, Fidel; Dündar, Friederike; Diehl, Sarah; Grüning, Björn A.; Manke, Thomas (1 de julio de 2014). «deepTools: a flexible platform for exploring deep-sequencing data». Nucleic Acids Research (en inglés) 42 (W1): W187-W191. ISSN 1362-4962. PMC 4086134. PMID 24799436. doi:10.1093/nar/gku365. Consultado el 30 de abril de 2026. 
  75. Rice, Peter; Longden, Ian; Bleasby, Alan (2000-06). «EMBOSS: The European Molecular Biology Open Software Suite». Trends in Genetics 16 (6): 276-277. ISSN 0168-9525. doi:10.1016/s0168-9525(00)02024-2. Consultado el 30 de abril de 2026. 
  76. a b c Rice, Peter; Longden, Ian; Bleasby, Alan (2000-06). «EMBOSS: The European Molecular Biology Open Software Suite». Trends in Genetics 16 (6): 276-277. ISSN 0168-9525. doi:10.1016/S0168-9525(00)02024-2. Consultado el 30 de abril de 2026. 
  77. a b Camacho, Christiam; Coulouris, George; Avagyan, Vahram; Ma, Ning; Papadopoulos, Jason; Bealer, Kevin; Madden, Thomas L. (15 de diciembre de 2009). «BLAST+: architecture and applications». BMC Bioinformatics (en inglés) 10 (1): 421. ISSN 1471-2105. PMC 2803857. PMID 20003500. doi:10.1186/1471-2105-10-421. Consultado el 30 de abril de 2026. 
  78. Chen, Ying; Ye, Weicai; Zhang, Yongdong; Xu, Yuesheng (6 de agosto de 2015). «High speed BLASTN: an accelerated MegaBLAST search tool». Nucleic Acids Research (en inglés) 43 (16): 7762-7768. ISSN 0305-1048. PMC 4652774. PMID 26250111. doi:10.1093/nar/gkv784. Consultado el 30 de abril de 2026. 
  79. Cock, Peter J. A.; Chilton, John M.; Grüning, Björn; Johnson, James E.; Soranzo, Nicola (1 de diciembre de 2015). «NCBI BLAST+ integrated into Galaxy». Gigascience (en inglés) 4 (1). ISSN 2047-217X. PMC 4557756. PMID 26336600. doi:10.1186/s13742-015-0080-7. Consultado el 30 de abril de 2026. 
  80. Pond, Sergei L. Kosakovsky; Frost, Simon D. W.; Muse, Spencer V. (1 de marzo de 2005). «HyPhy: hypothesis testing using phylogenies». Bioinformatics (en inglés) 21 (5): 676-679. ISSN 1367-4811. doi:10.1093/bioinformatics/bti079. Consultado el 30 de abril de 2026. 
  81. a b VEG. «HyPhy - Hypothesis Testing using Phylogenies». veg.github.io. Consultado el 30 de abril de 2026. 
  82. a b Wang, Liguo; Wang, Shengqin; Li, Wei (15 de agosto de 2012). «RSeQC: quality control of RNA-seq experiments». Bioinformatics (en inglés) 28 (16): 2184-2185. ISSN 1367-4811. doi:10.1093/bioinformatics/bts356. Consultado el 30 de abril de 2026. 
  83. Cannon, Daniel C; Yang, Jeremy J; Mathias, Stephen L; Ursu, Oleg; Mani, Subramani; Waller, Anna; Schürer, Stephan C; Jensen, Lars Juhl et al. (15 de agosto de 2017). «TIN-X: target importance and novelty explorer». En Wren, Jonathan, ed. Bioinformatics (en inglés) 33 (16): 2601-2603. ISSN 1367-4803. PMC 5870731. PMID 28398460. doi:10.1093/bioinformatics/btx200. Consultado el 30 de abril de 2026. 
  84. Maier, Wolfgang (21 de marzo de 2018), MiModD - Mutation Identification in Model Organism Genomes, Zenodo, doi:10.5281/zenodo.1189838, consultado el 30 de abril de 2026 .
  85. a b «MiModD». SourceForge (en inglés). 28 de julio de 2023. Consultado el 30 de abril de 2026. 
  86. a b Wolf, F. Alexander; Angerer, Philipp; Theis, Fabian J. (6 de febrero de 2018). «SCANPY: large-scale single-cell gene expression data analysis». Genome Biology (en inglés) 19 (1): 15. ISSN 1474-760X. PMC 5802054. PMID 29409532. doi:10.1186/s13059-017-1382-0. Consultado el 30 de abril de 2026. 
  87. Park, Jong-Eun; Polański, Krzysztof; Meyer, Kerstin; Teichmann, Sarah A. (21 de agosto de 2018), Fast Batch Alignment of Single Cell Transcriptomes Unifies Multiple Mouse Cell Atlases into an Integrated Landscape (en inglés), doi:10.1101/397042, consultado el 30 de abril de 2026 .
  88. Wolff, Joachim; Rabbani, Leily; Gilsbach, Ralf; Richard, Gautier; Manke, Thomas; Backofen, Rolf; Grüning, Björn A (2 de julio de 2020). «Galaxy HiCExplorer 3: a web server for reproducible Hi-C, capture Hi-C and single-cell Hi-C data analysis, quality control and visualization». Nucleic Acids Research (en inglés) 48 (W1): W177-W184. ISSN 0305-1048. PMC 7319437. PMID 32301980. doi:10.1093/nar/gkaa220. Consultado el 30 de abril de 2026. 
  89. a b c d Galaxy Project (ed.). «Galaxy Community Hub». Consultado el 22 de abril de 2026. 
  90. a b c d e f Afgan, Enis; Baker, Darius; van den Beek, Maarten (2018). «The Galaxy platform for accessible, reproducible and collaborative biomedical analyses». Nucleic Acids Research 46 (W1): W537-W544. doi:10.1093/nar/gky379. 
  91. Galaxy Project (ed.). «Galaxy Documentation: Deployment and Scaling». Consultado el 22 de abril de 2026. 
  92. Galaxy Project (ed.). «Public Galaxy Servers». Consultado el 22 de abril de 2026. 
  93. Galaxy Project (ed.). «Galaxy Europe». Consultado el 22 de abril de 2026. 
  94. Galaxy Project (ed.). «Galaxy Australia». Consultado el 22 de abril de 2026. 
  95. Galaxy Project (ed.). «Galaxy Events». Consultado el 22 de abril de 2026. 
  96. a b c Galaxy Project (ed.). «Galaxy Training Network». Consultado el 22 de abril de 2026. 
  97. Galaxy Project (ed.). «Galaxy Community Conference». Consultado el 22 de abril de 2026. 

📚 Artikel Terkait di Wikipedia

BioPerl

M, Mascarenhas D, Degrave W, de Miranda A (2006). «BioParser: a tool for processing of sequence similarity analysis reports». Appl Bioinformatics 5 (1):

Metabolómica

«MetAlign: interface-driven, versatile metabolomics tool for hyphenated full-scan mass spectrometry data processing». Anal Chem 81 (8): 3079-86. PMID 19301908

BioJava

2004). «The RESID Database of Protein Modifications as a resource and annotation tool». Proteomics 4 (6): 1527-33. PMID 15174122. doi:10.1002/pmic.200300777

Salesforce

2019). «Appen acquires Figure Eight for up to $300M, bringing two data annotation companies together». TechCrunch (en inglés estadounidense). Consultado

Tecnologías de transcriptómica

; Huang, S.; Fei, Z.; Lin, K. (Noviembre de 2011). «RNA-Seq improves annotation of protein-coding genes in the cucumber genome». BMC Genomics 12: 540