MUSCLE (software de alineamiento) 📖 Wikipedia

MUltiple Sequence Comparison by Log-Expectation
Información general
Tipo de programa	software
Licencia	software de dominio público
Información técnica
Programado en	C++
Archivos legibles
	Formato FASTA
Archivos editables
	Formato FASTA; PHYLIP file format;
Enlaces
	Sitio web oficial Repositorio de código
	[editar datos en Wikidata]

(Multiple Sequence Comparison by Log-Expectation) es un software para el alineamiento múltiple de secuencias de proteínas y nucleótidos. Otras aplicaciones incluyen la estimación de árboles filogenéticos, la predicción de la estructura proteica y la identificación de residuos (aminoácidos) esenciales para una función biológica. Esta herramienta fue publicada por Robert C. Edgar en 2004 y cuenta con licencia de dominio público, permitiendo su libre uso y distribución. Hasta la versión 3, MUSCLE utiliza un método de refinamiento progresivo. ^[1] A partir de la versión 5, utiliza un modelo oculto de Markov similar a ProbCons.^[2]

Historia

editar

Robert C. Edgar es Físico por la University College de Londres, donde obtuvo el grado de Doctor en Física de Partículas en 1982. Tras su doctorado, se enfocó en el desarrollo de software y fundó la empresa Parity Software en 1988. En 1999 vendió la compañía a Intel y casi inmediatamente después abandonó el emprendedurismo. En 2001, asistió a un seminario en la Universidad de California en Berkeley donde conoció a Kimmen Sjolander con quien comenzó su enfoque en algoritmos de programación. Desde 2001 hasta la actualidad, Robert ha contribuido y ha sido el único autor de múltiples programas de software, entre ellos MUSCLE y USEARCH.^[3] Ha escrito un total de 96 artículos en el campo de la biología computacional desde 2002 hasta la actualidad, siendo su artículo más reciente: "Improved gene tree inference from removing alignment errors both from focal genes and when training substitution models". Hasta abril de 2026, sus múltiples contribuciones han sido citadas más de 154,916 veces. Los dos artículos publicados sobre MUSCLE han sido citados más de 75,913 veces en conjunto. El primero de ellos fue publicado en la revista Nucleic Acids Research, donde presentó el algoritmo de alineamiento de secuenciasy ha recibido más de 52,500 citas. El segundo artículo se publicó el mismo año en BMC Bioinformatics, presentando más detalles técnicos del software, el cual ha recibido más de 23,300 citas.

Versiones

editar

Historial de versiones
Versión	Fecha de lanzamiento	Resumen	Referencia
MUSCLE v1	1/Marzo/2004	Esta herramienta fue publicada inicialmente el 1 de marzo de 2004 aunque esta versión empezó con la versión v3.2 (Las versiones v1-v3.1 de MUSCLE no fueron publicadas previo a la versión en la publicación por lo que se asume que estas versiones no fueron lanzadas).	MUSCLE: multiple sequence alignment with high accuracy and high throughput^[4]
MUSCLE v3.3 y MUSCLE-fast	19/Agosto/2004	En el artículo “MUSCLE: a multiple sequence alignment method with reduced time and space complexity”, publicado el 19 de agosto de 2004, fue lanzada una nueva versión de MUSCLE (v3.3) junto con MUSCLE-fast, la cual fue diseñada específicamente para aplicaciones de “gran capacidad de procesamiento”.	MUSCLE: a multiple sequence alignment method with reduced time and space complexity^[5]
MUSCLE v3.6	Septiembre/2005	En 2005, se lanzó otra versión de MUSCLE que describe los detalles de implementación del software.	Guía del usuario: MUSCLE
MUSCLE v3.8.31	Septiembre/2010	La versión MUSCLE v3.8.31 se lanzó en 2010 y fue la última versión previa a la v5.	Descarga MUSCLE 3.8.31 de la página oficial Drive5
MUSCLE v5.0-5.3	21/Junio/2021	MUSCLE v5 se lanzó en 2021 in con el artículo “MUSCLE v5 enables improved estimates of phylogenetic tree confidence by ensemble bootstrapping”. Posteriormente, se lanzaron las versiones 5.1, 5.2 y 5.3 las cuales se encuentran disponibles en la página oficial de MUSCLE.	Muscle5: High-accuracy alignment ensembles enable unbiased assessments of sequence homology and phylogeny^[6]

MUSCLE5

editar

Descripción general

editar

A finales de 2021, Edgar lanzó MUSCLE5 (también conocido como MUSCLE v5), una versión actualizada del software MUSCLE. Introduce diversas innovaciones orientadas a mejorar la precisión del alineamiento y reducir el sesgo presente en otros algoritmos de alineamiento múltiple de secuencias (MSA, por sus siglas en inglés). Herramientas tradicionales como Clustal Omega^[7], MAFFT^[8] y versiones anteriores de MUSCLE se basan en estrategias de alineamiento progresivo que producen un único alineamiento. MUSCLE5, en cambio, genera un conjunto de alineamientos de alta precisión perturbando un modelo oculto de Markov y permutando su árbol guiado. En su núcleo, el algoritmo es una reimplementación paralelizada de ProbCons,^[2] y está diseñado para escalar eficientemente a grandes conjuntos de datos. MUSCLE5 ha demostrado un mejor rendimiento en pruebas de referencia en comparación con los principales métodos de alineamiento múltiple de secuencias en varios conjuntos de datos de prueba, entre ellos BAliBASE,^[9] BRAliBASE^[10] y PREFAB.^[11]

Conjuntos de alineamiento

editar

Una innovación importante en la versión 5 de MUSCLE es el uso de conjuntos de alineamiento (alignment ensembles), que proporcionan parámetros de confianza en las alineaciones. Para el modelo oculto de Markov y el árbol guiado, cada alineamiento múltiple de secuencias (MSA, por sus siglas en inglés) individual en el conjunto utiliza parámetros fijos pero elegidos de forma independiente, lo que permite promediar los resultados en un conjunto diverso de réplicas. Esto permite evaluar la sensibilidad de los análisis posteriores a la alineación comparando los resultados en todo el conjunto.

Algoritmo antiguo

editar

El algoritmo de MUSCLE (antes de la versión 5) se desarrolla en tres etapas: 1) Alineamiento progresivo preliminar, 2) Alineamiento progresivo mejorado y 3) Refinamiento.^[12]^[13]

Etapa 1: Alineamiento Progresivo Preliminar

editar

En esta primera etapa, el algoritmo genera un alineamiento múltiple de secuencias heurístico, priorizando la velocidad sobre la precisión.^[14] Este paso comienza calculando la distancia k-mero para cada par de secuencias que son ingresadas al programa, creando así una matriz de distancias por pares D₁. Luego el algoritmo UPGMA (Unweighted Pair Group Method wiht Arithmetic Mean) agrupa esta matriz para generar un árbol binario TREE₁. A partir de la topología de este árbol, se construye un alineamiento progresivo, comenzando con la creación de perfiles para cada hoja (secuencia individual). Para cada nodo interno, se realiza un alineamiento por pares de los dos perfiles hijos, creando un nuevo perfil que se asigna a dicho nodo. Este proceso continúa hasta obtener un alineamiento múltiple de todas las secuencias de entrada en la raíz del árbol denominado MSA₁.^[12]

Considerando que N representa el número de secuencias de entrada, L la longitud promedio de dichas secuencias, la complejidad temporal de la etapa progresiva preliminar se define como:^[12]

O(N² ⋅ L + N ⋅ L²)

Cálculo de la distancia entre pares de k-meros se realiza como O(N² · L)

Alineamiento progresivo requieren O(N · L²)
Complejidad espacial es O(N · L), ya que el algoritmo mantiene perfiles y alineaciones para cada secuencia a lo largo del árbol. ^[11]

Etapa 2: Alineamiento Progresivo Mejorado

editar

La segunda etapa tiene como objetivo optimizar la topología del árbol guía, para lo cual se calcula la distancia de Kimura para cada par de secuencias utilizando el alineamiento múltiple obtenido en la primera etapa, lo que genera una segunda matriz de distancias (D₂). Posteriormente se aplica nuevamente el método UPGMA sobre esta matriz para construir un segundo árbol binario (TREE₂).^[12]^[13]

Luego, al igual que en la etapa anterior, se realiza un alineamiento progresivo, sin embargo, en esta fase se optimiza el proceso recalculando únicamente los alineamientos de aquellos subárboles cuyo orden de ramificación ha variado respecto al primer árbol. Esta refinación selectiva permite obtener un alineamiento más preciso. La optimización se logra mediante los siguientes cálculos, donde m representa el número de realineamientos de subárboles realizados:^[12]

O(N² ⋅ L + m⋅ L²)

De manera similar, la complejidad espacial es:

O(N · L),

ya que el algoritmo mantiene perfiles y alineaciones de las secuencias de entrada durante todo el proceso progresivo.^[11]

Etapa 3: Refinamiento

editar

En esta etapa final, se selecciona una arista del segundo árbol, visitando las aristas en orden decreciente de distancia respecto a la raíz. La arista seleccionada se elimina, dividiendo el árbol en dos subárboles. A continuación, se calcula el perfil del alineamiento múltiple para cada subárbol. Se produce un nuevo alineamiento múltiple realineando los perfiles de los subárboles. Si la puntuación SP mejora, el nuevo alineamiento se conserva; de lo contrario, se descarta. El proceso de eliminar una arista y realinear se repite hasta alcanzar la convergencia, o hasta que se alcanza un límite definido por el usuario.

La complejidad temporal de la etapa de refinamiento se expresa como O(k · L²). Aquí, k denota el número de eliminaciones de aristas y L denota la longitud promedio de las secuencias, siendo el realineamiento de los perfiles de los subárboles el costo dominante por iteración. La complejidad espacial se mantiene igual que en las etapas uno y dos: O(N · L). Dado que el mismo proceso de refinamiento iterativo tiene lugar, la complejidad asintótica permanece polinomial, ya que el término dominante crece linealmente con respecto al número de pasos de refinamiento.

En comparación, el algoritmo CLUSTALW incluye un paso de refinamiento iterativo optimizado, en el que se realinean selectivamente partes del árbol con el fin de maximizar la precisión del alineamiento sin repetir el proceso completo. Sin embargo, la complejidad temporal y espacial no varía para este paso de refinamiento iterativo optimizado. La complejidad temporal es O(k · L²), donde k es el número de pasos de refinamiento y L es la longitud promedio del alineamiento. La complejidad espacial se expresa como O(N · L), nuevamente para los perfiles de alineamiento y los datos de secuencias de las N secuencias de entrada.^[15]^[15]

Diagrama de funcionamiento

editar

Comparación y complejidad

editar

En las dos primeras etapas del algoritmo, la complejidad temporal es O(N²L + NL²) y la complejidad espacial es O(N² + NL + L²). La etapa de refinamiento añade a la complejidad temporal un término adicional, O(N³L).[1] MUSCLE se utiliza frecuentemente como sustituto de Clustal,^[16]^[17] ya que generalmente (aunque no siempre) produce alineamientos de secuencias de mayor calidad. Dependiendo de las opciones elegidas, MUSCLE es significativamente más rápido que Clustal^[16]^[17] especialmente en alineamientos de mayor tamaño.^[18]

La mayoría de los programas modernos de alineamiento múltiple de secuencias son generalmente aceptados al presentar secuencias alineadas, aunque existen pocas diferencias entre ellos. La principal diferencia entre los programas radica en el método utilizado para alinear las secuencias. Por ejemplo, T-Coffee^[19] y Clustal^[16]^[17] emplean el método progresivo, mientras que MUSCLE yMAFFT^[20] funcionan mediante el método iterativo de alineamiento.^[21]^[22] Estos dos métodos difieren en su capacidad para manejar secuencias de baja similitud, siendo el método iterativo el que proporciona resultados más precisos. Otra diferencia entre los métodos tiene que ver con sus requerimientos computacionales.

Originalmente, MUSCLE tenía una demanda de CPU intermedia en comparación con otros programas, aunque definitivamente superior a la de los métodos progresivos.^[11] Las comparaciones con versiones modernas de programas de alineamiento múltiple de secuencias revelan que muchos son bastante similares en sus capacidades. Los alineamientos fueron evaluados en función de su suma de pares (SP, del inglés sum of pairs), que mide la coincidencia correcta de dos nucleótidos o aminoácidos entre dos secuencias, y de sus columnas totales (TC, del inglés total columns), que corresponde al cociente entre las columnas coincidentes y el total de columnas. En estos casos, MUSCLE mostró un rendimiento promedio en su capacidad para maximizar los pares y columnas coincidentes, siendo ligeramente inferior a ProbCons,^[23] T-Coffee,^[24] Probalign^[25] y MAFFT.^[26] Fuera de las puntuaciones de alineamiento, MUSCLE resultó menos exigente computacionalmente, tanto en el tiempo de ejecución del alineamiento como en el uso de memoria.

Propiedades computacionales de alineadores múltiples de secuencias^[27]
Herramienta	Tiempo promedio de alineamiento (segundos)	Uso promedio de memoria (Mb)	Suma de Pares (SP) promedio de secuencias cortas	Columnas Totales (CT) promedio de secuencias largas	SP promedio de secuencias largas	CT promedio de secuencias largas
MUSCLE	301.4	60.8	0.718	0.341	0.789	0.437
T-Coffee	1964.9	372.2	0.760	0.407	0.830	0.520
ProbCons	1781.7	192.5	0.763	0.220	0.831	0.524
MAFFT	309.0	231.6	0.767	0.421	0.803	0.470
Probalign	1410.2	162.7	0.774	0.219	0.800	0.455

Integración en múltiples herramientas

editar

MUSCLE cuenta con amplia compatibilidad en múltiples plataformas de bioinformática. Está completamente integrado en programas como CodonCode Aligner,^[28] el Lasergene de DNAS,^[29] STAR,^[30] Geneious y MacVector, y también está disponible como complemento para Sequencher, MEGA,^[31] UGENE^[32] y AliView.^[33] Los usuarios también pueden acceder a MUSCLE como servicio web a través del Laboratorio Europeo de Biología Molecular (EMBL, por sus siglas en inglés) - Instituto Europeo de Bioinformática (EBI) o T-Coffee. Asimismo, MUSCLE puede descargarse en dispositivos personales desde su sitio web oficial.


Plataforma	Tipo de integración	Método de acceso	Fuentes
CodonCode Aligner	Integrado	Disponible en Contig → Align with Muscle	^[34]
Geneious	Integrado	Disponible en Align/Assemble → Multiple Align → MUSCLE	^[35]
DNASTAR Lasergene	Integrado	Disponible en el módulo MegaAlign Pro en Align → Align using Muscle	^[36]
MacVector	Integrado	Se encuentra en Align	^[37]
Sequencher (Gene Codes Corp.)	Complemento	Requiere instalación del complemento de MUSCLE; se accede en Assemble → Align Using → Muscle	^[38]
MEGA	Complemento	Se encuentra en Alignment Explorer → Align → MUSCLE	^[31]
UGENE	Complemento	Accesible haciendo clic derecho → Align → Align with Muscle	^[39]
AliView	Complemento	Requiere instalación del complemento de MUSCLE; accesible en Preferences → External Tools → Set path to MUSCLE	^[33]
EMBL-EBI	Herramienta web	Accesible a través de la interfaz web de MUSCLE	^[40]
T-Coffee	Herramienta web	Accesible en el menú de más opciones seleccionando MUSCLE en la selección de métodos	^[41]

Véase también

editar

Referencias

editar

↑ Edgar RC (2004). «MUSCLE: a multiple sequence alignment method with reduced time and space complexity». BMC Bioinformatics 5 (1). PMC 517706. PMID 15318951. doi:10.1186/1471-2105-5-113.
↑ ^a ^b Do, Chuong B.; Mahabhashyam, Mahathi S.P.; Brudno, Michael; Batzoglou, Serafim (2005-02). «ProbCons: Probabilistic consistency-based multiple sequence alignment». Genome Research (en inglés) 15 (2): 330-340. ISSN 1088-9051. PMC 546535. PMID 15687296. doi:10.1101/gr.2821705. Consultado el 1 de mayo de 2026.
↑ Edgar, Robert C. (1 de octubre de 2010). «Search and clustering orders of magnitude faster than BLAST». Bioinformatics (en inglés) 26 (19): 2460-2461. ISSN 1367-4811. doi:10.1093/bioinformatics/btq461. Consultado el 1 de mayo de 2026.
↑ Edgar, R. C. (8 de marzo de 2004). «MUSCLE: multiple sequence alignment with high accuracy and high throughput». Nucleic Acids Research (en inglés) 32 (5): 1792-1797. ISSN 1362-4962. PMC 390337. PMID 15034147. doi:10.1093/nar/gkh340. Consultado el 1 de mayo de 2026.
↑ Edgar, Robert C (19 de agosto de 2004). «MUSCLE: a multiple sequence alignment method with reduced time and space complexity». BMC Bioinformatics (en inglés) 5 (1). ISSN 1471-2105. PMC 517706. PMID 15318951. doi:10.1186/1471-2105-5-113. Consultado el 1 de mayo de 2026.
↑ Edgar, Robert C. (15 de noviembre de 2022). «Muscle5: High-accuracy alignment ensembles enable unbiased assessments of sequence homology and phylogeny». Nature Communications (en inglés) 13 (1). ISSN 2041-1723. PMC 9664440. PMID 36379955. doi:10.1038/s41467-022-34630-w. Consultado el 1 de mayo de 2026.
↑ Sievers, Fabian; Wilm, Andreas; Dineen, David; Gibson, Toby J; Karplus, Kevin; Li, Weizhong; Lopez, Rodrigo; McWilliam, Hamish et al. (2011-01). «Fast, scalable generation of high‐quality protein multiple sequence alignments using Clustal Omega». Molecular Systems Biology (en inglés) 7 (1). ISSN 1744-4292. PMC 3261699. PMID 21988835. doi:10.1038/msb.2011.75. Consultado el 1 de mayo de 2026.
↑ Katoh, K. (15 de julio de 2002). «MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform». Nucleic Acids Research 30 (14): 3059-3066. doi:10.1093/nar/gkf436. Consultado el 1 de mayo de 2026.
↑ Thompson, Julie D.; Koehl, Patrice; Ripp, Raymond; Poch, Olivier (2005-10). «BAliBASE 3.0: Latest developments of the multiple sequence alignment benchmark». Proteins: Structure, Function, and Bioinformatics (en inglés) 61 (1): 127-136. ISSN 0887-3585. doi:10.1002/prot.20527. Consultado el 30 de abril de 2026.
↑ Gardner, P. P. (28 de abril de 2005). «A benchmark of multiple sequence alignment programs upon structural RNAs». Nucleic Acids Research (en inglés) 33 (8): 2433-2439. ISSN 0305-1048. PMC 1087786. PMID 15860779. doi:10.1093/nar/gki541. Consultado el 30 de abril de 2026.
↑ ^a ^b ^c ^d Edgar, R. C. (8 de marzo de 2004). «MUSCLE: multiple sequence alignment with high accuracy and high throughput». Nucleic Acids Research (en inglés) 32 (5): 1792-1797. ISSN 1362-4962. PMC 390337. PMID 15034147. doi:10.1093/nar/gkh340. Consultado el 30 de abril de 2026.
↑ ^a ^b ^c ^d ^e Edgar, R. C. (8 de marzo de 2004). «MUSCLE: multiple sequence alignment with high accuracy and high throughput». Nucleic Acids Research (en inglés) 32 (5): 1792-1797. ISSN 1362-4962. PMC 390337. PMID 15034147. doi:10.1093/nar/gkh340. Consultado el 30 de abril de 2026.
↑ ^a ^b Edgar, Robert C. (19 de agosto de 2004). «MUSCLE: a multiple sequence alignment method with reduced time and space complexity». BMC Bioinformatics (en inglés) 5 (1): 113. ISSN 1471-2105. PMC 517706. PMID 15318951. doi:10.1186/1471-2105-5-113. Consultado el 30 de abril de 2026.
↑ Oviedo Urazmetov, Arthur Alejandro (2011). «Unacloud MSA: una plataforma basada en unacloud para la generación y análisis de alineamientos múltiples de secuencias.». Universidad de los Andes, Séneca Repositorio Institucional. Consultado el 12-04-2026.
↑ ^a ^b Edgar, Robert C (19 de agosto de 2004). «MUSCLE: a multiple sequence alignment method with reduced time and space complexity». BMC Bioinformatics (en inglés) 5 (1). ISSN 1471-2105. PMC 517706. PMID 15318951. doi:10.1186/1471-2105-5-113. Consultado el 30 de abril de 2026.
↑ ^a ^b ^c Higgins, Desmond G.; Sharp, Paul M. (1988-12). «CLUSTAL: a package for performing multiple sequence alignment on a microcomputer». Gene (en inglés) 73 (1): 237-244. doi:10.1016/0378-1119(88)90330-7. Consultado el 1 de mayo de 2026.
↑ ^a ^b ^c Thompson, Julie D.; Higgins, Desmond G.; Gibson, Toby J. (1994). «CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice». Nucleic Acids Research (en inglés) 22 (22): 4673-4680. ISSN 0305-1048. PMC 308517. PMID 7984417. doi:10.1093/nar/22.22.4673. Consultado el 1 de mayo de 2026.
↑ Mendieta Baltodano, Concepción (2014). «Análisis de algoritmos basados en técnicas de conglomerado aplicados en el alineamiento y comparación de secuencias de proteínas.». Revista Torreón Universitario 4 (8): 18-25. ISSN 2313-7215. Consultado el 22 de marzo de 2026.
↑ Notredame, Cédric; Higgins, Desmond G; Heringa, Jaap (2000-09). «T-coffee: a novel method for fast and accurate multiple sequence alignment 1 1Edited by J. Thornton». Journal of Molecular Biology (en inglés) 302 (1): 205-217. doi:10.1006/jmbi.2000.4042. Consultado el 1 de mayo de 2026.
↑ Katoh, K. (15 de julio de 2002). «MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform». Nucleic Acids Research 30 (14): 3059-3066. doi:10.1093/nar/gkf436. Consultado el 30 de abril de 2026.
↑ Zhang, Chenyue; Wang, Qinxin; Li, Yiyang; Teng, Anqi; Hu, Gang; Wuyun, Qiqige; Zheng, Wei (29 de noviembre de 2024). «The Historical Evolution and Significance of Multiple Sequence Alignment in Molecular Structure and Function Prediction». Biomolecules (en inglés) 14 (12): 1531. ISSN 2218-273X. PMC 11673352. PMID 39766238. doi:10.3390/biom14121531. Consultado el 30 de abril de 2026.
↑ «Alineamiento de secuencias biológicas». rstudio-pubs-static.s3.amazonaws.com. Consultado el 30 de abril de 2026.
↑ Do, Chuong B.; Mahabhashyam, Mahathi S.P.; Brudno, Michael; Batzoglou, Serafim (2005-02). «ProbCons: Probabilistic consistency-based multiple sequence alignment». Genome Research (en inglés) 15 (2): 330-340. ISSN 1088-9051. PMC 546535. PMID 15687296. doi:10.1101/gr.2821705. Consultado el 30 de abril de 2026.
↑ Notredame, Cédric; Higgins, Desmond G; Heringa, Jaap (2000-09). «T-coffee: a novel method for fast and accurate multiple sequence alignment 1 1Edited by J. Thornton». Journal of Molecular Biology (en inglés) 302 (1): 205-217. doi:10.1006/jmbi.2000.4042. Consultado el 30 de abril de 2026.
↑ Roshan, Usman; Livesay, Dennis R. (15 de noviembre de 2006). «Probalign: multiple sequence alignment using partition function posterior probabilities». Bioinformatics (en inglés) 22 (22): 2715-2721. ISSN 1367-4811. doi:10.1093/bioinformatics/btl472. Consultado el 30 de abril de 2026.
↑ Katoh, K. (15 de julio de 2002). «MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform». Nucleic Acids Research 30 (14): 3059-3066. PMC 135756. PMID 12136088. doi:10.1093/nar/gkf436. Consultado el 30 de abril de 2026.
↑ Pais, Fabiano Sviatopolk-Mirsky; Ruy, Patrícia de Cássia; Oliveira, Guilherme; Coimbra, Roney Santos (2014-12). «Assessing the efficiency of multiple sequence alignment programs». Algorithms for Molecular Biology (en inglés) 9 (1). ISSN 1748-7188. PMC 4015676. PMID 24602402. doi:10.1186/1748-7188-9-4. Consultado el 30 de abril de 2026.
↑ «New products». Genetics in Medicine (en inglés) 6 (3): 162-163. 2004-05. doi:10.1097/00125817-200405000-00012. Consultado el 30 de abril de 2026.
↑ Burland, Timothy G. (26 de agosto de 1999). DNASTAR's Lasergene Sequence Analysis Software (en inglés) 132. Humana Press. pp. 71-91. ISBN 978-1-59259-192-3. doi:10.1385/1-59259-192-2:71. Consultado el 30 de abril de 2026.
↑ Dobin, Alexander; Davis, Carrie A.; Schlesinger, Felix; Drenkow, Jorg; Zaleski, Chris; Jha, Sonali; Batut, Philippe; Chaisson, Mark et al. (1 de enero de 2013). «STAR: ultrafast universal RNA-seq aligner». Bioinformatics (en inglés) 29 (1): 15-21. ISSN 1367-4811. PMC 3530905. PMID 23104886. doi:10.1093/bioinformatics/bts635. Consultado el 30 de abril de 2026.
↑ ^a ^b Kumar, S.; Nei, M.; Dudley, J.; Tamura, K. (27 de marzo de 2008). «MEGA: A biologist-centric software for evolutionary analysis of DNA and protein sequences». Briefings in Bioinformatics (en inglés) 9 (4): 299-306. ISSN 1467-5463. PMC 2562624. PMID 18417537. doi:10.1093/bib/bbn017. Consultado el 30 de abril de 2026.
↑ Okonechnikov, Konstantin; Golosova, Olga; Fursov, Mikhail; the UGENE team (15 de abril de 2012). «Unipro UGENE: a unified bioinformatics toolkit». Bioinformatics (en inglés) 28 (8): 1166-1167. ISSN 1367-4803. doi:10.1093/bioinformatics/bts091. Consultado el 30 de abril de 2026.
↑ ^a ^b Larsson, Anders (15 de noviembre de 2014). «AliView: a fast and lightweight alignment viewer and editor for large datasets». Bioinformatics (en inglés) 30 (22): 3276-3278. ISSN 1367-4811. PMC 4221126. PMID 25095880. doi:10.1093/bioinformatics/btu531. Consultado el 30 de abril de 2026.
↑ «Sequence Alignment Software | CodonCode Aligner for DNA Analysis». www.codoncode.com. Consultado el 30 de abril de 2026.
↑ «Geneious | Bioinformatics Software for Sequence Data Analysis». Geneious (en inglés estadounidense). Consultado el 30 de abril de 2026.
↑ «Lasergene NGS Data Analysis Software». DNASTAR (en inglés estadounidense). Consultado el 30 de abril de 2026.
↑ «We produce software for the molecular biologist with a Mac!» (en inglés estadounidense). Consultado el 30 de abril de 2026.
↑ «Sequencher DNA Sequence Analysis Software from Gene Codes Corporation». www.genecodes.com. Consultado el 1 de mayo de 2026.
↑ «Unipro UGENE - Integrated Bioinformatics Tools». ugene.net (en inglés). Consultado el 30 de abril de 2026.
↑ Institute, European Bioinformatics. «EMBL-EBI homepage». www.ebi.ac.uk (en inglés). Consultado el 30 de abril de 2026.
↑ «T-COFFEE Multiple Sequence Alignment Server». tcoffee.crg.eu. Consultado el 30 de abril de 2026.

Datos: Q6719088

[Edgar2004b-1] Edgar RC (2004). «MUSCLE: a multiple sequence alignment method with reduced time and space complexity». BMC Bioinformatics 5 (1). PMC 517706. PMID 15318951. doi:10.1186/1471-2105-5-113.

[dup-0-68-2] Do, Chuong B.; Mahabhashyam, Mahathi S.P.; Brudno, Michael; Batzoglou, Serafim (2005-02). «ProbCons: Probabilistic consistency-based multiple sequence alignment». Genome Research (en inglés) 15 (2): 330-340. ISSN 1088-9051. PMC 546535. PMID 15687296. doi:10.1101/gr.2821705. Consultado el 1 de mayo de 2026.

[3] Edgar, Robert C. (1 de octubre de 2010). «Search and clustering orders of magnitude faster than BLAST». Bioinformatics (en inglés) 26 (19): 2460-2461. ISSN 1367-4811. doi:10.1093/bioinformatics/btq461. Consultado el 1 de mayo de 2026.

[4] Edgar, R. C. (8 de marzo de 2004). «MUSCLE: multiple sequence alignment with high accuracy and high throughput». Nucleic Acids Research (en inglés) 32 (5): 1792-1797. ISSN 1362-4962. PMC 390337. PMID 15034147. doi:10.1093/nar/gkh340. Consultado el 1 de mayo de 2026.

[5] Edgar, Robert C (19 de agosto de 2004). «MUSCLE: a multiple sequence alignment method with reduced time and space complexity». BMC Bioinformatics (en inglés) 5 (1). ISSN 1471-2105. PMC 517706. PMID 15318951. doi:10.1186/1471-2105-5-113. Consultado el 1 de mayo de 2026.

[6] Edgar, Robert C. (15 de noviembre de 2022). «Muscle5: High-accuracy alignment ensembles enable unbiased assessments of sequence homology and phylogeny». Nature Communications (en inglés) 13 (1). ISSN 2041-1723. PMC 9664440. PMID 36379955. doi:10.1038/s41467-022-34630-w. Consultado el 1 de mayo de 2026.

[7] Sievers, Fabian; Wilm, Andreas; Dineen, David; Gibson, Toby J; Karplus, Kevin; Li, Weizhong; Lopez, Rodrigo; McWilliam, Hamish et al. (2011-01). «Fast, scalable generation of high‐quality protein multiple sequence alignments using Clustal Omega». Molecular Systems Biology (en inglés) 7 (1). ISSN 1744-4292. PMC 3261699. PMID 21988835. doi:10.1038/msb.2011.75. Consultado el 1 de mayo de 2026.

[8] Katoh, K. (15 de julio de 2002). «MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform». Nucleic Acids Research 30 (14): 3059-3066. doi:10.1093/nar/gkf436. Consultado el 1 de mayo de 2026.

[9] Thompson, Julie D.; Koehl, Patrice; Ripp, Raymond; Poch, Olivier (2005-10). «BAliBASE 3.0: Latest developments of the multiple sequence alignment benchmark». Proteins: Structure, Function, and Bioinformatics (en inglés) 61 (1): 127-136. ISSN 0887-3585. doi:10.1002/prot.20527. Consultado el 30 de abril de 2026.

[10] Gardner, P. P. (28 de abril de 2005). «A benchmark of multiple sequence alignment programs upon structural RNAs». Nucleic Acids Research (en inglés) 33 (8): 2433-2439. ISSN 0305-1048. PMC 1087786. PMID 15860779. doi:10.1093/nar/gki541. Consultado el 30 de abril de 2026.

[dup-1-90-11] Edgar, R. C. (8 de marzo de 2004). «MUSCLE: multiple sequence alignment with high accuracy and high throughput». Nucleic Acids Research (en inglés) 32 (5): 1792-1797. ISSN 1362-4962. PMC 390337. PMID 15034147. doi:10.1093/nar/gkh340. Consultado el 30 de abril de 2026.

[:2-12] Edgar, R. C. (8 de marzo de 2004). «MUSCLE: multiple sequence alignment with high accuracy and high throughput». Nucleic Acids Research (en inglés) 32 (5): 1792-1797. ISSN 1362-4962. PMC 390337. PMID 15034147. doi:10.1093/nar/gkh340. Consultado el 30 de abril de 2026.

[:3-13] Edgar, Robert C. (19 de agosto de 2004). «MUSCLE: a multiple sequence alignment method with reduced time and space complexity». BMC Bioinformatics (en inglés) 5 (1): 113. ISSN 1471-2105. PMC 517706. PMID 15318951. doi:10.1186/1471-2105-5-113. Consultado el 30 de abril de 2026.

[14] Oviedo Urazmetov, Arthur Alejandro (2011). «Unacloud MSA: una plataforma basada en unacloud para la generación y análisis de alineamientos múltiples de secuencias.». Universidad de los Andes, Séneca Repositorio Institucional. Consultado el 12-04-2026.

[dup-2-51-15] Edgar, Robert C (19 de agosto de 2004). «MUSCLE: a multiple sequence alignment method with reduced time and space complexity». BMC Bioinformatics (en inglés) 5 (1). ISSN 1471-2105. PMC 517706. PMID 15318951. doi:10.1186/1471-2105-5-113. Consultado el 30 de abril de 2026.

[:0-16] Higgins, Desmond G.; Sharp, Paul M. (1988-12). «CLUSTAL: a package for performing multiple sequence alignment on a microcomputer». Gene (en inglés) 73 (1): 237-244. doi:10.1016/0378-1119(88)90330-7. Consultado el 1 de mayo de 2026.

[:1-17] Thompson, Julie D.; Higgins, Desmond G.; Gibson, Toby J. (1994). «CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice». Nucleic Acids Research (en inglés) 22 (22): 4673-4680. ISSN 0305-1048. PMC 308517. PMID 7984417. doi:10.1093/nar/22.22.4673. Consultado el 1 de mayo de 2026.

[18] Mendieta Baltodano, Concepción (2014). «Análisis de algoritmos basados en técnicas de conglomerado aplicados en el alineamiento y comparación de secuencias de proteínas.». Revista Torreón Universitario 4 (8): 18-25. ISSN 2313-7215. Consultado el 22 de marzo de 2026.

[19] Notredame, Cédric; Higgins, Desmond G; Heringa, Jaap (2000-09). «T-coffee: a novel method for fast and accurate multiple sequence alignment 1 1Edited by J. Thornton». Journal of Molecular Biology (en inglés) 302 (1): 205-217. doi:10.1006/jmbi.2000.4042. Consultado el 1 de mayo de 2026.

[20] Katoh, K. (15 de julio de 2002). «MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform». Nucleic Acids Research 30 (14): 3059-3066. doi:10.1093/nar/gkf436. Consultado el 30 de abril de 2026.

[21] Zhang, Chenyue; Wang, Qinxin; Li, Yiyang; Teng, Anqi; Hu, Gang; Wuyun, Qiqige; Zheng, Wei (29 de noviembre de 2024). «The Historical Evolution and Significance of Multiple Sequence Alignment in Molecular Structure and Function Prediction». Biomolecules (en inglés) 14 (12): 1531. ISSN 2218-273X. PMC 11673352. PMID 39766238. doi:10.3390/biom14121531. Consultado el 30 de abril de 2026.

[22] «Alineamiento de secuencias biológicas». rstudio-pubs-static.s3.amazonaws.com. Consultado el 30 de abril de 2026.

[23] Do, Chuong B.; Mahabhashyam, Mahathi S.P.; Brudno, Michael; Batzoglou, Serafim (2005-02). «ProbCons: Probabilistic consistency-based multiple sequence alignment». Genome Research (en inglés) 15 (2): 330-340. ISSN 1088-9051. PMC 546535. PMID 15687296. doi:10.1101/gr.2821705. Consultado el 30 de abril de 2026.

[24] Notredame, Cédric; Higgins, Desmond G; Heringa, Jaap (2000-09). «T-coffee: a novel method for fast and accurate multiple sequence alignment 1 1Edited by J. Thornton». Journal of Molecular Biology (en inglés) 302 (1): 205-217. doi:10.1006/jmbi.2000.4042. Consultado el 30 de abril de 2026.

[25] Roshan, Usman; Livesay, Dennis R. (15 de noviembre de 2006). «Probalign: multiple sequence alignment using partition function posterior probabilities». Bioinformatics (en inglés) 22 (22): 2715-2721. ISSN 1367-4811. doi:10.1093/bioinformatics/btl472. Consultado el 30 de abril de 2026.

[26] Katoh, K. (15 de julio de 2002). «MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform». Nucleic Acids Research 30 (14): 3059-3066. PMC 135756. PMID 12136088. doi:10.1093/nar/gkf436. Consultado el 30 de abril de 2026.

[27] Pais, Fabiano Sviatopolk-Mirsky; Ruy, Patrícia de Cássia; Oliveira, Guilherme; Coimbra, Roney Santos (2014-12). «Assessing the efficiency of multiple sequence alignment programs». Algorithms for Molecular Biology (en inglés) 9 (1). ISSN 1748-7188. PMC 4015676. PMID 24602402. doi:10.1186/1748-7188-9-4. Consultado el 30 de abril de 2026.

[28] «New products». Genetics in Medicine (en inglés) 6 (3): 162-163. 2004-05. doi:10.1097/00125817-200405000-00012. Consultado el 30 de abril de 2026.

[29] Burland, Timothy G. (26 de agosto de 1999). DNASTAR's Lasergene Sequence Analysis Software (en inglés) 132. Humana Press. pp. 71-91. ISBN 978-1-59259-192-3. doi:10.1385/1-59259-192-2:71. Consultado el 30 de abril de 2026.

[30] Dobin, Alexander; Davis, Carrie A.; Schlesinger, Felix; Drenkow, Jorg; Zaleski, Chris; Jha, Sonali; Batut, Philippe; Chaisson, Mark et al. (1 de enero de 2013). «STAR: ultrafast universal RNA-seq aligner». Bioinformatics (en inglés) 29 (1): 15-21. ISSN 1367-4811. PMC 3530905. PMID 23104886. doi:10.1093/bioinformatics/bts635. Consultado el 30 de abril de 2026.

[dup-3-26-31] Kumar, S.; Nei, M.; Dudley, J.; Tamura, K. (27 de marzo de 2008). «MEGA: A biologist-centric software for evolutionary analysis of DNA and protein sequences». Briefings in Bioinformatics (en inglés) 9 (4): 299-306. ISSN 1467-5463. PMC 2562624. PMID 18417537. doi:10.1093/bib/bbn017. Consultado el 30 de abril de 2026.

[32] Okonechnikov, Konstantin; Golosova, Olga; Fursov, Mikhail; the UGENE team (15 de abril de 2012). «Unipro UGENE: a unified bioinformatics toolkit». Bioinformatics (en inglés) 28 (8): 1166-1167. ISSN 1367-4803. doi:10.1093/bioinformatics/bts091. Consultado el 30 de abril de 2026.

[dup-4-69-33] Larsson, Anders (15 de noviembre de 2014). «AliView: a fast and lightweight alignment viewer and editor for large datasets». Bioinformatics (en inglés) 30 (22): 3276-3278. ISSN 1367-4811. PMC 4221126. PMID 25095880. doi:10.1093/bioinformatics/btu531. Consultado el 30 de abril de 2026.

[34] «Sequence Alignment Software | CodonCode Aligner for DNA Analysis». www.codoncode.com. Consultado el 30 de abril de 2026.

[35] «Geneious | Bioinformatics Software for Sequence Data Analysis». Geneious (en inglés estadounidense). Consultado el 30 de abril de 2026.

[36] «Lasergene NGS Data Analysis Software». DNASTAR (en inglés estadounidense). Consultado el 30 de abril de 2026.

[37] «We produce software for the molecular biologist with a Mac!» (en inglés estadounidense). Consultado el 30 de abril de 2026.

[38] «Sequencher DNA Sequence Analysis Software from Gene Codes Corporation». www.genecodes.com. Consultado el 1 de mayo de 2026.

[39] «Unipro UGENE - Integrated Bioinformatics Tools». ugene.net (en inglés). Consultado el 30 de abril de 2026.

[40] Institute, European Bioinformatics. «EMBL-EBI homepage». www.ebi.ac.uk (en inglés). Consultado el 30 de abril de 2026.

[41] «T-COFFEE Multiple Sequence Alignment Server». tcoffee.crg.eu. Consultado el 30 de abril de 2026.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

MUSCLE (software de alineamiento) 📖 Wikipedia

Índice

Historia

Versiones

MUSCLE5

Descripción general

Conjuntos de alineamiento

Algoritmo antiguo

Etapa 1: Alineamiento Progresivo Preliminar

Etapa 2: Alineamiento Progresivo Mejorado

Etapa 3: Refinamiento

Diagrama de funcionamiento

Comparación y complejidad

Integración en múltiples herramientas

Véase también

Referencias

📚 Artikel Terkait di Wikipedia

Nivel de calidad Phred