TokuDB是一个开源的高性能存储引擎英语storage engine,适用于MySQLMariaDB。它通过分形树索引英语fractal tree index来实现,具可扩展性,与ACIDMVCC兼容,可改善基于索引的查询,可在线修改模式,并能降低硬盘驱动器闪存复制英语Replication (computing)#Database replication滞后。

TokuDB
開發者Percona
当前版本7.5.5[1](2015年1月29日[來源請求]
源代码库 編輯維基數據鏈接
类型数据库引擎
许可协议GNU通用公共许可证(第二版)[2]
网站Percona TokuDB

Percona Server英语Percona ServerMariaDB和基于opmon英语opmonNagios中含有TokuDB。但在Percona Server 8和MariaDB 10.5中,已不推荐使用TokuDB。

分形树索引

编辑

概述

编辑

TokuDB使用一个分形树索引树数据结构保持数据顺序,并允许同时以B树进行搜索和顺序访问,不过其插入和删除操作比B树稍快。分形树还允许将消息注入树中,从而可以于后台在线地进行架构更改(例如添加或删除,添加索引)。[3]如此可以维护更多索引而不降低性能。因为将数据添加到索引较依赖B树的性能,而这在分形树索引中影响不大。[4]

用途

编辑

分形树索引适用于以流数据近实时分析为特征的许多应用程序。它可以用作数据库或文件系统的存储层。在数据库中使用时,可用在任何设置的B树上来提高性能,这包括:网络事件管理,在线广告网络,点击流英语clickstream分析,以及空中交通管制系统。 [5]其他用途包括为社会化媒体网站搜索引擎提高網路爬蟲的性能。这还可用于在线创建索引和列,从而为电子商务个性化的查询提供灵活性。它也适合提高性能并减少交易网站上的现有负载。通常来说,它在必须存储日志文件数据并同时执行热查询的应用程序中表现良好。

起源

编辑

这种高效能的存储系统方法最早是由麻省理工学院[6] [7]、罗格斯大学[8]斯托尼布鲁克大学的研究人员联合开发。 [9]

大数据市场上的作用

编辑

TokuDB的名字来自MySQL中的一项大數據技术。[10]Tokutek是2012年O'Reilly Strata大会上有关大数据的一个初创企业展示赛入围者。[11]

参见

编辑

参考文献

编辑
  1. ^ Release Notes. [2015-10-20]. (原始内容存档于2016-06-23). 
  2. ^ Percona Server COPYING. [2015-12-17]. 
  3. ^ Covering Indexes: Orders-of-Magnitude Improvements (PDF). Percona. [2011-01-17]. (原始内容存档 (PDF)于2009-05-09). 
  4. ^ Detailed review of Tokutek storage engine. Percona. [2012-02-22]. (原始内容存档于2014-07-29). 
  5. ^ Air traffic queries in MyISAM and Tokutek (TokuDB). MySQL Performance Blog. [2011-01-17]. (原始内容存档于2014-08-12). 
  6. ^ How TokuDB Fractal Tree Databases Work. O'Reilly. [2011-01-17]. (原始内容存档于2015-05-14). 
  7. ^ Cache-Oblivious Search Trees Project. Massachusetts Institute of Technology. [2011-01-17]. (原始内容存档于2020-11-11). 
  8. ^ Cache-Oblivious B-trees (PDF). Rutgers University. [2011-01-17]. (原始内容存档 (PDF)于2021-03-04). 
  9. ^ Cache Oblivious B-trees. State University of New York (SUNY) at Stony Brook. [2011-01-17]. (原始内容存档于2012-03-19). 
  10. ^ Big Data is Creating The Future - It's A $50 Billion Market. Forbes. [2012-05-21]. (原始内容存档于2016-03-04). 
  11. ^ Strata 2012 Startup Showcase. O'Reilly. [2012-05-21]. (原始内容存档于2015-09-10). 

外部链接

编辑


📚 Artikel Terkait di Wikipedia

SQL Server Express

CLR等,相當適合使用在小型的網站,或者是小型的桌面型應用程式,它也可以和 SQL Server 整合,作為資料庫複製(英语:Replication (computing)#DATABASE)(Replication)的訂閱端。 SQL Server Express提供了付費的完整版本的多項功能,然而其技術限制使之無法

Occam

sequential processes),例如: PAR p() q() 构造SEQ IF ALT PAR,都是可以通过FOR复制(英语:Replication (computing))的(replicated)。复制的PAR的例子: PAR farmer() PAR i = 0 FOR 4 worker(i)

解决方案堆栈

Ganeti Xen或KVM(虚拟机监视器) 搭配LVM的Linux(大容量存储设备管理) 分布式复制块设备(存储复制(英语:Replication (computing))) Ganeti(英语:Ganeti)(虚拟机集群管理(英语:Cluster manager)工具) Ganeti Web Manager(英语:Ganeti

松耦合

如果系统在时间上是解耦的,那么也很难提供事务完整性(transactional integrity);需要额外的协调协议。跨系统数据复制(英语:Replication (computing))滿足了松耦合性(可用性),但是在维护一致性(英语:Data_consistency)(数据同步)上會出現問題。

复现性

er笔记本,开放科学框架(OSF)也提供了支持可重复研究的平台和工具。 心理学领域已出现对不可重复结果的新一轮关注(见可復現性危機(英语:Replication crisis))。2006年的一项研究发现,在141位APA期刊出版物作者中,有103人(73%)在六个月内未回应数据请求。经济学中,大

Kubernetes

于自动部署、扩展和管理「容器化(containerized)应用程序」的开源系统。該系統由Google设计并捐赠给Cloud Native Computing Foundation(今属Linux基金会)来使用。 它旨在提供“跨主机集群的自动部署、扩展以及运行应用程序容器的平台”。 它支持一系列容器工具,包括Docker等。

代码重复

2011, pp. 250–257. Chen, X., Wang, A. Y., & Tempero, E. D. (2014). A Replication and Reproduction of Code Clone Detection Studies (页面存档备份,存于互联网档案馆). In

无冲突复制数据类型

因此,分布式计算的大部分内容都集中在如何防止复制数据的并发更新问题上。但另一种可能的方法是乐观复制(英语:optimistic replication),即允许所有并发的更新通过,可能会产生不一致的情况,而结果会在以后合并或“解决”。在这种方法中,副本之间的一致性最终会通过不同副本的“合