SQL Server 2011中基于列的存储方式

数据库 SQL Server
从SQL Server 2011开始,微软为我们提供了第三种选择。SQL Server会提供一种“列存储索引”,从而以列而不是行的方式来存储数据。

和大多数主流数据库一样,如果表拥有聚集索引,那么SQL Server就会以B-树的方式存储,否则就会使用堆的方式存储。这两种方法本质上都是基于行的,其中每页中行的条数会根据总体上行的大小不同而不同。从SQL Server 2011开始,微软为我们提供了第三种选择。SQL Server会提供一种“列存储索引”,从而以列而不是行的方式来存储数据。

  当使用数据规模为1TB、记录条数为十四亿四千万的表时,微软声称基于列的查询在CPU时间上会有16倍的提升,而在使用时间上会有455倍的提高。在真实情况下,这意味着本来要耗费501秒的查询,现在只需要1.1秒就可以完成了。这项测试是在拥有32个逻辑处理器和256GB内存的计算机上执行的。

  微软把每个列都隔离在自身的一组页中,从而达到了这种惊人的改善。当执行查询的时候,只会从磁盘载入位于结果集中的列。而包含其它列的页会被忽略。

  这种方法相当于为每种我们所能想象到的列组合创建替代索引。然而,这种方式不会消耗大量的磁盘空间,它实际上会比传统的表占用更小的空间。由于SQL Server的压缩会发生在页级别上,并且和行相比,列中的数据更容易重复,所以使用列存储索引的表将会拥有更高的压缩等级。

  但暂时我们还不能轻易决定使用列存储索引。首先也是最重要的,它们是不可更新的。一旦创建了列存储的索引,那么就不允许在表上执行插入、更新或者删除等操作了。微软期望更多商店每天对数据进行刷新,否则就需要把数据做只读处理。在刷新周期中,我们会删除索引,更新数据,然后再重新建立索引。由于这肯定是代价昂贵的操作,所以我们可以使用垂直分区来把操作限制到逻辑表的子集范围内。

  使用列存储的索引也会导致性能的降低。如果你使用大多数列,那么重新组合行会耗费大量的资源。这意味着OLTP样式的查询应该避免这种方式,而对于OLAP形式的查询,这种方式会比较有利。或者换句话说,如果你在编写“SELECT *”或者每次抓取一行数据,那么列存储索引就不适合你。

【编辑推荐】

  1. 浅析SQL Server 2008中的代码安全之三:通过PassPhrase加密
  2. 浅析SQL Server 2008中的代码安全之四:主密钥
  3. 浅析SQL Server 2008中的代码安全之五:非对称密钥加密
  4. 浅析SQL Server 2008中的代码安全之六:对称密钥加密
  5. 浅析SQL Server 2008中的代码安全之七:证书加密

 

责任编辑:艾婧 来源: ITPUB
相关推荐

2010-07-05 15:12:30

SQL Server主

2010-11-11 09:51:46

SQL Server添

2010-09-06 11:57:33

sql server语句

2010-10-19 17:09:27

sql server标

2010-11-12 09:18:13

SQL Server存

2010-09-03 10:52:10

SQL删除

2010-07-14 17:37:33

SQL Server

2011-08-15 15:56:31

SQL Server

2011-03-24 13:38:47

SQL Server 存储分页

2010-07-22 10:38:12

SQL Server所

2010-09-06 11:24:32

SQL Server语句

2010-07-13 14:42:02

SQL Server

2011-09-01 16:13:37

Visual StudSQL Server 存储过程

2010-07-13 10:28:41

SQL Server

2011-04-08 09:53:45

Accesssql server存储翻页

2009-08-06 16:44:06

2010-09-03 15:08:03

SQLselect语句

2010-11-11 11:56:39

SQL Server标

2010-07-15 12:38:14

SQL Server存

2011-07-25 15:17:50

SQL SERVER数
点赞
收藏

51CTO技术栈公众号