iis服务器助手广告广告
返回顶部
首页 > 资讯 > 数据库 >SQL Server聚合函数算法优化技巧是什么
  • 322
分享到

SQL Server聚合函数算法优化技巧是什么

2024-04-02 19:04:59 322人浏览 泡泡鱼
摘要

今天就跟大家聊聊有关SQL Server聚合函数算法优化技巧是什么,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。sql server聚合函数在实际工

今天就跟大家聊聊有关SQL Server聚合函数算法优化技巧是什么,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。

sql server聚合函数在实际工作中应对各种需求使用的还是很广泛的,对于聚合函数的优化自然也就成为了一个重点,一个程序优化的好不好直接决定了这个程序的声明周期。Sql server聚合函数对一组值执行计算并返回单一的值。聚合函数对一组值执行计算,并返回单个值。除了 COUNT 以外,聚合函数都会忽略空值。 聚合函数经常与 SELECT 语句的 GROUP BY 子句一起使用。

一.写在前面

所有数据演示都是用Microsoft官方示例数据库:Northwind,至于Northwind大家也可以在网上下载。

二.Sql server标量聚合

2.1.概念:在只包含聚合函数的 SELECT 语句列列表中指定的一种聚合函数(如 MIN()、MAX()、COUNT()、SUM() 或 AVG())。当列列表只包含聚合函数时,则结果集只具有一个行给出聚合值,该值由与 WHERE 子句谓词相匹配的源行计算得到。

2.2.探索标量聚合:

我们先用Sql server的"包括实际的执行计划"来看看一个简单的流聚合COUNT()来看看表里数据所有的行数。

再通过SET SHOWPLAN_ALL ON(关于输出中包含的列更多信息可以在链接中查看)来看看有关语句执行情况的详细信息,并估计语句对资源的需求。

通过SET SHOWPLAN_ALL ON我们来看看COUNT()具体做了那些事情:

索引扫描:扫描当前表的行数  流计算:计算行数的数量  计算标量:将流计算出来的结果转化为适当的类型。(因为索引扫描出来的结果是根据表中数据的大小决定的,如果表中数据很多的话,COUNT是int类型就会有问题,所以在最终返回的时候需要将默认类型(数值一般默认类型是Big)转成int类型。)  小结:通过SET SHOWPLAN_ALL ON我们可以查看Sql server聚合函数在给我们呈现最终效果的时候,为这个效果做了些什么事情。

2.3.标量聚合优化技巧:

我们通过两个比较简单的sql查询来看看他们的区别

 代码如下: 

SELECT COUNT(DISTINCT ShipCity) FROM OrdersSELECT COUNT(DISTINCT OrderID) FROM Orders

从上图中可以看到,其实这两个查询从语句上来说没什么太大的区别,但是为什么开销会不一样,一个是查询城市一个是查询订单号。这是因为其实DISTINCT对于OrderID查询来说,是没有什么意义的,因为OrderID是主键,是不会有重复的。而ShipCity是会有重复的,Sql server的去重机制在去重的时候,会有一个排序的过程。这个排序还是比较消耗资源的。

对于数据量比较大的表其实不是很建议对大表排序或者对大表的某个重复次数多的字段去重运算。所以我们这里可以对ShipCity进行优化一下。可以对ShipCity创建一个非聚集索引。

 代码如下: 

CREATE INDEX Index_ShipCity On Orders(ShipCity desc)Go

从上图中可以看到,加了索引以后COUNT(DISTINCT ShipCity)的查询变成了两个流聚合,而没有了排序,节省了开销。

总结:对于标量聚合从上面的例子大家可以看到,标量聚合优缺点很明显:

Sql server标量聚合优点:算法比较简单直观,适合非重复值的聚合操作。Sql server标量聚合缺点:性能较差(需要排序),不适合重复值的聚合操作。  优化技巧:尽量避免排序产生,将分组字(GROUP BY)段定在索引覆盖范围内

三.Sql server哈希聚合

3.1.概念:

哈希(Hash,一般翻译做“散列”,也有直接音译为“哈希”的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。)

哈希聚合的内部实现方法和哈希连接的实现机制一样,需要哈希函数的内部运算,形成不同的哈希值,依次并行扫描数据形成聚合值。

3.2.背景:

为了解决流聚合的不足,应对大数据的操作,所以哈希聚合就诞生了。

3.3.分析:

来看看两个简单的查询。

ShipCountry和CustomerID的分组查询看上去很类似,但是为什么执行计划会不同呢?这是因为ShipCountry包含了大量的重复值,CustomerID重复值非常少,所以Sql server系统给ShipCountry推送的哈希聚合,而CustomerID推送的是流聚合。也就是说Sql server系统会动态的根据查询的情况选择合适的聚合方式。所以我们在做SQL优化的时候不能仅根据SQL语句来优化,还得结合具体数据分布的环境。

四.运算过程监控指标

4.1.监控元素:

可视化查看运行时间T-sql语句查询时间占用内存T-sql语句查询io

4.2.可视化查看运行时间:

4.3.T-sql语句查询时间:

4.4.占用内存:

4.5.T-sql语句查询IO:

关于监控元素还有很多,这里就列举几个。

看完上述内容,你们对SQL Server聚合函数算法优化技巧是什么有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注编程网数据库频道,感谢大家的支持。

您可能感兴趣的文档:

--结束END--

本文标题: SQL Server聚合函数算法优化技巧是什么

本文链接: https://www.lsjlt.com/news/68958.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • SQL Server聚合函数算法优化技巧是什么
    今天就跟大家聊聊有关SQL Server聚合函数算法优化技巧是什么,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。Sql server聚合函数在实际工...
    99+
    2022-10-19
  • SQL Server中的聚合函数是什么
    小编给大家分享一下SQL Server中的聚合函数是什么,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!SQL Server中的聚合函数有:1、AVG;2、COUNT;3、MAX;4、SUM...
    99+
    2022-10-18
  • 优化SQL Server索引的技巧是什么样的
    本篇文章给大家分享的是有关优化SQL Server索引的技巧是什么样的,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。影响到数据库性能的最大因素就是索引。由于该问题的复杂性,我只...
    99+
    2023-06-05
  • Java编程中的算法优化技巧是什么?
    随着计算机科学的不断发展,算法优化已经成为了计算机程序设计中不可或缺的一部分。在Java编程中,我们也可以通过一些技巧来优化算法,提高程序的性能和效率。本文将为大家介绍一些Java编程中的算法优化技巧。 一、使用合适的数据结构 在Java...
    99+
    2023-09-25
    编程算法 laravel 对象
  • Go编程中的路径查找算法:使用NumPy优化性能的技巧是什么?
    路径查找算法在计算机科学中是一个重要的话题,它可以用于寻找两个点之间最短的路径,或者在一个图中找到一些特定的路径。在Go编程中,我们经常需要使用路径查找算法来解决许多问题,如搜索引擎排名、机器学习等。本文将介绍一些常用的路径查找算法,并讨...
    99+
    2023-09-01
    编程算法 numpy path
  • load 函数在 ASP 编程中的异步编程算法是什么,如何优化?
    ASP 是一种常用的 Web 应用程序框架,它允许开发人员通过 ASP.NET 语言编写动态的 Web 应用程序。其中,load 函数是 ASP 编程中的一种异步编程算法,它在处理大量数据时尤为有效。在本文中,我们将详细探讨 load 函数...
    99+
    2023-07-25
    编程算法 load 异步编程
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作