sql server 任务调度与CPU

澳门新浦京娱乐游戏 5

这部分会在第 7章中详细介绍。当一个应用程序成功与 SQL Server
建立联系之后,会有一个会话 ID 与这个连接相关联,可以通过查询
sys.dm_exec_sessions 这个 DMV
来获取当前所有已授权的会话列表。当一个会话发出一个请求时, SQLServer
会把这个请求拆分一个或多个任务,然后关联对应个数的工作者线程,每个线程都会有如下
3个状态。

第三章 High CPU Utilization.

 

1)
running。一个处理器在某个时刻只能做一件事情,当一个线程正在一个处理器上运行时,这个线程的状态就为
running。

CPU使用率过高问题很容易被发现,但是诊断却不是很容易。CPU使用过高很多时候会成为其它问题的替罪羊,所以在确认和故障诊断时要抽丝剥茧。

一. 概述

    我们知道在操作系统看来, sql
server产品与其它应用程序一样,没有特别对待。但内存,硬盘,cpu又是数据库系统最重要的核心资源,所以在sql
server
2005及以后出现了SQLOS,这个组件是sqlserver和windows的中间层,用于CPU的任务调度,解决I/O的资源争用,协调内存管理等其它的资源协调工作。下面我来试着讲讲SQLOS下的Scheduler调度管理。

2) suspended。如果在 SQL Server
的一个线程中进行协同操作的调度需要运行起来,而此时 SQL Server
没有足够的资源,那么线程会放弃当前占有的处理器,变成挂起状态,等待这个协同操作运行结束。这种状态在
SQLServer 中也叫等待。

调查CPU压力

二. CPU 的配置

    在Sql server
里点击数据库实例右键到属性,选择处理器进行配置。最大工作线程数的默认值是0
注意这里配置的是worker它是对CPU的真正封装)。这使得SQL
Server能够在启动时自动配置工作线程的数量。默认设置对于大多数系统是最好的。但是,根据您的系统配置,将最大工作线程数设置为一个特定的值有时会提高性能。当查询请求的实际数量小于最大工作线程数时,一个线程处理一个查询请求。但是,如果查询请求的实际数量超过最大线程量时,SQLServer会将Worker
Threads线程池化,以便下一个可用的工作线程可以处理请求。

      配置如下图所示:

     
  澳门新浦京娱乐游戏 1

          也可以通过T-sql配置,下例通过sp_configure将max
worker线程选项配置为900

USE AdventureWorks2012 ; GO EXEC sp_configure 'show advanced options', 1; GO RECONFIGURE ; GO EXEC sp_configure 'max worker threads', 900 ; GO RECONFIGURE; 

    Max Worker Threads服务器配置选项不考虑的线程, 像高可用、Service
Broker、 Lock
管理等其它。如果配置的线程数量超过了,下面的查询将提供关于系统任务产生的额外线程信息

       is_user_process = 0 表示系统任务,非用户任务。

SELECT s.session_id, r.command, r.status, r.wait_type, r.scheduler_id, w.worker_address, w.is_preemptive, w.state, t.task_state, t.session_id, t.exec_context_id, t.request_id FROM sys.dm_exec_sessions AS s INNER JOIN sys.dm_exec_requests AS r ON s.session_id = r.session_id INNER JOIN sys.dm_os_tasks AS t ON r.task_address = t.task_address INNER JOIN sys.dm_os_workers AS w ON t.worker_address = w.worker_address WHERE s.is_user_process = 0;

    下面显示每个用户的活动会话数

SELECT login_name ,COUNT(session_id) AS session_count FROM sys.dm_exec_sessions WHERE status<>'sleeping'GROUP BY login_name; 

    下表显示了各种CPU和SQLServer组合的最大工作线程的自动配置数量。

Number of CPUs

32-bit computer

64-bit computer

<= 4 processors

256

512

8 processors

288

576

16 processors

352

704

32 processors

480

960

64 processors

736

1472

128 processors

4224

4480

256 processors

8320

8576

    

  根据微软的建议:这个选项是一个高级选项,应该只由经验丰富的数据库管理员或经过认证的SQL
Server专业人员更改。如果您怀疑存在性能问题,则可能不是工作线程的可用性。原因更像是I/O,这会导致工作线程等待。在更改最大工作线程设置之前,最好找到性能问题的根本原因。

3) runnable。如果一个线程已经完成等待,但是还没有轮到它运行,就会变成
runnable状态,代表已经准备好被执行。这种叫信号等待。

三个主要的工具:性能监视器,SQLTrace,DMV.

二.调度原理

如果当前 SQL Server
已经没有可用的工作者线程,并且最大工作线程数还没达到,那么会分配一个新的工作线程。如果最大线程已经达到,那么这个任务会变成等待状态,这个等待类型叫作
threadpool,直到有可用的线程为止。默认的最大线程数是基于 CPU
体系和逻辑核心数的。下面是逻辑 CPU
格式在不同位数的操作系统中能支持的最大工作者线程数。

     性能监视器:首先用它来确认是SQL
Server还是其它进程使用了过多的CPU。主要计数器有:

  2.1 Scheduler任务调度

              Sqlserver
的一个Scheduler对应操作系统上的一个逻辑CPU用于任务分配。调度分配从NUMA节点级别开始。基本算法是一个用于新连接的循环调度。当每个新的连接到达时,它被分配给基于循环的调度器。在相同的NUMA节点内,以最小的负载因子分配给调度器的新连接。

1)对于 32 位操作系统:

                     Processor/ %Privileged Time
:在特权模式下进程线程执行代码所花时间的百分比。基本可以认为是Windows核心使用的CPU
                     Processor/ %User Time
:处理器处于用户模式的时间百分比。应用程序的使用的CPU。
                     Process (sqlservr.exe)/ %Processor Time
:SQLServer.exe线程使用处理器执行指令所花的时间百分比。

澳门新浦京娱乐游戏,  2.2  Worker

     Worker又称为WorkerThread,每个Worker跟一个线程,是Sql
server任务的执行单位。 多个Worker对应一个Scheduler,公式Workers=max
worker threads/onlines
scheduler。在一个Scheduler上,同一时间只能有一个Worker运行。例如4个处理器的64位操作系统,它的每个Scheduler的Worker是512/4=128。

总可用逻辑 CPU=4 时,最大工作者线程 =256。

                     还有一些与SQL Server相关CPU消耗的计数器:

  2.3  Task

    在Worker上运行的最小任务单元。最简单的Task就是一个简单的Batch,当一个会话发出一个请求时,Sql
server会把这个请求拆分一个或多个任务(Tasks),然后关联对应个数的工作者线程(worker
thread)。

              例如下面是二个Task
,二个Task可能不是同一个Worker。二个Worker也可能不是同一个Scheduler.    
       

select @@servernameGoselect getdate()GO

   每个Task线程都有3个状态:

    Running:
一个处理器在某个时间只能做一件事情,当一个线程正在一个处理器上运行时,这个线程的状态就是running。

    Suspended:
没有足够资源时,当前线程放弃占有处理器,变成挂起状态。

    Runnable:
一个线程已完成了等待,但还没有轮到它运行,就会变成runnable状态,这种信号等待(signal
wait)

总可用逻辑 CPU4 时,最大工作者线程 =256+ × 8)。

                     SQLServer:SQL Statistics/Auto-Param Attempts/sec
                     SQLServer:SQL Statistics/Failed Auto-params/sec
                     SQLServer:SQL Statistics/Batch Requests/sec
                     SQLServer:SQL Statistics/SQL Compilations/sec
                     SQLServer:SQL Statistics/SQL Re-Compilations/sec
                     SQLServer:Plan Cache/Cache hit Ratio

  2.4 Yielding

               
Yelding就是所有逻辑scheduler上运行的Worker都是非抢占式的,
在 Scheduler上Worker由于资源等待,让出给其它Worker就叫Yielding。

    下面讲述几种发生的状态:

    1. 当Woker在Scheduler上运行了超过4ms,就做Yielding。

    2. 每做64k的结果集的排序,就会做一次Yielding。

    3.
做语句Complie编译的过程中,这个过程比较占CPU资源时,经常会有Yielding等。

2)对于 64 位操作系统:

       SQLTrace:
通过Profiler生成SQLTrace脚本,进行服务器端跟踪,来获得高CPU使用时详细信息。

  2.5 调度关系图如下:

           
  澳门新浦京娱乐游戏 2

总可用逻辑 CPU=4 时,最大工作者线程 =512。

              DMV:a. 使用sys.dm_os_wait_stats来得到signal
wait,确认CPU压力的程度.

  2.5  Task在调度运行图如下:

             
 澳门新浦京娱乐游戏 3  

  1. 当 Task 是Runnig时,它是Schedler的活动Worker。
  2. 当 Task只等待CPU运行时,它被放入Schedler可运行的队列中。
  3. 当 Task
    在等待某个资源时(比如锁、磁盘输入/输出等)时,它处于“Suspended挂起状态”
    状态。
  4. 如果Task Scheduler挂起状态完成了等待,那么它就会被放到Scheduler
    的Runnable队列的末尾。
  5. 如果运行线程自动Yidlding让步,则将其放回Scheduler
    的Runnable队列的末尾。
    6.
    如果运行的线程需要等待某个资源,它将被调出Scheduler调度器并进入挂起状态Waiter
    list。
    7.
    如果正在运行的线程完成它的工作,那么Runnable队列的顶部的第一个线程就变成了“运行”线程。

    

总可用逻辑 CPU4 时,最大工作者线程 =512+ × 16)。

                       b.
使用sys.dm_os_wait_stats和sys.dm_os_schedulers观察等待类型

三. 使用dmv任务查看

   3.1.  通过sys.dm_os_sys_info 查看scheduler与cpu的关系如下:

 SELECT cpu_count,max_workers_count,scheduler_count FROM sys.dm_os_sys_info

  澳门新浦京娱乐游戏 4

  3.2  查看最大Worker数  

select max_workers_count from sys.dm_os_sys_info  

  3.3  查看Task与Worker关系

--在每一个连接里,我们可能会有很多batch,分解成多个task以支持如并行查询 select task_address,task_state,scheduler_id,session_id,worker_address from sys.dm_os_tasks where session_id>50select state,last_wait_type,tasks_processed_count,task_address, worker_address, scheduler_address from sys.dm_os_workers where worker_address =0x00000000043621A0

 澳门新浦京娱乐游戏 5

  3.4 查看Scheduler

--scheduler_id<255 代表用户CPU,相反代表SYSTEM SCHEDULERSELECT scheduler_id, cpu_id, is_online, current_tasks_count, runnable_tasks_count, current_workers_count, active_workers_count, work_queue_count FROM sys.dm_os_schedulers WHERE scheduler_id < 255

  cpu_id:关联的cpu 。 CPU ID  >=255
这类Scheduler都用于系统内部使用。比如说资源管理、DAC、备份还原操作等。

   is_online: 0 调度器离线,1 在线。

  current_tasks_count:当前任务数,状态包括:(等待,运行,已完成)。

  runnable_tasks_count:以分配任务,并在可运行队列中等待被调度的任务数,使用率不高的情况下,这个值会是0。

  current_workers_count:此scheduler关联的线程数。包括处于空闲状态的线程work。

  active_workers_count:当前处理活动的线程数,它必须关联任务task,包括running,runnable,suspend。

  work_queue_count:队列中的任务task等待数,如果不为0,意味着线程用尽的压力。

       讲到这里,后面讲讲CPUf过高的分析…

 

参考文献:

  Troubleshooting SQL Server Scheduling and Yielding

  Microsoft SQL Server企业级平台管理实践

  How It Works: SQL Server 2012 Database Engine Task Scheduling

 

还有一个比较简单的方法可用于检查当前系统的最大线程数。比如执行下面的脚本:

                       c.
使用sys.dm_exec_query_stats和sys.dm_exec_sql_text找出高CPU使用的执行计划和对应的查询

SELECTmax_workers_countFROMsys.dm_os_sys_info

                       d.
使用sys.dm_os_waiting_tasks观察当前与CPU使用相关等待类型

通常出现 threadpool 类型的等待意味着当前有大量并行执行计划,或者遇到了
CPU
瓶颈,但是不管是什么情况,都需要经常检查这部分的数据,以确保有足够的线程可用。对于每个工作线程,在
64 位系统中都要消耗 2MB 的内存,在 32 位系统需要消耗 0.5MB 的内存,所以
SQL Server 只会在需要的时候才创建工作线程。这部分的信息可以通过
sys.dm_os_workers 这个 DMV 来查看。

                       e.
使用sys.dm_exec_requests正在执行的查询的资源使用状况

SELECTCOUNT(*)FROMsys.dm_os_workers

 

调度在 SQL Server 中显示为 Scheduler。每个线程会与一个调度关联, SQL
Server 上可用的调度数量等于 SQL Server 上可用的逻辑 CPU
数量加上一个额外的专用管理员连接。这部分的信息可以从
sys.dm_os_schedulers 这个 DMV 中查询。会话、任务、线程、调度和逻辑 CPU
之间的关系如图 3-7所示。

调查CPU相关的等待统计:请求执行前,包含请求的会话必需等待,SQL
Server会记录等待原因和时间。通过sys.dm_os_wait_stats查询这些信息。

由于 Windows
需要支持多种甚至所有应用软件,所以不会对上面的应用做出什么优先级排名,而
SQL Server 本质上和 Office 甚至画图软件一样,都只是 Windows
上的一个应用,所以 SQL Server 不会有多大的特权。因此 SQL Server
在协同操作过程中可能会被暴力地剥夺处理权,形成等待状态,这部分在第
7章详细介绍。

     信号等待时间(Signal wait
time):sys.dm_os_wait_stats的wait_time_ms表示等待类型的总共等待时间,signal_wait_time_ms表示线程收到段义和到重新执行间的等待时间,

                                              
这些时间主要花在runnable队列里,是纯CPU等待。

    
通过以下查询得到信号等待的时间比率:

SELECT  SUM (signal_wait_time_ms) AS TotalSignalWaitTime , 
         ( SUM (CAST(signal_wait_time_ms  AS NUMERIC(20, 2)))  
           / SUM (CAST(wait_time_ms AS NUMERIC(20, 2)))  * 100  ) 
                         AS PercentageSignalWaitsOfTotalTime 
FROM    sys .dm_os_wait_stats

     也可以查询各类资源等待的比率,下面是等待top 10:

SELECT TOP ( 10 ) 
        wait_type , 
        waiting_tasks_count , 
         ( wait_time_ms - signal_wait_time_ms ) AS resource_wait_time  , 
        max_wait_time_ms , 
         CASE waiting_tasks_count  
           WHEN 0  THEN 0 
           ELSE wait_time_ms / waiting_tasks_count  
         END  AS avg_wait_time 
FROM    sys .dm_os_wait_stats 
WHERE    wait_type NOT  LIKE '%SLEEP%'    -- remove eg. SLEEP_TASK and 
                                        -- LAZYWRITER_SLEEP waits 
         AND  wait_type NOT  LIKE 'XE%'  
         AND  wait_type NOT  IN -- remove system waits    
( 'KSOURCE_WAKEUP', 'BROKER_TASK_STOP', 'FT_IFTS_SCHEDULER_IDLE_WAIT' , 
  'SQLTRACE_BUFFER_FLUSH', 'CLR_AUTO_EVENT', 'BROKER_EVENTHANDLER', 
  'BAD_PAGE_PROCESS', 'BROKER_TRANSMITTER' , 'CHECKPOINT_QUEUE', 
  'DBMIRROR_EVENTS_QUEUE', 'SQLTRACE_BUFFER_FLUSH', 'CLR_MANUAL_EVENT', 
  'ONDEMAND_TASK_QUEUE', 'REQUEST_FOR_DEADLOCK_SEARCH' , 'LOGMGR_QUEUE', 
  'BROKER_RECEIVE_WAITFOR' , 'PREEMPTIVE_OS_GETPROCADDRESS', 
  'PREEMPTIVE_OS_AUTHENTICATIONOPS', 'BROKER_TO_FLUSH'  ) 
ORDER  BY wait_time_ms DESC 

与CPU相关的等待类型主要有SOS_SCHEDULER_YIELD,CXPACKET和CMEMTHREAD

    SOS_SCHEDULER_YIELD: SQL
Server计划程序是协同的多任务计划程序。查询占用一小段时间的CPU后自发地让出CPU给后面的查询,

                                     
并且回到可运行队列等待重新被运行,这种等待就是SOS_SCHEDULER_YIELD。

                                     
如果此等待时间在sys.dm_exec_requests或者sys.dm_os_waiting_tasks过多,则表示有高CPU使用的查询需要优化或者需要增加CPU。

   
CXPACKET:多处理器运行并行查询时,当同步多个线程间的查询处理器交换迭代器时出现。

   
CMEMTHREAD:等待同步内存对象。有些内存对象是不请允许并发访问的,当多个线程试图访问此内存对象时,就会等待。

   调查计划程序队列(scheduler
queues)
:scheduler_id<255的是隐藏的系统计划程序,如DAC,备份等。

SELECT  scheduler_id  , 
        current_tasks_count, 
        runnable_tasks_count
FROM    sys.dm_os_schedulers
WHERE    scheduler_id < 255

     
current_task_count表示每个计划程序上的任务数,runnable_task_count表示runnable队列中等待CPU的任务。

 

找出高CPU消耗的查询

     
主要使用sys.dm_exec_query_stats和sys.dm_exec_sql_text。下面是占用CPU时间的TOP
10查询:

SELECT TOP ( 10 ) 
         SUBSTRING(ST.text, ( QS .statement_start_offset / 2  ) + 1, 
                  ( ( CASE statement_end_offset 
                         WHEN -1 THEN DATALENGTH (st.text) 
                         ELSE QS .statement_end_offset  
                       END  - QS .statement_start_offset ) / 2  ) + 1) 
                  AS statement_text , 
        execution_count  , 
        total_worker_time / 1000 AS total_worker_time_ms  , 
         ( total_worker_time / 1000 ) / execution_count 
                  AS avg_worker_time_ms  , 
        total_logical_reads , 
        total_logical_reads / execution_count  AS avg_logical_reads , 
        total_elapsed_time  / 1000 AS total_elapsed_time_ms , 
         ( total_elapsed_time  / 1000 ) / execution_count 
                  AS avg_elapsed_time_ms , 
        qp .query_plan  
FROM    sys .dm_exec_query_stats qs  
         CROSS  APPLY  sys .dm_exec_sql_text(qs.sql_handle ) st  
         CROSS  APPLY  sys .dm_exec_query_plan(qs.plan_handle) qp  
ORDER  BY total_worker_time DESC

值得注意的是有些情况下缓存计划是会被清除的,如内存压力,数据库状态改变等。使用了with
recompile的SP和option (recompile)提示的语句不会缓存执行计划。

当查询因为某些原因被重编译(统计信息改变,架构改变等),如果经常发生,则会让执行时间统计变得不准确。所以最好是每隔一段时间抓取缓存计划信息,然后汇总对比。

You can leave a response, or trackback from your own site.

Leave a Reply

网站地图xml地图