點擊下載
本文文檔

當前位置：首頁 - 科技 - 知識百科 - 正文

記一次故障診斷:事物回滾

來源：懂視網責編：小采時間：2020-11-09 13:01:18

記一次故障診斷:事物回滾

記一次故障診斷:事物回滾:客戶數據庫運行緩慢，告訴都在等待物理讀事件，遠程連接查看statspack報告 DB Name DB Id Instance Inst Num Release Cluster Host------------ ----------- ------------ -------- ----------- ------- ------

推薦度：

點擊下載本文 文檔為doc格式

導讀記一次故障診斷:事物回滾:客戶數據庫運行緩慢，告訴都在等待物理讀事件，遠程連接查看statspack報告 DB Name DB Id Instance Inst Num Release Cluster Host------------ ----------- ------------ -------- ----------- ------- ------

客戶數據庫運行緩慢，告訴都在等待物理讀事件，遠程連接查看statspack報告 DB Name DB Id Instance Inst Num Release Cluster Host------------ ----------- ------------ -------- ----------- ------- ------------xxxx 259264653 xxxx 1 9.2.0.1.0 NO M S

客戶數據庫運行緩慢，告訴都在等待物理讀事件，遠程連接查看statspack報告

DB Name DB Id Instance Inst Num Release Cluster Host
------------ ----------- ------------ -------- ----------- ------- ------------
xxxx 259264653 xxxx 1 9.2.0.1.0 NO M
 
 Snap Id Snap TIME Sessions Curs/Sess Comment
 ------- ------------------ -------- --------- -------------------
BEGIN Snap: 18 04-12月-14 00:00:03 56 5.2
 
 END Snap: 26 04-12月-14 08:00:06 69 9.1
 
 Elapsed: 480.05 (mins)
 
Cache Sizes (END)
~~~~~~~~~~~~~~~~~
 Buffer Cache: 256M Std Block SIZE: 8K
 Shared Pool SIZE: 600M Log Buffer: 2,048K
 
LOAD Profile
~~~~~~~~~~~~ Per SECOND Per TRANSACTION
 --------------- ---------------
 Redo SIZE: 33,077.28 157,241.29
 Logical reads: 46,175.56 219,507.30
 Block changes: 12,514.78 59,492.17
 Physical reads: 1,582.20 7,521.40
 Physical writes: 79.65 378.62
 USER calls: 41.86 199.01
 Parses: 6.11 29.04
 Hard parses: 0.02 0.07
 Sorts: 9.51 45.23
 Logons: 0.19 0.92
 Executes: 6,285.99 29,882.05
 Transactions: 0.21

這里發現Block changes 高達12000以上，也就是每秒修改的12000塊以上。

Top SQL
邏輯讀

 Buffer Gets Executions Gets per EXEC %Total TIME (s) TIME (s) Hash VALUE
--------------- ------------ -------------- ------ -------- --------- ----------
 802,758,097 15,772 50,897.7 60.4 ######## ######### 827999392
UPDATE "xxx" "A1" SET "col1" = :B1 WHERE "A1"
."col2"=:B2 AND "A1"."col1" IS NULL OR "A1"."col1" <> :B1

物理讀

Physical Reads Executions Reads per EXEC %Total TIME (s) TIME (s) Hash VALUE
--------------- ------------ -------------- ------ -------- --------- ----------
 21,011,968 15,772 1,332.2 46.1 ######## ######### 827999392
UPDATE "xxx" "A1" SET "col1" = :B1 WHERE "A1"
."col2"=:B2 AND "A1"."col1" IS NULL OR "A1"."col1"<>:B1

表空間IO問題
Tablespace

------------------------------
 Av Av Av Av Buffer Av Buf
 Reads Reads/s Rd(ms) Blks/Rd Writes Writes/s Waits Wt(ms)
-------------- ------- ------ ------- ------------ -------- ---------- ------
DATA
 11,721,822 407 1.6 3.2 196,380 7 281 8.7
UNDOTBS1
 7,477,389 260 9.2 1.0 2,088,770 73 37,178 8.0
 
 -------------------------------------------------------------

數據文件

Tablespace Filename
------------------------ ----------------------------------------------------
 Av Av Av Av Buffer Av Buf
 Reads Reads/s Rd(ms) Blks/Rd Writes Writes/s Waits Wt(ms)
-------------- ------- ------ ------- ------------ -------- ---------- ------
DATA D:\ORACLE\ORA92\xxx\xxxxxx.ORA
 5,839,496 203 1.9 3.2 118,428 4 46 8.7
 D:\ORACLE\ORA92\xxx\xxxxx.ORA
 5,882,326 204 1.4 3.3 77,952 3 235 8.7
 
UNDOTBS1 D:\ORACLE\ORA92\xxxx\UNDOTBS01.DBF
 7,477,389 260 9.2 1.0 2,088,770 73 37,178 8.0
 
 
 
 -------------------------------------------------------------

從上面可以看出Tablespace data、undotbs1的IO使用比較嚴重，嚴重了上面的update語句導致。
查看下undo的使用

ROLLBACK Segment Storage FOR DB: FSJZ Instance: fsjz Snaps: 18 -26
->Optimal SIZE should be larger than Avg Active
 
RBS No Segment SIZE Avg Active Optimal SIZE Maximum SIZE
------ --------------- --------------- --------------- ---------------
 0 385,024 6,553 385,024
 1 35,774,464 1,003,908 129,097,728
 2 10,608,640 996,987 75,620,352
 3 13,819,904 772,807 18,997,248
 4 5,365,760 1,355,300 14,802,944
 5 8,511,488 5,457,853 3,885,096,960
 6 4,183,941,120 2,771,161,530 4,252,098,560
 7 5,365,760 619,248 10,608,640
 8 14,802,944 7,010,756 21,094,400
 9 3,268,608 2,908,152 22,142,976
 10 4,317,184 567,499 4,317,184
 -------------------------------------------------------------

上面的信息可以得出6號undo段已經使用了4G。
查看事物開始時間

會話的信息

SELECT
 --t.xid xid
 s.sid sid
 , t.inst_id
 , p.spid
 , s.STATUS
 , t.start_time
 , t.STATUS transaction_status
 , t.SPACE
 , t.recursive
 , t.noundo
 , t.ptx
 , ROUND((t.used_ublk * p.VALUE)/1024/1024) used_undo
 , t.log_io
 , t.phy_io
 , t.cr_get
 , s.username
 , s.osuser
 --, s.sql_id
 --, s.sql_child_number
 , s.program
FROM gv$transaction t
 INNER JOIN gv$session s ON t.inst_id = s.inst_id AND t.ses_addr = s.saddr
 INNER JOIN gv$process p ON p.inst_id = s.inst_id AND p.addr = s.paddr
ORDER BY t.start_time
;

undo_1

從上面來看這個事物的Undo使用達到了17G

查看Update 語句的執行計劃

	SQL> EXPLAIN plan FOR
 2 UPDATE xxxxx."xxxxxxxxxxxxxxxxx" "A1"
 3 SET "col2" = '1'
 4 WHERE "A1" ."col2"=96
 5 AND "A1"."col1" IS NULL
 6 OR "A1"."col1"<>'0'
 7 ;
 
已解釋。
 
 
SQL> SELECT * FROM TABLE(dbms_xplan.display());
 
PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------
 
 
---------------------------------------------------------------------------
| Id | Operation | Name | ROWS | Bytes | Cost |
---------------------------------------------------------------------------
| 0 | UPDATE STATEMENT | | | | |
| 1 | UPDATE | xxxxxxxxxxxxxxxxx | | | |
|* 2 | TABLE ACCESS FULL | xxxxxxxxxxxxxxxxx | | | |
---------------------------------------------------------------------------
 
Predicate Information (IDENTIFIED BY operation id):
---------------------------------------------------
 
PLAN_TABLE_OUTPUT
------------------------------------------------------------------------------
 
 
 2 - FILTER("A1"."col2"=96 AND "A1"."col1" IS NULL OR "A
 1"."col1"<>'0')
 
Note: rule based optimization

已選擇16行。
這里得知SQL走的全表掃，仔細查看SQL 發現

《AND "A1"."col1" IS NULL OR "A1"."col1"<>'0'》

這兩個條件應該增加括號，否則會oracle會找到col1不等于某個值的所有結果進行更新。

手工KILL掉這個進程后，數據庫事物回滾異常緩慢

查看數據庫參數

SQL> SHOW parameter cpu_count
 
NAME TYPE VALUE
------------------------------------ ----------- ------------------------
cpu_count INTEGER 16
SQL> SHOW parameter fast_start
 
NAME TYPE VALUE
------------------------------------ ----------- ------------------------
fast_start_parallel_rollback string LOW
SQL> SHOW parameter parallel_max
 
NAME TYPE VALUE
------------------------------------ ----------- ------------------------
parallel_max_servers INTEGER 5

fast_start_parallel_rollback參數是加快回滾速度，這個參數默認是low，即2倍cpu數的并發度，進行并發的回滾。這個參數可以設置成high，即為4倍cpu數的并發度進行回滾。
如果設置了此參數為high或low，也就是4倍或2倍的cpu數，也會受到另外一些參數的影響，如PARALLEL_MAX_SERVERS，這個才是真正最大的并發度設置。
PARALLEL_MAX_SERVERS這個參數的默認值為PARALLEL_THREADS_PER_CPU * CPU_COUNT * concurrent_parallel_users * 5。PARALLEL_THREADS_PER_CPU 和CPU_COUNT都是初始化參數。

在一般情況下，并發的回滾總是比串行的快，但是當并發的子進程之間存在資源沖突的情況。
在并發子進程之間需要的資源沖突時，往往此時smon的等待事件是長期處于

Wait for stopper event to be increased

而子進程的等待事件是較多出現

Wait for a undo record。

此時，就是子進程沖突了。并發的回滾速度反而不如串行的回滾速度。

查詢數據庫得知現在最大并行進程設置5，遠遠不夠并行恢復需要的進程。查看smon進程等待事件時，竟然沒有記錄。

通過關閉并行進程恢復，提高恢復速度

ALTER system SET fast_start_parallel_rollback=FALSE;

查看恢復進度

SQL> DECLARE
 2 l_start NUMBER;
 3 l_end NUMBER;
 4 BEGIN
 5 SELECT ktuxesiz INTO l_start FROM x$ktuxe WHERE KTUXEUSN=6 AND KTUXESLT=46;
 6 dbms_lock.sleep(60);
 7 SELECT ktuxesiz INTO l_end FROM x$ktuxe WHERE KTUXEUSN=6 AND KTUXESLT=46;
 8 dbms_output.put_line('time est Day:'|| round(l_end/(l_start -l_end)/60/24,2));
 9 END;
 10 /
TIME est DAY:.14
 
SQL> SELECT 0.14*24 FROM dual
 2 ;
 
 0.14*24
----------
 3.36

大體評估事務回滾需要3.36個小時

原文地址：記一次故障診斷:事物回滾, 感謝原作者分享。

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

記一次故障診斷:事物回滾

推薦度：

點擊下載本文 文檔為doc格式

標簽：客戶一次告訴

熱門焦點

記一次故障診斷:事物回滾

記一次故障診斷:事物回滾

記一次故障診斷:事物回滾

最新推薦

猜你喜歡

熱門推薦