摘要:GaussDB(DWS)查詢過濾器(黑名單)提供查詢過濾功能,支持自動隔離反復被終止的查詢,防止爛SQL再次執(zhí)行。
本文分享自華為云社區(qū)《GaussDB(DWS)查詢過濾器原理與應用》,作者:門前一棵葡萄樹 。
【資料圖】
GaussDB(DWS)查詢過濾器(黑名單)提供查詢過濾功能,支持自動隔離反復被終止的查詢,防止爛SQL再次執(zhí)行。
主要應用場景包含以下兩種:
1. 異常熔斷機制
配置異常規(guī)則后,查詢觸發(fā)異常規(guī)則后,異常信息將被記錄在dbms_om.gs_blocklist_query系統(tǒng)表中。同一個查詢觸發(fā)異常規(guī)則次數超限(query_exception_count_limit)后,查詢自動加入黑名單,黑名單信息同樣保存在dbms_om.gs_blocklist_query系統(tǒng)表中。加入黑名單后,該查詢將被隔離,拒絕執(zhí)行。
2. 緊急攔截
作業(yè)引發(fā)CORE、hang或性能大幅下降等問題時,需要緊急規(guī)避時,可以將作業(yè)加入黑名單進行過濾。
查詢過濾器使用作業(yè)Unique SQL ID保存和識別作業(yè)黑名單和異常信息,在SQL中常數值發(fā)生變化時作業(yè)Unique SQL ID不會隨之發(fā)生變化。Unique SQL ID是遍歷查詢解析樹計算出來的一個整數值,用于標識一類SQL。通常對于DML語句,在計算Unique SQL ID的過程中會忽略常量值。但對于DDL、DCL以及設置參數等語句,常量值不會忽略。例如,以下兩個查詢:
select * from t1 where id = 1;select * from t1 where id = 2;
這兩條SQL除過濾條件中的常量不同外,其他全部相同,由此生成的解析樹拓撲完全相同,因此Unique SQL ID相同。Unique SQL ID的計算只會忽略常數值,而不會忽略其他差異,SQL語句“select * from t2 where id = 1;”與上述兩個SQL的Unique SQL ID就不相同。
將作業(yè)加入黑名單主要有以下兩種方式:
作業(yè)執(zhí)行前判斷作業(yè)是否在黑名單中,如果作業(yè)在黑名單中,拒絕作業(yè)執(zhí)行,直接報錯退出。
作業(yè)被拒絕執(zhí)行后,對作業(yè)加入黑名單原因進行分析,問題解決后調用內置函數gs_remove_blocklist(unique_sql_id int8)將作業(yè)移除黑名單。
1. 設置異常熔斷閾值。假設設置query_exception_count_limit=1,即只要作業(yè)觸發(fā)異常規(guī)則作業(yè)就會被加入黑名單。
2. 配置異常規(guī)則
創(chuàng)建CPU平均使用率異常規(guī)則cpu_percent_except,作業(yè)運行時間超過2000秒且CPU使用率達到30%時觸發(fā)異常退出:
CREATE EXCEPT RULE cpu_percent_except WITH(ELAPSEDTIME=2000, CPUAVGPERCENT=30);
異常規(guī)則還支持BLOCKTIME、ALLCPUTIME、SPILLSIZE等異常的識別處理,具體可參考:異常規(guī)則簡介與演變。
3. 創(chuàng)建資源池respool1關聯異常規(guī)則cpu_percent_except。
CREATE RESOURCE POOL respool1 WITH(except_rule="cpu_percent_except");
資源池支持最多關聯63個異常規(guī)則集,每個異常規(guī)則集間獨立生效,互不影響。
4. 創(chuàng)建業(yè)務用戶usr1,關聯資源池respool1:
CREATE USER usr1 RESOURCE POOL "respool1" PASSWORD "XXXXXX";
5. 用戶usr1運行作業(yè),作業(yè)運行時間超過2000秒且CPU使用率達到30%時觸發(fā)“cpu_percent_except”異常規(guī)則,作業(yè)觸發(fā)異常規(guī)則后資源管理對作業(yè)進行以下處理:
6. 查詢作業(yè)黑名單和異常信息:
SELECT * FROM dbms_om.gs_blocklist_query; unique_sql_id | block_list | except_num | except_time---------------+------------+------------+---------------------------- 4066836196 | t | 1 | 2022-08-08 18:00:00.596269(1 row)
7. 用戶usr1再次運行作業(yè)觸發(fā)異常熔斷,GaussDB(DWS)的異常熔斷機制禁止該作業(yè)執(zhí)行。
ERROR: The query is in the blocklist and cannot be run, unique_sql_id(4066836196).HINT: If you want to run the query later, confirm the reason why the query is blocklisted and remove the query from the blocklist after resolving the problem.
8. 優(yōu)化用戶usr1所運行ID為4066836196的SQL后,將ID為4066836196的SQL從黑名單移除。
確認SQL異常原因,如果異常規(guī)則配置不合理,修改異常規(guī)則;如果異常規(guī)則合理,對SQL進行優(yōu)化后重新運行。確認問題解決后將SQL移除黑名單。
select gs_remove_blocklist(4066836196); gs_remove_blocklist--------------------- t(1 row)
查詢過濾器使用作業(yè)Unique SQL ID識別和保存黑名單信息,為有效運用查詢過濾器緊急攔截功能,建議TopSQL開啟,在作業(yè)引發(fā)CORE、報錯、性能下降等問題時可以快速獲取作業(yè)Unique SQL ID。
獲取作業(yè)Unique SQL ID的幾種方法:
1. 作業(yè)引發(fā)報錯/性能下降
CN日志中獲取作業(yè)query_id,執(zhí)行以下命令查詢作業(yè)Unique SQL ID。
select queryid,unique_sql_id,query from pgxc_wlm_session_info where queryid=query_id;
2. 作業(yè)引發(fā)CN示例CORE
解析CORE打印內存中保存的Unique SQL ID對應的變量參數值。
3. 作業(yè)引發(fā)DN實例CORE
作業(yè)引發(fā)DN實例CORE時,CN側體現為作業(yè)報錯,Unique SQL ID獲取方式可以參考作業(yè)報錯時Unique SQL ID獲取方式。
4. EXPLAIN VERBOSE獲取Unique SQL ID(通用方法,但是僅821及以上版本支持)
EXPLAIN VERBOSE不會實際執(zhí)行SQL,因此一般不會導致問題發(fā)生,使用EXPLAIN VERBOSE XXX;可以打印得到作業(yè)Unique SQL ID。示例:
postgres=# explain verbose select count(1) from pg_class; QUERY PLAN------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- id | operation | E-rows | E-distinct | E-width | E-costs ----+----------------------------------------+--------+------------+---------+--------- 1 | -> Aggregate | 2 | | 8 | 52.94 2 | -> Seq Scan on pg_catalog.pg_class | 1034 | | 0 | 50.34 Targetlist Information (identified by plan id) ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- 1 --Aggregate Output: count(1) 2 --Seq Scan on pg_catalog.pg_class Output: relname, relnamespace, reltype, reloftype, relowner, relam, relfilenode, reltablespace, relpages, reltuples, relallvisible, reltoastrelid, reltoastidxid, reldeltarelid, reldeltaidx, relcudescrelid, relcudescidx, relhasindex, relisshared, relpersistence, relkind, relnatts, relchecks, relhasoids, relhaspkey, relhasrules, relhastriggers, relhassubclass, relcmprs, relhasclusterkey, relrowmovement, parttype, relfrozenxid, relacl, reloptions, relreplident, relfrozenxid64 ====== Query Summary ===== -------------------------- Parser runtime: 0.027 ms Planner runtime: 0.561 ms Unique SQL Id: 2307078791(17 rows)
獲取到作業(yè)Unique SQL ID后,調用內置函數gs_append_blocklist(unique_sql_id int8)將作業(yè)加入黑名單:
postgres=# select * from gs_append_blocklist(2307078791); gs_append_blocklist--------------------- t(1 row)
作業(yè)加入黑名單后,查詢系統(tǒng)表確認黑名單加入是否成功:
postgres=# SELECT * FROM dbms_om.gs_blocklist_query; unique_sql_id | block_list | except_num | except_time---------------+------------+------------+------------- 2307078791 | t | 0 |(1 row)
postgres=# select count(1) from pg_class;ERROR: The query is in the blocklist and cannot be run, unique_sql_id(2307078791).HINT: If you want to run the query later, confirm the reason why the query is blocklisted and remove the query from the blocklist after resolving the problem.
postgres=# select gs_remove_blocklist(2307078791); gs_remove_blocklist--------------------- t(1 row)
點擊關注,第一時間了解華為云新鮮技術~
近日,第七屆中國汽車工程學會巴哈大賽(簡稱巴哈大賽)在湖北襄陽落下帷幕。該項賽事是繼中國大學生方程式汽車大賽(FSC)成功舉辦之后,中國
近年來,受國際能源價格大幅上漲影響,發(fā)揮壓艙石作用的新疆煤炭抓住契機,融入到全國統(tǒng)一大市場,有效緩解了國內能源供應偏緊形勢。隨之而
近日,備受矚目的東風天龍GX上市發(fā)布會暨東風天龍中國卡車駕駛員大賽(第6季)暨東風陽光杯(第2屆)全國商用車維修技能競賽總決賽在車城十堰隆
隨著科技進步,新一輪產業(yè)變革蓬勃興起。數字化發(fā)展,是互聯網時代向大數據時代、后數據時代的必由之路,抓住數字經濟的發(fā)展新機遇,是實現
5月19日,由國家郵政局、中華全國總工會指導,中國郵政快遞報社主辦的第五屆中國夢·郵政情 尋找最美快遞員活動揭曉發(fā)布會在北京國際會議
明月出天山,蒼茫云海間。5月21日,耀世登場·擎鈴未來慶鈴五十鈴2023款ELF輕卡家族在克拉瑪依煥新上市。憑借智能、效能、全能的產品優(yōu)勢,
2023年5月15日,國產高端重卡東風天龍GX全場景干線接力實測圓滿收官。歷時6天,途徑成都-恩施-潛山-上海-武漢-十堰,全場景驗證盆地、高原
5月10日,東風天龍GX成都-上海-十堰全場景干線實測拉開序幕,本次實測的重頭戲,不僅在于東風天龍GX的全方位展示,更是圍繞著百公里油耗的
近日,由國家互聯網信息辦公室、國家發(fā)展和改革委員會、工業(yè)和信息化部、國務院國有資產監(jiān)督管理委員會、福建省人民政府等共同主辦的第六屆
5月11日,峰捷(湖北)供應鏈有限公司、東風商用車有限公司與荊門中澤汽車有限公司在湖北十堰共同簽署了采購100臺東風天龍牽引車的戰(zhàn)略合作協(xié)

全省首個“野生動物司法保護救助中心
由播州區(qū)法院、紅花崗區(qū)林業(yè)局聯合籌建的全省首個野生動物司法保護救助

貴州送你的限時禮包,真的很難不心動
暑期臨近全國各地高溫開始發(fā)力每到此時自帶天然空調的貴州很難讓人不心

西安共設立57個夏糧收購網點 其中高
據西安各區(qū)縣(相關開發(fā)區(qū))統(tǒng)計上報,今年夏糧收購期間,西安市共設立

昆明市富民縣以科技之力賦農又富農
近日,昆明市富民縣村民張榮珍正忙著在自家的楊梅園中采摘楊梅,10多畝

陜西安康水力發(fā)電廠: 提前開閘預泄
5月31日至6月4日,陜西安康市出現持續(xù)連陰雨天氣,2日至4日集中出現強