六月婷婷综合激情-六月婷婷综合-六月婷婷在线观看-六月婷婷在线-亚洲黄色在线网站-亚洲黄色在线观看网站

明輝手游網(wǎng)中心:是一個免費(fèi)提供流行視頻軟件教程、在線學(xué)習(xí)分享的學(xué)習(xí)平臺!

MySQL分頁優(yōu)化的測試案例

[摘要]最近無意間看到一個MySQL分頁優(yōu)化的測試案例,并沒有非常具體地說明測試場景的情況下,給出了一種經(jīng)典的方案,因?yàn)楝F(xiàn)實(shí)中很多情況都不是固定不變的,能總結(jié)出來通用性的做法或者說是規(guī)律,是要考慮非常多的場景的,同時,面對能夠達(dá)到優(yōu)化的方式要追究其原因,同樣的做法,換了個場景,達(dá)不到優(yōu)化效果的,還要追究其...
最近無意間看到一個MySQL分頁優(yōu)化的測試案例,并沒有非常具體地說明測試場景的情況下,給出了一種經(jīng)典的方案,

因?yàn)楝F(xiàn)實(shí)中很多情況都不是固定不變的,能總結(jié)出來通用性的做法或者說是規(guī)律,是要考慮非常多的場景的,
同時,面對能夠達(dá)到優(yōu)化的方式要追究其原因,同樣的做法,換了個場景,達(dá)不到優(yōu)化效果的,還要追究其原因。
個人對此場景在不用情況表示懷疑,然后自己測試了一把,果然發(fā)現(xiàn)一些問題,同時也證實(shí)了一些預(yù)期的想法。
本文就MySQL分頁優(yōu)化,從最最簡單的情況出發(fā),來做一個簡單的分析。

另:本文測試環(huán)境是最最低配置的云服務(wù)器,相對來說服務(wù)器硬件環(huán)境有限,不過對于不同的語句(寫法)應(yīng)該是“平等的”

MySQL經(jīng)典的分頁“優(yōu)化”做法

MySQL分頁優(yōu)化中,有一種經(jīng)典的問題,在查詢越“靠后”的數(shù)據(jù)越慢(取決于表上的索引類型,對于B樹結(jié)構(gòu)的索引,SQL Server中也一樣)
select * from t order by id limit m,n。
也即隨著M的增大,查詢同樣多的數(shù)據(jù),會越來越慢
面對這一問題,于是就產(chǎn)生了一種經(jīng)典的做法,類似于(或者變種)如下的寫法
就是先把分頁范圍內(nèi)的id單獨(dú)找出來,然后再跟基表做關(guān)聯(lián),最后查詢出來所需要的數(shù)據(jù)
select * from t
inner join (select id from t order by id limit m,n)t1 on t1.id = t.id

這種做法是不是總是生效的,或者說是在什么情況下后者才能到達(dá)到優(yōu)化的目的?有沒有做了改寫之后無效甚至變慢的情況?

與此同時,絕大多數(shù)查詢都是有篩選條件的,
如果有篩選條件的情況,
sql語句就變成了select * from t where *** order by id limit m,n
如果如法炮制,改寫成類似
select * from t
inner join (select id from t where *** order by id limit m,n )t1 on t1.id = t.id
在這種情況下,改寫后的sql語句還能達(dá)到優(yōu)化的目的嗎?

測試環(huán)境搭建

  測試數(shù)據(jù)比較簡單,通過存儲過程循環(huán)寫入測試數(shù)據(jù),測試表的InnoDB引擎表。

  MySQL分頁優(yōu)化的測試案例

MySQL分頁優(yōu)化的測試案例

  這里要注意的是日志寫入模式一定要修改成innodb_flush_log_at_trx_commit = 2,否則默認(rèn)情況下,500w數(shù)據(jù),估計一天都寫不完,這個與日志寫入模式有關(guān),就不多說了,

MySQL分頁優(yōu)化的測試案例

分頁查詢優(yōu)化的緣由

  首先還是先看一下這個經(jīng)典的問題,分頁的時候,越“靠后”查詢相應(yīng)越慢的情況

  測試一:查詢第1-20行的數(shù)據(jù),0.01秒

  MySQL分頁優(yōu)化的測試案例

  同樣是查詢20行數(shù)據(jù),查詢相對“靠后”的數(shù)據(jù),比如這里的從4900001-4900020行數(shù)據(jù)的情況,用時1.97秒。

  MySQL分頁優(yōu)化的測試案例

  從中可以看到,查詢條件不變的情況下,越往后查詢,查詢效率越低,可以簡單理解成:同樣搜索20行數(shù)據(jù),越是靠后的數(shù)據(jù),查詢代價越大。
  至于為什么后一種效率較低,后面會慢慢分析。

  測試環(huán)境是centos 7 ,mysql 5.7,測試表的數(shù)據(jù)是500W

  MySQL分頁優(yōu)化的測試案例

重現(xiàn)經(jīng)典分頁“優(yōu)化”,當(dāng)沒有篩選條件,排序列為聚集索引的時候,并不會有所改善

這里來對比以下兩種寫法在聚集索引列作為排序條件時候的性能
select * from t order by id limit m,n。
select * from t
inner join (select id from t order by id limit m,n)t1 on t1.id = t.id

  第一種寫法:

  select * from test_table1 order by id asc limit 4900000,20;測試結(jié)果見截圖,執(zhí)行時間為8.31秒

MySQL分頁優(yōu)化的測試案例

第二種改寫后的寫法:

select t1.* from test_table1 t1
inner join (select id from test_table1 order by id limit 4900000,20)t2 on t1.id = t2.id;執(zhí)行時間為8.43秒

MySQL分頁優(yōu)化的測試案例

這里很清楚,通過經(jīng)典的改寫方法改寫之后,性能能毫無提升,甚至還有一點(diǎn)點(diǎn)變慢了,
實(shí)際測試上表現(xiàn)為兩者在性能上并沒有明顯的線性差異,這兩者樓主是做了多次測試的。

我個人看到類似結(jié)論非要測一下不可的,這個東西不能靠蒙,或者靠運(yùn)氣什么的,能提高效率是為什么,不能提高又是為什么。

那么為什么改寫之后的寫法沒有像傳說中的那種提升性能?
是什么導(dǎo)致當(dāng)前這個改寫沒有到達(dá)提升性能的目的?
后者能夠提升性能的原理是什么?

  首先看一下測試表的表結(jié)構(gòu),排序列上是有索引,這一點(diǎn)是沒有問題的,關(guān)鍵是這個排序列上的索引是主鍵(聚集索引)。

  MySQL分頁優(yōu)化的測試案例

  為什么排序列上是聚集索引的時候,相對“優(yōu)化”改寫之后的sql并不能達(dá)到“優(yōu)化”的目的?

在排序列為聚集索引列的情況下,兩者都是順序掃描表來實(shí)現(xiàn)查詢符合條件的數(shù)據(jù)的
后者雖然是先驅(qū)動一個子查詢,然后再用子查詢的結(jié)果驅(qū)動主表,
但是子查詢并沒有改變“順序掃描表來實(shí)現(xiàn)查詢符合條件的數(shù)據(jù)的”做法,當(dāng)前情況下,甚至改寫后的做法顯得畫蛇添足

參考如下兩者執(zhí)行計劃,第一個截圖的執(zhí)行計劃的一行,與改寫后的sql的執(zhí)行計劃的第三行(id =2 的那一行),基本上一樣。

  MySQL分頁優(yōu)化的測試案例

  MySQL分頁優(yōu)化的測試案例

當(dāng)沒有篩選條件,排序列為聚集索引時候的分頁查詢,所謂的分頁查詢優(yōu)化只不過是畫蛇添足

  目前來看,查詢上述數(shù)據(jù),兩種方式都非常慢,那如果要查詢上述的數(shù)據(jù),該如何做?
  還是要看為什么慢,首先要理解B數(shù)的平衡性結(jié)構(gòu),在我自己粗略的理解來看,如下圖,
  當(dāng)查詢的數(shù)據(jù)“靠后”的時候,實(shí)際上是偏離在B樹索引的一個方向,如下兩個截圖所示的目標(biāo)數(shù)據(jù)
  其實(shí)平衡樹上的數(shù)據(jù),沒有所謂的“靠前”與“靠后”,“靠前”與“靠后”都是相對于對方來說的,或者說是從掃描的方向上來看的
  從一個方向上看“靠后的”數(shù)據(jù),從一個方向看就是“靠前的”,前后不是絕對的。

  如下兩個截圖是B樹索引結(jié)構(gòu)的粗略表現(xiàn)形式,假如目標(biāo)數(shù)據(jù)的位置固定的情況下,所謂的“靠后”是相對與從左向右來說的;

MySQL分頁優(yōu)化的測試案例

如果從右向左看,之前所謂靠后的數(shù)據(jù)實(shí)際上是“靠前”的。

MySQL分頁優(yōu)化的測試案例

  只要數(shù)據(jù)是靠前的,要高效低找到這部分?jǐn)?shù)據(jù),還是可以的。mysql中應(yīng)該也有類似于sqlserver中的正向(forwarded)和反向掃描(backward)的做法。


  如果對于靠后的數(shù)據(jù),采用反向掃描,應(yīng)該就可以很快找到這個部分?jǐn)?shù)據(jù),然后對找到的數(shù)據(jù)在再次排序(asc),結(jié)果應(yīng)該是一樣的,
  首先來看效果:結(jié)果跟上面的查詢一模一樣,這里僅耗時0.07秒,之前的兩種寫法均超過了8秒,效率有上百倍的差距。

  MySQL分頁優(yōu)化的測試案例

  至于這個是為什么,我想根據(jù)上面的闡述,自己應(yīng)該能夠體會的到,這里附上這個sql。
  如果經(jīng)常查詢所謂的靠后的數(shù)據(jù),比如說Id較大的數(shù)據(jù),或者說是時間維度上較新的數(shù)據(jù),可以采用倒敘掃描索引的方式來實(shí)現(xiàn)高效分頁查詢

  (這里請計算好數(shù)據(jù)所在的分頁,同樣的數(shù)據(jù),正序和倒序其起始“頁碼”是不同的)

select* from(select * from test_table1 order by id desc limit 99980,20) t order by id;

當(dāng)沒有篩選條件,排序列為非聚集索引的時候,會有所改善

  這里對測試表test_table1做出如下改變
  1,增加一個id_2列,
  2,該字段上創(chuàng)建一個唯一索引,
  3,該字段用對應(yīng)的主鍵Id填充

  MySQL分頁優(yōu)化的測試案例

  上面的測試是按照主鍵索引(聚集索引)來排序的,現(xiàn)在來按照非聚集索引排序,也即新增的這個列id_2來排序,測試一開始提到的兩種分頁方法。

  首先來看第一種寫法

  select * from test_table1 order by id_2 asc limit 4900000,20;執(zhí)行時間為1分鐘多一點(diǎn),暫且認(rèn)其為60秒

  MySQL分頁優(yōu)化的測試案例

  第二種寫法

select t1.* from test_table1 t1
inner join (select id from test_table1 order by id_2 limit 4900000,20)t2 on t1.id = t2.id;執(zhí)行時間1.67秒

  MySQL分頁優(yōu)化的測試案例

  從這種情況來看,也就是說排序列為非聚集索引列的時候,后一種寫法確實(shí)能大幅度地提升效率。差不多有40倍的提升。
  那么原因在何呢?
  首先來看第一種寫法的執(zhí)行計劃,可以簡單理解為這個sql的執(zhí)行時做全表掃描之后,然后重新按照id_2排序,最后取最前20條數(shù)據(jù)。
  首先全表掃描就是一個非常耗時的過程,排序也是一個非常大的代價,因此表現(xiàn)為性能非常的低下。

  MySQL分頁優(yōu)化的測試案例

  再來看后者的執(zhí)行計劃,他是首先子子查詢中,按照id_2上的索引順序掃描,然后用符合條件的主鍵Id去表中查詢數(shù)據(jù)
  這樣的話,避免了查詢出來大量的數(shù)據(jù)然后重新排序(Using filesort)
  如果了解sqlserver執(zhí)行計劃的情況下,后者與前者相比,應(yīng)該還有避免了頻繁的回表(sqlserver中叫做key lookup或者書簽查找的過程
  可以認(rèn)為是子查詢驅(qū)動外層表查詢符合條件的20條的數(shù)據(jù)的過程是一個批量的,一次性的。

  MySQL分頁優(yōu)化的測試案例

  其實(shí),只有在當(dāng)前情況下,也就是說排序列為非聚集索引列的時候,改寫后的sql才能提升分頁查詢的效率。
  即便如此,此方式“優(yōu)化”過的分頁語句,還是與如下寫法的分頁效率有比較大的差別的
  上面也看到了,返回同樣的數(shù)據(jù),如下的查詢是0.07秒,比這里的1.67秒還是高2個數(shù)量級的

select* from(select * from test_table1 order by id desc limit 99980,20) t order by id;

  另外一個,想提到的問題就是,如果經(jīng)常性分頁查詢,還要按照某種順序,那么為什么不在這個列上建立一個聚集索引。
  比如語句自增Id的,或者時間+其他字段確保唯一性的,mysql會在主鍵上自動創(chuàng)建聚集索引。
  然后有了聚集索引,“靠前”與“靠后”僅僅是一個相對的邏輯上的概念了,如果多數(shù)時候是想得到“靠后”或者較新的數(shù)據(jù),就可以采用上述寫法,

當(dāng)存在篩選條件的情況下,分頁查詢的優(yōu)化

  這一部分想了想,情況太復(fù)雜了,很難概括出來一種非常具有代表性的案例,因此就不過多地做測試了。
  select * from t where *** order by id limit m,n
  1,比如刷選條件本身就很高效,一過濾出來僅剩下很少一部分?jǐn)?shù)據(jù),那么改不改寫sql意義也不大,因?yàn)楹Y選條件本身就可以做到很高效的篩選
  2,比如刷選條件本身作用不大(過濾后數(shù)據(jù)量依然巨大),這種情況其實(shí)又回到了不存在篩選條件的情況,還有取決于如何排序,正序還是倒序等等
  3,比如篩選條件本身作用不大(過濾后數(shù)據(jù)量依然巨大),要考慮的一個很實(shí)際的問題是數(shù)據(jù)分布,
    數(shù)據(jù)的分布也會影響的sql的執(zhí)行效率(sqlserver中的經(jīng)歷,mysql應(yīng)該差別不大)
  4,本身查詢比較復(fù)雜的情況下,很難說用某種方式就可以達(dá)到高效的目的

  情況越復(fù)雜,越是難以總結(jié)出來一種通用性的規(guī)律或者說是方法,一切都要以具體情況來看待,很難下一個定論。
  這里對于查詢加上篩選條件的情況,就不做一一分析了,不過可以肯定的是,脫離了實(shí)際場景,肯定沒有一個固化的方案。

  另外,對于查詢當(dāng)前頁數(shù)據(jù)時候,利用上一頁查詢的最大值做篩選條件,也可以很快滴找到當(dāng)前頁的數(shù)據(jù),這樣當(dāng)然沒有問題,但這屬于另外一個做法,不在本文討論之列。

總結(jié)

分頁查詢,越靠后越慢的情況,實(shí)則對于B樹索引來說,靠前與靠后是一個邏輯上相對的概念,性能上的差異,是基于B樹索引結(jié)構(gòu)以及掃描方式有關(guān)的.
如果加上篩選條件,情況將變得更加復(fù)雜,這個問題在SQL Server中的原理也是一樣的,本來也在SQL Server中做了測試的,這里就不重復(fù)了。
當(dāng)前這種情況,排序列不一定,查詢條件不一定,數(shù)據(jù)分布不一定,就很難用一種特定的方法來實(shí)現(xiàn)“優(yōu)化”,弄不好還起到畫蛇添足的副作用。
因此在做分頁優(yōu)化的時候,一定要根據(jù)具體的場景來做分析,方法也不一定只有一種,脫離實(shí)際場景的結(jié)論,都是扯犢子。
唯有弄清楚這個問題的來龍去脈,才能游刃有余。
因此個人對于數(shù)據(jù)“優(yōu)化”的結(jié)論,一定是具體問題具體分析,是很忌諱總結(jié)出來一套規(guī)則(規(guī)則1,2,3,4,5)給人“套用”,鑒于本人也很菜,就更不敢總結(jié)出來一些教條了。

  

以上就是MySQL分頁優(yōu)化的測試案例的詳細(xì)內(nèi)容,更多請關(guān)注php中文網(wǎng)其它相關(guān)文章!


學(xué)習(xí)教程快速掌握從入門到精通的SQL知識。




主站蜘蛛池模板: 五月香蕉网 | 亚洲图片欧美在线 | 一级做a爰片久久毛片免费 一级做a爰片久久毛片美女图片 | 亚洲国产精品成人午夜在线观看 | 四虎精品福利视频精品 | 午夜视频日本 | 三级欧美 | 日本黄色片网址 | 青青久久久国产线免观 | 日韩中文在线观看 | 欲色影视天天一区二区三区色香欲 | 日韩视频在线播放 | 欧美视频在线免费播放 | 亚欧国产 | 四虎精品视频在线永久免费观看 | 日本激情网站 | 欧美亚洲动漫 | 桃花综合久久久久久久久久网 | 色亚洲天堂 | 亚洲精品免费网站 | 在线中文字幕不卡 | 天天噜夜夜操 | 婷婷99精品国产97久久综合 | 日韩一区二区精品久久高清 | 午夜影院啪啪 | 亚洲欧美成人完整版在线 | 妖精视频亚洲 | 在线亚洲精品国产波多野结衣 | 日韩精品一区二区三区中文3d | 中文字幕第二一区 | 三级在线经典三级 | 亚洲图片欧美另类 | 日本五级床片全部硬硬 | 亚洲成人资源 | 日韩精品一区二三区中文 | 色噜噜狠狠色综合网图区 | 亚洲免费福利视频 | 色综合成人丁香 | 综合色99 | 一级床片40分钟免费视频 | 亚洲国产一区二区三区最新 |