Mysql性能優化教程

上傳人：n*** IP屬地：貴州上傳時間：2020-04-06 格式：DOC 頁數：24 大小：111KB 積分：20 舉報 版權申訴

已閱讀5頁，還剩19頁未讀，繼續免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

Mysql 性能優化教程性能優化教程目錄目錄目錄 1 背景及目標 2 Mysql 執行優化 2 認識數據索引 2 為什么使用數據索引能提高效率 2 如何理解數據索引的結構 2 優化實戰范例 3 認識影響結果集 4 影響結果集的獲取 4 影響結果集的解讀 4 常見案例及優化思路 5 理解執行狀態 7 常見關注重點 7 執行狀態分析 8 分析流程 9 常見案例解析 11 總結 12 Mysql 運維優化 14 存儲引擎類型 14 內存使用考量 14 性能與安全性考量 14 存儲寫入壓力優化 15 運維監控體系 15 Mysql 架構優化 17 架構優化目標 17 防止單點隱患 17 方便系統擴容 17 安全可控成本可控 17 分布式方案 18 分庫建立復合索引并不難 area sex lastlogin 三個字段的復合索引如何理解解讀首先忘掉 btree 將索引字段理解為一個排序序列另外牢記數據查詢只能使用一個索引每個字段建立獨立索引的情況下也只能有一條索引被使用如果只使用 area 會怎樣搜索會把符合 area 的結果全部找出來然后在這里面遍歷選擇命中 sex 的并排序遍歷所有 area area 數據如果使用了 area sex 略好仍然要遍歷所有 area area and sex sex 數據然后在這個基礎上排序 Area sex lastlogin 復合索引時切記 lastlogin 在最后該索引基于 area sex lastlogin 三個字段合并的結果排序該列表可以想象如下廣州女時間 1 廣州女時間 2 廣州女時間 3 廣州男深圳女數據庫很容易命中到 area sex 的邊界并且基于下邊界向上追溯 30 條記錄搞定在索引中迅速命中所有結果無需二次遍歷認識影響結果集認識影響結果集影響結果集的獲取影響結果集的獲取通過 Explain 分析 SQL 查看 rows 列內容通過慢查詢日志的 Rows examined 后面的數字影響結果集數字是查詢優化的重要中間數字工程師在開發和調試過程中應隨時關注這一數字影響結果集的解讀影響結果集的解讀查詢條件與索引的關系決定影響結果集影響結果集不是輸出結果數不是查詢返回的記錄數而是索引所掃描的結果數范例 select from user where area 廈門 and sex 女假設索引為 area 假設 User 表中 area 廈門的有條而搜索返回結果為 60233 條影響結果集是條索引先命中條廈門用戶再遍歷以 sex 女進行篩選操作得到 60233 條結果如果該 SQL 增加 limit 0 30 的后綴查詢時先命中 area 廈門然后依順序執行 sex 女篩選操作直到滿足可以返回 30 條為止所涉及記錄數未知除非滿足條件的結果不足 30 條否則不會遍歷條記錄但是如果 SQL 中涉及了排序操作比如 order by lastlogin desc 再有 limit 0 30 時排序需要遍歷所有 area 廈門的記錄而不是滿足即止影響結果集越趨近于實際輸出或操作的目標結果集索引效率越高影響結果集與查詢開銷的關系可以理解為線性相關減少一半影響結果集即可提升一倍查詢效率當一條搜索 query 可以符合多個索引時選擇影響結果集最少的索引 SQL 的優化核心就是對結果集的優化認識索引是增強對結果集的判斷基于索引的認識可以在編寫 SQL 的時候對該 SQL 可能的影響結果集有預判并做出適當的優化和調整 Limit 的影響需要斟酌對待如果索引與查詢條件和排序條件完全命中影響結果集就是 limit 后面的數字 start end 比如 limit 200 30 影響結果集是 230 而不是 30 如果索引只命中部分查詢條件甚至無命中條件在無排序條件情況下會在索引命中的結果集中遍歷到滿足所有其他條件為止比如 select from user limit 10 雖然沒用到索引但是因為不涉及二次篩選和排序系統直接返回前 10 條結果影響結果集依然只有 10 條就不存在效率影響如果搜索所包含的排序條件沒有被索引命中則系統會遍歷是所有索引所命中的結果并且排序例如 Select from user order by timeline desc limit 10 如果 timeline 不是索引影響結果集是全表就存在需要全表數據排序這個效率影響就巨大再比如 Select from user where area 廈門 order by timeline desc limit 10 如果 area 是索引而 area timeline 未建立索引則影響結果集是所有命中 area 廈門的用戶然后在影響結果集內排序常見案例及優化思路常見案例及優化思路毫秒級優化案例某游戲用戶進入后顯示最新動態 SQL 為 select from userfeed where uid uid order by timeline desc limit 20 主鍵為 uid 該 SQL 每天執行數百萬次之多高峰時數據庫負載較高通過 show processlist 顯示大量進程處于 Sending data 狀態沒有慢查詢記錄仔細分析發現因存在較多高頻用戶訪問命中 uid uid 的影響結果集通常在幾百到幾千在上千條影響結果集情況下該 SQL 查詢開銷通常在 0 01 秒左右建立 uid timeline 復合索引將排序引入到索引結構中影響結果集就只有 limit 后面的數字該 SQL 查詢開銷銳減至 0 001 秒數據庫負載驟降 Innodb 鎖表案例某游戲數據庫使用了 innodb innodb 是行級鎖理論上很少存在鎖表情況出現了一個 SQL 語句 delete from tabname where xid 這個 SQL 非常用 SQL 僅在特定情況下出現每天出現頻繁度不高一天僅 10 次左右數據表容量百萬級但是這個 xid 未建立索引于是悲慘的事情發生了當執行這條 delete 的時候真正刪除的記錄非常少也許一到兩條也許一條都沒有但是由于這個 xid 未建立索引 delete 操作時遍歷全表記錄全表被 delete 操作鎖定 select 操作全部被 locked 由于百萬條記錄遍歷時間較長期間大量 select 被阻塞數據庫連接過多崩潰這種非高發請求操作目標很少的 SQL 因未使用索引連帶導致整個數據庫的查詢阻塞需要極大提高警覺實時排名策略優化背景用戶提交游戲積分顯示實時排名原方案提交積分是插入記錄略 select count from jifen where gameid gameid and fenshu fenshu 問題與挑戰即便索引是 gameid fenshu 復合索引涉及 count 操作當分數較低時影響結果集巨大查詢效率緩慢高峰期會導致連接過多優化思路減少影響結果集又要取得實時數據單純從 SQL 上考慮不太有方法將游戲積分預定義分成數個積分斷點然后分成積分區間原始狀態每個區間設置一個統計數字項初始為 0 每次積分提交時先確定該分數屬于哪兩個區間之間這個操作非常簡單因為區間是預定義的而且數量很少只需遍歷即可找到最該分數符合的區間該區間的統計數字項獨立字段可用內存處理異步回寫數據庫或文件 1 記錄該區間上邊界數字為 duandian SQL select count from jifen where gameid gameid and fenshu fenshu and fenshu duandian 如果處于第一區間則無需 duandian 這樣因為第一區間本身也是最好的成績影響結果集不會很多通過該 SQL 獲得其在該區間的名次獲取前面區間的總數總和該數字是直接從上述提到的區間統計數字獲取不需要進行 count 操作將區間內名次前區間的統計數字和獲得總名次該方法關鍵在于積分區間需要合理定義保證積分提交成績能平均散落在不同區間如涉及較多其他條件如日排行總排行以及其他獨立用戶去重等請按照影響結果集思路自行發揮 Redis 方案 Redis 數據結構包括 String list dict 和 Zset 四種在本案例中是非常好的替代數據庫的方案本文檔只做簡介不做額外擴展 String 哈希索引 key value 結構主鍵查詢效率極高不支持排序比較查詢 List 隊列結構在數據異步寫入處理中可以替代 memcache Dict 數組結構存儲結構化序列化內容可以針對數組中的特定列進行操作 Zset 有序數組結構分兩個子結構第一是多層樹形的存儲結構第二是每個樹形節點的計數器這樣類似于前面的分段方式可以理解為多層分段方式所以查詢效率更高缺點是更新效率有所增加論壇翻頁優化背景常見論壇帖子頁 SQL select from post where tagid tagid order by lastpost limit start end 翻頁索引為 tagid lastpost 復合索引挑戰超級熱帖幾萬回帖用戶頻頻翻到末頁 limit 25770 30 一個操作下來影響結果集巨大 25770 30 查詢緩慢解決方法只涉及上下翻頁情況每次查詢的時候將該頁查詢結果中最大的 lastpost 和最小的分別記錄為 minlastpost 和 maxlastpost 上翻頁查詢為 select from post where tagid tagid and lastpost maxlastpost order by lastpost limit 30 使用這種方式影響結果集只有 30 條效率極大提升涉及跳轉到任意頁互聯網上常見的一個優化方案可以這樣表述 select from post where tagid tagid and lastpost select lastpost from post where tagid tagid order by lastpost limit start 1 order by lastpost limit 30 或者 select from post where pid in select pid from post where tagid tagid order by lastpost limit start 30 第 2 條 S 語法在新的 mysql 版本已經不支持新版本 mysql in 的子語句不再支持 limit 條件但可以分解為兩條 SQL 實現原理不變不做贅述以上思路在于子查詢的影響結果集仍然是 start 30 但是數據獲取的過程 Sending data 狀態發生在索引文件中而不是數據表文件這樣所需要的系統開銷就比前一種普通的查詢低一個數量級而主查詢的影響結果集只有 30 條幾乎無開銷但是切記這里仍然涉及了太多的影響結果集操作延伸問題來自于 uchome 典型查詢 SELECT FROM uchome thread WHERE tagid 73820 ORDER BY displayorder DESC lastpost DESC LIMIT start 30 如果換用如上方法上翻頁代碼 SELECT FROM uchome thread WHERE tagid 73820 and lastpost maxlastpost ORDER BY displayorder DESC lastpost ASC LIMIT 0 30 這里涉及一個 order by 索引可用性問題當 order by 中復合索引的字段一個是 ASC 一個是 DESC 時其排序無法在索引中完成所以只有上翻頁可以正確使用索引影響結果集為 30 下翻頁無法在排序中正確使用索引會命中所有索引內容然后排序效率低下總結基于影響結果集的理解去優化不論從數據結構代碼還是涉及產品策略上都需要貫徹下去涉及 limit start num 的搜索如果 start 巨大則影響結果集巨大搜索效率會非常難過低盡量用其他方式改寫為 limit 0 num 確系無法改寫的情況下先從索引結構中獲得 limit start num 或 limit start 1 再用 in 操作或基于索引序的 limit 0 num 二次搜索請注意我這里永遠不會講關于外鍵和 join 的優化因為在我們的體系里這是根本不允許的架構優化部分會解釋為什么理解執行狀態理解執行狀態常見關注重點常見關注重點慢查詢日志關注重點如下是否鎖定及鎖定時間如存在鎖定則該慢查詢通常是因鎖定因素導致本身無需優化需解決鎖定問題影響結果集如影響結果集較大顯然是索引項命中存在問題需要認真對待 Explain 操作索引項使用不建議用 using index 做強制索引如未如預期使用索引建議重新斟酌表結構和索引設置影響結果集這里顯示的數字不一定準確結合之前提到對數據索引的理解來看還記得嘛就把索引當作有序序列來理解反思 SQL Set profiling show profiles for query 操作執行開銷注意有問題的 SQL 如果重復執行可能在緩存里這時要注意避免緩存影響通過這里可以看到執行時間超過 0 005 秒的頻繁操作 SQL 建議都分析一下深入理解數據庫執行的過程和開銷的分布 Show processlist 執行狀態監控這是在數據庫負載波動時經常進行的一項操作具體參見如下執行狀態分析執行狀態分析 Sleep 狀態通常代表資源未釋放如果是通過連接池 sleep 狀態應該恒定在一定數量范圍內實戰范例因前端數據輸出時特別是輸出到用戶終端未及時關閉數據庫連接導致因網絡連接速度產生大量 sleep 連接在網速出現異常時數據庫 too many connections 掛死簡單解讀數據查詢和執行通常只需要不到 0 01 秒而網絡輸出通常需要 1 秒左右甚至更長原本數據連接在 0 01 秒即可釋放但是因為前端程序未執行 close 操作直接輸出結果那么在結果未展現在用戶桌面前該數據庫連接一直維持在 sleep 狀態 Waiting for net reading from net writing to net 偶爾出現無妨如大量出現迅速檢查數據庫到前端的網絡連接狀態和流量案例因外掛程序內網數據庫大量讀取內網使用的百兆交換迅速爆滿導致大量連接阻塞在 waiting for net 數據庫連接過多崩潰 Locked 狀態有更新操作鎖定通常使用 innodb 可以很好的減少 locked 狀態的產生但是切記更新操作要正確使用索引即便是低頻次更新操作也不能疏忽如上影響結果集范例所示在 myisam 的時代 locked 是很多高并發應用的噩夢所以 mysql 官方也開始傾向于推薦 innodb Copy to tmp table 索引及現有結構無法涵蓋查詢條件才會建立一個臨時表來滿足查詢要求產生巨大的恐怖的 i o 壓力很可怕的搜索語句會導致這樣的情況如果是數據分析或者半夜的周期數據清理任務偶爾出現可以允許頻繁出現務必優化之 Copy to tmp table 通常與連表查詢有關建議逐漸習慣不使用連表查詢實戰范例某社區數據庫阻塞求救經查其服務器存在多個數據庫應用和網站其中一個不常用的小網站數據庫產生了一個恐怖的 copy to tmp table 操作導致整個硬盤 i o 和 cpu 壓力超載 Kill 掉該操作一切恢復 Sending data Sending data 并不是發送數據別被這個名字所欺騙這是從物理磁盤獲取數據的進程如果你的影響結果集較多那么就需要從不同的磁盤碎片去抽取數據偶爾出現該狀態連接無礙回到上面影響結果集的問題一般而言如果 sending data 連接過多通常是某查詢的影響結果集過大也就是查詢的索引項不夠優化前文提到影響結果集對 SQL 查詢效率線性相關主要就是針對這個狀態的系統開銷如果出現大量相似的 SQL 語句出現在 show proesslist 列表中并且都處于 sending data 狀態優化查詢索引記住用影響結果集的思路去思考 Storing result to query cache 出現這種狀態如果頻繁出現使用 set profiling 分析如果存在資源開銷在 SQL 整體開銷的比例過大即便是非常小的開銷看比例則說明 query cache 碎片較多使用 flush query cache 可即時清理也可以做成定時任務 Query cache 參數可適當酌情設置 Freeing items 理論上這玩意不會出現很多偶爾出現無礙如果大量出現內存硬盤可能已經出現問題比如硬盤滿或損壞 i o 壓力過大時也可能出現 Free items 執行時間較長的情況 Sorting for 和 Sending data 類似結果集過大排序條件沒有索引化需要在內存里排序甚至需要創建臨時結構排序其他還有很多狀態遇到了去查查資料基本上我們遇到其他狀態的阻塞較少所以不關心分析流程分析流程基本流程詳細了解問題狀況 Too many connections 是常見表象有很多種原因索引損壞的情況在 innodb 情況下很少出現如出現其他情況應追溯日志和錯誤信息了解基本負載狀況和運營狀況基本運營狀況當前每秒讀請求當前每秒寫請求當前在線用戶當前數據容量基本負載情況學會使用這些指令 Top Vmstat uptime iostat df Cpu 負載構成特別關注 i o 壓力 wa 多核負載分配內存占用 Swap 分區是否被侵占如 Swap 分區被侵占物理內存是否較多空閑磁盤狀態硬盤滿和 inode 節點滿的情況要迅速定位和迅速處理了解具體連接狀況當前連接數 Netstat an grep 3306 wc l Show processlist 當前連接分布 show processlist 前端應用請求數據庫不要使用 root 帳號 Root 帳號比其他普通帳號多一個連接數許可前端使用普通帳號在 too many connections 的時候 root 帳號仍可以登錄數據庫查詢 show processlist 記住前端應用程序不要設置一個不叫 root 的 root 帳號來糊弄非 root 賬戶是骨子里的而不是名義上的狀態分布不同狀態代表不同的問題有不同的優化目標參見如上范例雷同 SQL 的分布是否較多雷同 SQL 出現在同一狀態當前是否有較多慢查詢日志是否鎖定影響結果集頻繁度分析寫頻繁度如果 i o 壓力高優先分析寫入頻繁度 Mysqlbinlog 輸出最新 binlog 文件編寫腳本拆分最多寫入的數據表是哪個最多寫入的數據 SQL 是什么是否存在基于同一主鍵的數據內容高頻重復寫入涉及架構優化部分參見架構優化緩存異步更新讀取頻繁度如果 cpu 資源較高而 i o 壓力不高優先分析讀取頻繁度程序中在封裝的 db 類增加抽樣日志即可抽樣比例酌情考慮以不顯著影響系統負載壓力為底線最多讀取的數據表是哪個最多讀取的數據 SQL 是什么該 SQL 進行 explain 和 set profiling 判定注意判定時需要避免 query cache 影響比如在這個 SQL 末尾增加一個條件子句 and 1 1 就可以避免從 query cache 中獲取數據而得到真實的執行狀態分析是否存在同一個查詢短期內頻繁出現的情況涉及前端緩存優化抓大放小解決顯著問題不苛求解決所有優化問題但是應以保證線上服務穩定可靠為目標解決與評估要同時進行新的策略或解決方案務必經過評估后上線常見案例解析常見案例解析現象服務器出現 too many connections 阻塞入手點查看服務器狀態 cpu 占用內存占用硬盤占用硬盤 i o 壓力查看網絡流量狀態 mysql 與應用服務器的輸入輸出狀況通過 Show processlist 查看當前運行清單注意事項日常應用程序連接數據庫不要使用 root 賬戶保證故障時可以通過 root 進入數據庫查看 show processlist 狀態分析參見如上執行狀態清單根據連接狀態的分布去確定原因緊急恢復在確定故障原因后應通過 kill 掉阻塞進程的方式立即恢復數據庫善后處理以下針對常見問題簡單解讀 Sleep 連接過多導致應用端及時釋放連接排查關聯因素 Locked 連接過多如源于 myisam 表級鎖更 innodb 引擎如源于更新操作使用了不恰當的索引或未使用索引改寫更新操作 SQL 或建立恰當索引 Sending data 連接過多用影響結果集的思路優化 SQL 查詢優化表索引結構 Free items 連接過多 i o 壓力過大或硬盤故障 Waiting for net writing to net 連接過多 mysql 與應用服務器連接阻塞其他仍參見如上執行狀態清單所示分析如涉及不十分嚴格安全要求的數據內容可用定期腳本跟蹤請求進程并 kill 掉僵死進程如數據安全要求較嚴格則不能如此進行現象數據庫負載過高響應緩慢入手點查看 cpu 狀態服務器負載構成分支 1 i o 占用過高步驟 1 檢查內存是否占用 swap 分區排除因內存不足導致的 i o 開銷步驟 2 通過 iostat 指令分析 i o 是否集中于數據庫硬盤是否是寫入度較高步驟 3 如果壓力來自于寫使用 mysqlbinlog 解開最新的 binlog 文件步驟 4 編寫日志分析腳本或 grep 指令分析每秒寫入頻度和寫入內容寫入頻度不高則說明 i o 壓力另有原因或數據庫配置不合理步驟 5 編寫日志分析腳本或 grep 指令分析寫入的數據表構成和寫入的目標構成步驟 6 編寫日志分析腳本分析是否存在同一主鍵的重復寫入比如出現大量 update post set views views 1 where tagid 的操作假設在一段時間內出現了 2 萬次而其中不同的 tagid 有 1 萬次那么就是有 50 的請求是重復 update 請求有可以通過異步更新合并的空間提示一下以上所提及的日志分析腳本編寫正常情況下不應超過 1 個小時而對系統負載分析所提供的數據支持價值是巨大的對性能優化方案的選擇是非常有意義的如果您認為這項工作是繁冗而且復雜的工作那么一定是在分析思路和目標把握上出現了偏差分支 2 i o 占用不高 CPU 占用過高步驟 1 查看慢查詢日志步驟 2 不斷刷新查看 Show processlist 清單并把握可能頻繁出現的處于 Sending data 狀態的 SQL 步驟 3 記錄前端執行 SQL 于前端應用程序執行查詢的封裝對象內設置隨機采樣記錄前端執行的 SQL 保證有一定的樣本規模并且不會帶來前端 i o 負載的激增基于采樣率和記錄頻率獲得每秒讀請求次數數據指標編寫日志分析腳本分析采樣的 SQL 構成所操作的數據表所操作的主鍵對頻繁重復讀取的 SQL 完全一致的 SQL 進行判定是否數據存在頻繁變動是否需要實時展現最新數據如有可能緩存化并預估緩存命中率對頻繁讀取但不重復的 SQL 結構一致但條件中的數據不一致 SQL 進行判定是否索引足夠優化影響結果集與輸出結果是否足夠接近步驟 4 將導致慢查詢的 SQL 或頻繁出現于 show processlist 狀態的 SQL 或采樣記錄的頻繁度 SQL 進行分析按照影響結果集的思路和索引理解來優化步驟 5 對如上難以界定問題的 SQL 進行 set profiling 分析步驟 6 優化后分析繼續采樣跟蹤分析并跟蹤比對結果善后處理日常跟蹤腳本不斷記錄一些狀態信息保證每個時間節點都能回溯確保隨時能了解服務器的請求頻次讀寫請求的分布記錄一些未造成致命影響的隱患點可暫不解決但需要記錄如確系服務器請求頻次過高可基于負載分布決定硬件擴容方案比如 i o 壓力過高可考慮固態硬盤內存占用 swap 可考慮增加內容容量等用盡可能少的投入實現最好的負載支撐能力而不是簡單的買更多服務器總結總結要學會怎樣分析問題而不是單純拍腦袋優化慢查詢只是最基礎的東西要學會優化 0 01 秒的查詢請求當發生連接阻塞時不同狀態的阻塞有不同的原因要找到原因如果不對癥下藥就會南轅北轍范例如果本身系統內存已經超載已經使用到了 swap 而還在考慮加大緩存來優化查詢那就是自尋死路了影響結果集是非常重要的中間數據和優化指標學會理解這一概念理論上影響結果集與查詢效率呈現非常緊密的線性相關監測與跟蹤要經常做而不是出問題才做讀取頻繁度抽樣監測全監測不要搞 i o 嚇死人按照一個抽樣比例抽樣即可針對抽樣中發現的問題可以按照特定 SQL 在特定時間內監測一段全查詢記錄但仍要考慮 i o 影響寫入頻繁度監測基于 binlog 解開即可可定時或不定時分析微慢查詢抽樣監測高并發情況下查詢請求時間超過 0 01 秒甚至 0 005 秒的建議酌情抽樣記錄連接數預警監測連接數超過特定閾值的情況下雖然數據庫沒有崩潰建議記錄相關連接狀態學會通過數據和監控發現問題分析問題而后解決問題順理成章特別是要學會在日常監控中發現隱患而不是問題爆發了才去處理和解決 Mysql 運維優化運維優化存儲引擎類型存儲引擎類型 Myisam 速度快響應快表級鎖是致命問題 Innodb 目前主流存儲引擎行級鎖務必注意影響結果集的定義是什么行級鎖會帶來更新的額外開銷但是通常情況下是值得的事務提交對 i o 效率提升的考慮對安全性的考慮 HEAP 內存引擎頻繁更新和海量讀取情況下仍會存在鎖定狀況內存使用考量內存使用考量理論上內存越大越多數據讀取發生在內存效率越高 Query cache 的使用如果前端請求重復度不高或者應用層已經充分緩存重復請求 query cache 不必設置很大甚至可以不設置如果前端請求重復度較高無應用層緩存 query cache 是一個很好的偷懶選擇對于中等以下規模數據庫應用偷懶不是一個壞選擇如果確認使用 query cache 記得定時清理碎片 flush query cache 要考慮到現實的硬件資源和瓶頸分布學會理解熱點數據并將熱點數據盡可能內存化所謂熱點數據就是最多被訪問的數據通常數據庫訪問是不平均的少數數據被頻繁讀寫而更多數據鮮有讀寫學會制定不同的熱點數據規則并測算指標熱點數據規模理論上熱點數據越少越好這樣可以更好的滿足業務的增長趨勢響應滿足度對響應的滿足率越高越好比如依據最后更新時間總訪問量回訪次數等指標定義熱點數據并測算不同定義模式下的熱點數據規模性能與安全性考量性能與安全性考量數據提交方式 innodb flush log at trx commit 1 每次自動提交安全性高 i o 壓力大 innodb flush log at trx commit 2 每秒自動提交安全性略有影響 i o 承載強日志同步 Sync binlog 1 每條自動更新安全性高 i o 壓力大 Sync binlog 0 根據緩存設置情況自動更新存在丟失數據和同步延遲風險 i o 承載力強個人建議保存 binlog 日志文件便于追溯更新操作和系統恢復如對日志文件的 i o 壓力有擔心在內存寬裕的情況下可考慮將 binlog 寫入到諸如 dev shm 這樣的內存映射分區并定時將舊有的 binlog 轉移到物理硬盤性能與安全本身存在相悖的情況需要在業務訴求層面決定取舍學會區分什么場合側重性能什么場合側重安全學會將不同安全等級的數據庫用不同策略管理存儲存儲寫入寫入壓力優化壓力優化順序讀寫性能遠高于隨機讀寫將順序寫數據和隨機讀寫數據分成不同的物理磁盤進行有助于 i o 壓力的疏解數據庫文件涉及索引等內容寫入是隨即寫 binlog 文件是順序寫淘寶數據庫存儲優化是這樣處理的部分安全要求不高的寫入操作可以用 dev shm 分區存儲簡單變成內存寫多塊物理硬盤做 raid10 可以提升寫入能力關鍵存儲設備優化善于比對不同存儲介質的壓力測試數據例如 fusion io 在新浪和淘寶都有較多使用涉及必須存儲較為龐大的數據量時壓縮存儲可以通過增加 cpu 開銷壓縮算法減少 i o 壓力前提是你確認 cpu 相對空閑而 i o 壓力很大新浪微博就是壓縮存儲的典范通過 md5 去重存儲案例是 QQ 的文件共享以及 dropbox 這樣的共享服務如果你上傳的是一個別人已有的文件計算 md5 后直接通過 md5 定位到原有文件這樣可以極大減少存儲量涉及文件共享頭像共享相冊等應用通過這種方法可以減少超過 70 的存儲規模對硬件資源的節省是相當巨大的缺點是刪除文件需要甄別該 md5 是否有其他人使用去重存儲用戶量越多上傳文件越多效率越高文件盡量不要存儲到數據庫內盡量使用獨立的文件系統存儲該話題不展開運維監控體系運維監控體系系統監控服務器資源監控 Cpu 內存硬盤空間 i o 壓力設置閾值報警服務器流量監控外網流量內網流量設置閾值報警連接狀態監控 Show processlist 設置閾值每分鐘監測超過閾值記錄應用監控慢查詢監控慢查詢日志如果存在多臺數據庫服務器應有匯總查閱機制請求錯誤監控高頻繁應用中會出現偶發性數據庫連接錯誤或執行錯誤將錯誤信息記錄到日志查看每日的比例變化偶發性錯誤如果數量極少可以不用處理但是需時常監控其趨勢會存在惡意輸入內容輸入邊界限定缺乏導致執行出錯需基于此防止惡意入侵探測行為微慢查詢監控高并發環境里超過 0 01 秒的查詢請求都應該關注一下頻繁度監控寫操作基于 binlog 定期分析讀操作在前端 db 封裝代碼中增加抽樣日志并輸出執行時間分析請求頻繁度是開發架構進一步優化的基礎最好的優化就是減少請求次數總結監控與數據分析是一切優化的基礎沒有運營數據監測就不要妄談優化監控要注意不要產生太多額外的負載不要因監控帶來太多額外系統開銷 Mysql 架構優化架構優化架構優化目標架構優化目標防止單點隱患防止單點隱患所謂單點隱患就是某臺設備出現故障會導致整體系統的不可用這個設備就是單點隱患理解連帶效應所謂連帶效應就是一種問題會引發另一種故障舉例而言 memcache mysql 是一種常見緩存組合在前端壓力很大時如果 memcache 崩潰理論上數據會通過 mysql 讀取不存在系統不可用情況但是 mysql 無法對抗如此大的壓力沖擊會因此連帶崩潰因 A 系統問題導致 B 系統崩潰的連帶問題在運維過程中會頻繁出現實戰范例在 mysql 連接不及時釋放的應用環境里當網絡環境異常同機房友鄰服務器遭受拒絕服務攻擊出口阻塞網絡延遲加劇空連接數急劇增加導致數據庫連接過多崩潰實戰范例 2 前端代碼通常我們封裝 mysql connect 和 memcache connect 二者的順序不同會產生不同的連帶效應如果 mysql connect 在前那么一旦 memcache 連接阻塞會連帶 mysql 空連接過多崩潰連帶效應是常見的系統崩潰日常分析崩潰原因的時候需要認真考慮連帶效應的影響頭疼醫頭腳疼醫腳是不行的方便系統擴容方便系統擴容數據容量增加后要考慮能夠將數據分布到不同的服務器上請求壓力增加時要考慮將請求壓力分布到不同服務器上擴容設計時需要考慮防止單點隱患安全可控成本可控安全可控成本可控數據安全業務安全人力資源成本帶寬流量成本硬件成本成本與流量的關系曲線應低于線性增長流量為橫軸成本為縱軸規模優勢本教程僅就與數據庫有關部分討論與數據庫無關部門請自行參閱其他學習資料分布式方案分布式方案分庫分庫展示程序需要顯示發送者姓名此時通常會在 message 表中增加字段 fromusername 甚至有的會增加 fromusersex 從而無需連表查詢直接輸出信息的發送者姓名和性別這就是一種簡單的為了避免連表查詢而使用的冗余字段設計基于查詢的冗余設計涉及分表操作后一些常見的索引查詢可能需要跨表帶來不必要的麻煩確認查詢請求遠大于寫入請求時應設置便于查詢項的冗余表冗余表要點數據一致性簡單說同增同刪同更新可以做全冗余或者只做主鍵關聯的冗余比如通過用戶名查詢 uid 再基于 uid 查詢源表實戰范例 1 用戶分表將用戶庫分成若干數據表基于用戶名的查詢和基于 uid 的查詢都是高并發請求用戶分表基于 uid 分成數據表同時基于用戶名做對應冗余表如果允許多方式登陸可以有如下設計方法 uid passwd 用戶信息等等主數據表基于 uid 分表 ukey ukeytype uid 基于 ukey 分表便于用戶登陸的查詢分解成如下兩個 SQL select uid from ulist key 13 where ukey username and ukeytype login select from ulist uid 23 where uid uid and passwd passwd ukeytype 定義用戶的登陸依據比如用戶名手機號郵件地址網站昵稱等 Ukey ukeytype 必須唯一此種方式需要登陸密碼統一對于第三方 connect 接入模式可以通過引申額外字段完成實戰范例 2 用戶游戲積分排名表結構 uid gameid score 參見前文實時積分排行表內容巨大需要拆表需求 1 基于游戲 id 查詢積分排行需求 2 基于用戶 id 查詢游戲積分記錄解決方案建立完全相同的兩套表結構其一以 uid 為拆表主鍵其二以 gameid 為拆表主鍵用戶提交積分時向兩個數據結構同時提交實戰范例 3 全冗余查詢結構主信息表僅包括主鍵及備注 memo 字段 text 類型只支持主鍵查詢可以基于主鍵拆表所以需要展現和存儲的內容均在 memo 字段重體現對每一個查詢條件建立查詢冗余表以查詢條件字段為主鍵以主信息表主鍵 id 為內容日常查詢只基于查詢冗余表然后通過 in 的方式從主信息表獲得內容優點是結構擴展非常方便只需要擴展新的查詢信息表即可核心思路是只有查詢才需要獨立的索引結構展現無需獨立字段缺點是只適合于相對固定的查詢架構對于更加靈活的組合查詢束手無策基于統計的冗余結構為了減少會涉及大規模影響結果集的表數據操作比如 count sum 操作應將一些統計類數據通過冗余數據結構保存冗余數據結構可能以字段方式存在也可能以獨立數據表結構存在但是都應能通過源數據表恢復實戰范例論壇板塊的發帖量回帖量每日新增數據等網站每日新增用戶數等參見 Discuz 論壇系統數據結構有較多相關結構參見前文分段積分結構是典型用于統計的冗余結構后臺可以通過源數據表更新該數字 Redis 的 Zset 類型可以理解為存在一種冗余統計結構歷史數據表歷史數據表對應于熱點數據表將需求較少又不能丟棄的數據存入僅在少數情況下被訪問主從架構主從架構基本認識讀寫分離對負載的減輕遠遠不如分庫分表來的直接寫壓力會傳遞給從表只讀從庫一樣有寫壓力一樣會產生讀寫鎖一主多從結構下主庫是單點隱患很難解決如主庫當機從庫可以響應讀寫但是無法自動擔當主庫的分發功能主從延遲也是重大問題一旦有較大寫入問題如表結構更新主從會產生巨大延遲應用場景在線熱備異地分布寫分布讀統一仍然困難重重受限于網絡環境問題巨多自動障礙轉移主崩潰從自動接管個人建議負載均衡主要使用分庫方案主從主要用于熱備和障礙轉移潛在優化點為了減少寫壓力有些人建議主不建索引提升 i o 性能從建立索引滿足查詢要求個人認為這樣維護較為麻煩而且從本身會繼承主的 i o 壓力因此優化價值有限該思路特此分享不做推薦故障轉移處理故障轉移處理要點程序與數據庫的連接基于虛地址而非真實 ip 由負載均衡系統監控保持主從結構的簡單化否則很難做到故障點摘除思考方式遍歷對服務器集群的任何一臺服務器前端 web 中間件監控緩存 db 等等假設該服務器出現故障系統是否會出現異常用戶訪問是否會出現異常目標任意一臺服務器崩潰負載和數據操作均會很短時間內自動轉移到其他服務器不會影響業務的正常進行不會造成惡性的數據丟失哪些是可以丟失的哪些是不能丟失的緩存方案緩存方案緩存結合數據庫的讀取緩存結合數據庫的讀取 Memcached 是最常用的緩存系統 Mysql 最新版本已經開始支持 memcache 插件但據牛人分析尚不成熟暫不推薦數據讀取并不是所有數據都適合被緩存也并不是進入了緩存就意味著效率提升命中率是第一要評估的數據如何評估進入緩存的數據規模以及命中率優化是非常需要細心分析的實景分析前端請求先連接緩存緩存未命中連接數據庫進行查詢未命中狀態比單純連接數據庫查詢多了一次連接和查詢的操作如果緩存命中率很低則這個額外的操作非但不能提高查詢效率反而為系統帶來了額外的負載和復雜性得不償失相關評

人人文庫> 全部分類> 應用文書 > 事務文書

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

Mysql性能優化教程

文檔簡介

溫馨提示

最新文檔

評論

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

Mysql性能優化教程

文檔簡介

溫馨提示

最新文檔

評論

相關文檔