有一個多月沒有整理閱讀的內容了, 最近一段時間在閱讀幾本書,《Systems-Performance-Enterprise-and-the-Cloud》 By Gregg Brendan,《The Art of Computer System Performance》,《NoSQL Distilled》 都很不錯, 不過都沒看完, 就不在這里多說了。 哈哈。
有一個多月沒有整理閱讀的內容了, 最近一段時間在閱讀幾本書,《Systems-Performance-Enterprise-and-the-Cloud》 By Gregg Brendan,《The Art of Computer System Performance》,《NoSQL Distilled》 都很不錯, 不過都沒看完, 就不在這里多說了。 哈哈。
下面是10-14到今天12-07為止閱讀過, 并認為值得了解的內容。
http://t.cn/zR5ADrP 預警是關于“Unknown unknown”,在文中,Baron Schwartz介紹了監控系統的幾個基本原則:1. 從業務角度去監控,每秒鐘處理多少業務量,處理的速度如何,2. 度量并分析你關心的指標,3. 永遠不要針對無法修復的問題做告警,比如MySQL的備庫延遲,比如因為備份而引起的負載增加。
http://t.cn/zRtymS0 構建有效的告警系統,1. 針對哪些指標進行監控(超載監控,頻次監控,時間窗口統計監控),2.如何定義正常狀態(Normal behavior ),3.如何定義非正常狀態(Abnormal or anomalies )。
http://t.cn/zRtUpuy 性能與可運維性模式,這篇文章是這本書的深度書評,從這篇書評看,本書幾乎涉及到我接觸/了解到的可運維性的大部分內容,對于性能相關內容,介紹比較粗淺。
http://t.cn/zR6FCfp “Monitor Some of the Things”, http://t.cn/zR6FCfN “What should I Monitor”,Baron Schwartz最近做的兩個關于如何監控/監控什么/如何Alert/如何發現Anomaly/如何做容量規劃/如何做基本的性能診斷.
http://t.cn/zR6HmCy Chaos Kong, Netflix的地區級容災工具, 文章要點: 1. Chaos Monkey負責單主機故障容災,Chaos Gorilla負責Availability Zone的容災,Chaos Kong負責地區級故障容災, 2. 利用Amazon的預留主機策略來實施地區級容災,3. 自己實現CDN(21個機房),4.開發負責到底,5. 一切都保留3份冗余
http://t.cn/zRjiPwZ netflix的自動容量控制平臺-scryer, 基于歷史的負載特征, 做容量與資源的擬合, 再基于此擬合自動的通過AWS的工具上下線機器, 從而更加有效的使用機器資源, 降低成本. 當然, 并不是所有負載都是基于固定模式(pattern)的, 此系統也接受人工指定負載特征,來應對節假日模式.
http://t.cn/zRtU6xQ Netflix的Hystrix高容錯系統的介紹。重點介紹了他們的監控系統,以及參造《Release IT!》一書中介紹的幾種提高系統可靠性的Stability Patterns,如Bulkheads,Circuit Breaker,Threadpool與Semophore來控制并發訪問,使用Failback、Fast Fail模式來控制故障蔓延。
http://t.cn/zR6s4f3 “How to Run a Post-Mortem With Humans”, 如何實現no-shame的故障事后分析, 1. 從心理學的角度分析人的認知, 人通常都會因故障從自身觸發而感到Shame, 2. 默認情況下, 我們都傾向于將故障定位為人的問題, 是人不夠仔細不夠小心, 而這對于后續如何避免故障作用不大, 3. 更好的方式是, 假設人會犯此類錯誤并從機制上避免
http://t.cn/zRyirMZ iconfinder如何優化他們的頁面處理引擎(Render),將頁面的處理時間從開始的91ms->29ms->20ms, 而絲毫不涉及到傳統上大家認為的,系統慢是源自數據庫慢. 哈哈. 基本的觀點是: 需要通過Profiling的方法找到系統慢的地方,并作針對性的優化,而不只是找個替罪羊.
http://t.cn/zHuwByv Brendan Gregg的主頁, 他的幾乎所有的演講ppt, 大部分比較好的文章,在此都有匯集; 另, 看了下他推薦的閱讀列表, 大部分是關于性能分析,性能優化, 容量規劃與分析的書籍, 值得參考下.
http://t.cn/zR6Q4RF Brendan Gregg的新書Systems-Performance-Enterprise-and-the-Cloud已經上架,可以購買了(價格較高,謹慎動手), 主要內容: 1. 優化的方法論(術語/概念/模型/方法與技術), 2. 動態追蹤技術與工具, 包含Dtrace/Systemtap/Perf, 3. 系統各個組件的優化技術, 4. 壓測,如何避免常見誤區
http://t.cn/8khwx3h http://t.cn/8khwx3P 如何利用HyperLogLog算法在Oracle中(增量的)計算表上的distinct值, HyperLogLog是一種基于Hash桶計算近似Distinct值的算法, 計算的精度基本在+-2%的范圍, 優勢有三: 1. 內存耗費非常小, 2. 計算速度快, 3. 可以增量計算. 這兩篇文章是介紹性的, 不過很清晰
http://t.cn/SxMn6K 深入探討Java語言的各種對象(Collection)/類型在運行時的內存消耗, 各種Collection對象的內存消耗對比, 如何更好的管理對象的生命周期(Life Cycle), 如何有效的利用Java 的Heap空間, 同時又不降低處理的性能.
http://t.cn/8kLSAdm 不同Redo Size在Exadata SSD上的效果, Redo Size越大, log write的寫入時延波動性越大, 從而越不可用. 【從我個人的經驗看,1. 盡可能不要使用SSD作為Redo 寫,2.如果使用,a. 專用設備,b. 足夠的預留空間(高OP), 3. 使用成熟廠家的產品(如Fusion-IO,Intel), GC算法至關重要】
http://t.cn/8ktRmee 不錯的關于SSD以及IO相關的小提示. RethinkDB出品.
http://t.cn/8kfhwWq 針對EMC XtremIO的文章http://t.cn/8kcP1i5的回擊. 從我的角度理解, EMC確實沒有說清楚他的優勢, 或者說, 在GC這件事情上, 他沒有做什么事情, 而GC對于每一個Flash廠商來講都應該是重要的事情.
http://t.cn/zRtV8xe Innotop工具的介紹, 簡單的登錄配置, 如何配置MySQL集群,通過innotop檢測一個集群的狀態, 比如一個master多個Slave的情況, 如何通過Innotop來管理集群的多臺機器,在權限允許的情況下,可以通過它對多臺機器發出命令. 功能還是很強大的.
http://t.cn/zR6QhLX Todd Hoff對sosp 2013論文的回顧, “關于同步,所有你需要知道的內容”, 要點: 1. 鎖的利用需要基于硬件平臺, 以及對應的工作負載特征進行選擇,2. 同步操作的可擴展性主要是硬件的一個屬性, 3. 同步操作在單CPU上擴展性最好,4.9種不同的鎖算法各有其合適的場景, 也即合適才是最好的.
http://highscalability.com/blog/2013/12/4/how-can-batching-requests-actually-reduce-latency.html 批處理為何可以,以及在什么樣的情況下, 可以降低時延.
http://t.cn/8kLY6dz 為什么Oracle不會殺掉MySQL,1. MySQL并不是Oracle的直接競爭產品,Oracle的客戶主要為運行企業級軟件的企業客戶,而不是互聯網客戶. 2. Oracle是為了硬件而購買Sun,也即目標是Exa系列的產品,3. Larry的目標是錢,并不反對開源,4.MySQL的企業支持業務發展也不錯,5. M有替代的競爭產品
http://t.cn/8kA9brd 硬盤的生命周期到底是怎么樣的? 一塊普通的磁盤壽命如何?
http://t.cn/zjjwPQ1 為什么MongoDB在Etsy使用的并不好,MongoDB的成名/成功主要得益于兩大功能:Schema-Free,Auto-Sharding, 當一個公司已經有相對成熟的MySQL運維體系的時候, 當公司有足夠的技術能力做好去范式化/Sharding Key的選擇/自動Sharding擴展這些功能時, 引入一個新的數據庫好處就很有限了
http://t.cn/zRQV5qv Robin Harris (StorageMojo)談論傳統大型存儲的情況, 1. 已經不適合時代, 2. 會逐漸被Flash Storage取代. 仍然健在的原因,1. 【Availability】更好的可用性,2. 更友好的使用。Flash存儲的工作方向:1. 更好的壓縮,2. 更好的實時去重,有效提供更好的Capacity/$。
http://t.cn/zRIw0pV (請自備梯子), Twillo的高可用架構變遷, 談及Twillo如何根據業務的需求與特征, 并從故障的角度分析高可用的天敵: 數據持久化與變更管控, 總結了幾條規則: 1. 盡可能無狀態,2.分離有狀態與無狀態的組件,3.使用Cache與Sharding,4.分解數據的生命周期,降低數據管理復雜度.
http://t.cn/zRJMybK MySQL上的幾種高可用方案, 各種對比, 各種介紹, 自己體會吧.
人力資本與非人力資本在產權性質上的差別很大,在自由社會中,人力資本的所有權僅限于他本人. — 羅森(芝加哥大學經濟系,勞動力經濟學的領導人物).
果樹會結果,農地有收成,結果與收成都是收入. 然而, 這收成可不是在果熟或稻熟時才得到的. 果樹或農作物每天都在變, 不停地變, 而每一小變都是收入(或負收入), 所以, 收入是一連串的事件了. –摘自周其仁《收入是一連串事件》之張五常序.
The first principle is that you must not fool yourself – and you are the easiest person to fool — By Richard Feynman.
http://t.cn/zR6zfjL 控制人們的頭腦是控制整個國家的關鍵,語言文字就是制度的基石。 ——〔波蘭〕切斯瓦夫·米沃什
http://t.cn/8kLAGW1 權利是得到社會認可的、大部分人主動維護的選擇的自由。任何在現實中能夠行使的權利,都離不開他人的背書和支持。換言之,我們可以倡議某種權利,并聲稱它是一種 “自然權利” 或 “天賦權利”,但除非它得到普遍的尊重和維護,它就只是應然而非實然的關于權利的主張而已(薛兆豐)
Related posts:
原文地址:James Reading 12-07, 感謝原作者分享。
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com