最初,Backblaze只是一家廉價(jià)云存儲(chǔ)服務(wù)商,曾提供每月5美元不限容量的存儲(chǔ)服務(wù)。因此單談Backblaze這家公司或許會(huì)比較陌生,但是如果說(shuō)起近日的“希捷門(mén)”,相信很多人都會(huì)有一些印象。
“希捷門(mén)”事件回顧
Backblaze:5家公司15種型號(hào),希捷最差!
事件起源于該公司博客上的 一篇硬盤(pán)品質(zhì)報(bào)告,Backblaze重點(diǎn)對(duì)比了希捷、西數(shù)、日立3家公司出品的磁盤(pán),得出的結(jié)論則是“日立最穩(wěn)定,希捷最差”。
2013年,Backblaze測(cè)試評(píng)估了來(lái)自5家公司15種型號(hào)的27134塊硬盤(pán),結(jié)果顯示日立(已被西數(shù)收購(gòu))故障率最低,存活率最高,在36個(gè)月后硬盤(pán)可正常工作概率仍達(dá)96.9%;西數(shù)排第二,雖然有一批產(chǎn)品在3個(gè)月內(nèi)出問(wèn)題,但最后存活率仍達(dá)94.8%;希捷三大品牌排名最末,3年后存活率僅有73.5%。Backblaze并沒(méi)有掩飾其購(gòu)買(mǎi)的是“價(jià)格比較好”的磁盤(pán),同時(shí)它也公布,在生產(chǎn)環(huán)境中,希捷的故障率仍然最高。
希捷:采購(gòu)、使用環(huán)境等,你哪條合格?
在希捷的反擊中,工程師首先表示,在這段時(shí)間,你們嘗試了各種方式的宣傳,甚至不惜引發(fā)疑問(wèn)來(lái)突出自己,就個(gè)人而言,我很慶幸沒(méi)有被分配去宣傳某些公司或其產(chǎn)品。隨后,他從多個(gè)方面回?fù)袅诉@一評(píng)測(cè)日志:

1. 硬盤(pán)的采購(gòu):為了提供便宜的服務(wù),你們選擇最便宜的磁盤(pán),不分場(chǎng)景的進(jìn)行使用,只要通過(guò)測(cè)試,就進(jìn)行使用。在2011 年磁盤(pán)危機(jī)時(shí)間,你們更是不擇手段地?fù)屬?gòu),甚至出現(xiàn)有些員工被經(jīng)銷(xiāo)商列入黑名單的情況,從故障發(fā)生在硬盤(pán)使用最初的幾周時(shí)間就可以想象你們的品控,而使用這樣資源得出評(píng)測(cè)報(bào)告的可用性可想而知。
2. 機(jī)箱的設(shè)計(jì):為了獲得高的密度,你們?cè)诿總€(gè)機(jī)箱中安裝了45 塊硬盤(pán),硬盤(pán)之間的震動(dòng)相互影響,而在機(jī)箱插入服務(wù)器后更會(huì)引起連鎖反應(yīng),導(dǎo)致硬盤(pán)的頻繁故障,很顯然希捷的硬盤(pán)出現(xiàn)在你們?cè)缙谖锤牧嫉臋C(jī)箱中。如果我們的年故障率真高達(dá)25.4,那直接關(guān)門(mén)好了。
3. 溫度的控制:從你們公司博客中我們發(fā)現(xiàn),機(jī)架頂部pod 中的硬盤(pán)溫度比較低層硬盤(pán)平均高出三度;Pod中心的硬盤(pán)溫度相比邊界硬盤(pán)高出五度;pod無(wú)需6風(fēng)扇,只使用2個(gè)硬盤(pán)便可維持建議運(yùn)行的溫度;至少在Storage Pod中熱量與硬盤(pán)故障無(wú)關(guān)。首先,硬盤(pán)溫度和熱量無(wú)關(guān)絕對(duì)是錯(cuò)誤的;其次即使在溫控范圍內(nèi),但是溫度不同也會(huì)造成壽命不同。
4. 用例的負(fù)載:你們采購(gòu)最廉價(jià)的硬盤(pán),無(wú)視額定功率,造成硬盤(pán)高故障率很正常。而在不同的負(fù)載下進(jìn)行比較就更加的行不通了,比如隨機(jī)讀取會(huì)損壞磁頭。可以確定的是,你們的工作負(fù)載完全超出了硬盤(pán)設(shè)計(jì)的極限。
言歸正傳,拋開(kāi)與希捷的恩怨情仇,Backblaze確實(shí)在為一個(gè)非常有意義的目標(biāo)奮斗著——以盡可能低的開(kāi)銷(xiāo)為客戶(hù)交付卓越的價(jià)值。因此,除了在硬盤(pán)上控制成本之外,他們更設(shè)計(jì)出了一套大規(guī)模存儲(chǔ)系統(tǒng),也就是上文提到的Storage Pod 。目前Backblaze的開(kāi)源存儲(chǔ)架構(gòu)已經(jīng)迭代到180TB成本9305美元,每GB存儲(chǔ)成本創(chuàng)下0.0517的新紀(jì)錄。下面我們一起看最新版本4.0中的新特性。
Storage Pod 4.0
1. 使用更快的SATA Card 。Storage Pod 4.0使用了2個(gè)HighPoint Rocket 750替換了之前3張SATA Card結(jié)構(gòu),每個(gè)Rocket 750都通過(guò)6 Gbps Mini-SAS接口支持40個(gè)直連SATA設(shè)備通道,Rocket 750則通過(guò)8x PCIe 2.0卡槽連接主板。對(duì)比3.0版本,當(dāng)下的吞吐量提升大約4到5倍。雖然Backblaze從未遭遇吞吐量瓶頸,但4.0版本卻可以提升RAID陣列與系統(tǒng)的同步速度。
2. 連接器直接連接硬盤(pán)。在4.0 版本之前,磁盤(pán)的供電和連接都是通過(guò)底板完成,在版本更新后,每塊硬盤(pán)都有獨(dú)立的連接器來(lái)支撐供電和SATA連接,SATA連接會(huì)直接和Rocket 750交互,所有的45個(gè)連接器會(huì)被分為3組置于底座中。直接連接硬盤(pán)有多個(gè)好處:第1,降低了底板的設(shè)計(jì)復(fù)雜性;第2,取消了5個(gè)一組的底板,所有磁盤(pán)的管理和設(shè)置都可以在主板或者是SATA Card中進(jìn)行;第3,連接器的故障率比底板要低;第4,底板壞了的話會(huì)影響到5塊磁盤(pán),連接器只會(huì)影響到1個(gè)。
3. 新的SATA 電纜。每個(gè)Rocket 750都擁有10個(gè)接口,分別使用Mini-SAS連接器,新的SATA電纜會(huì)將Mini-SAS轉(zhuǎn)接器轉(zhuǎn)換成4個(gè)獨(dú)立的電纜,這4個(gè)電纜會(huì)分別通向連接磁盤(pán)的連接器,新的電纜可以同時(shí)完成SATA連接和供電。
4. 一個(gè)電源。之前版本的Storage Pod 擁有2個(gè)電源,花費(fèi)約占整個(gè)機(jī)架的25%(不包括磁盤(pán))。兩個(gè)電源并不是用于容災(zāi),機(jī)架確實(shí)就需要如此多的功率,它需要為45塊磁盤(pán)、主板以及為其他組件供電。單電源模式有效的減少了開(kāi)銷(xiāo)和復(fù)雜性,在減少重量的同時(shí)還增加了系統(tǒng)的穩(wěn)定性。
5. 更薄的機(jī)架和新的側(cè)邊設(shè)計(jì)。替換下底板還帶來(lái)了另一個(gè)好處——從17 5/8 到17 1/8,將支架的寬度減少了半英寸。這就允許了新的側(cè)邊設(shè)計(jì),之前一直很鋒利(甚至經(jīng)常割傷運(yùn)維人員)的L-bracket得以處理。
6. 更快的CPU 。CPU從i3-2100 (Sandy Bridge)升級(jí)到i3-3240(Ivy Bridge),這將讓處理變得更快,在結(jié)合了Rocket 750之后,吞吐量更是提升了4-5倍。在測(cè)試中,i3-2120和i3-3220表現(xiàn)的也不錯(cuò),但是鑒于他們與i3-3240的價(jià)格相差不多,我們果斷的選擇了后者。
7. 引導(dǎo)磁盤(pán)。引導(dǎo)磁盤(pán)從側(cè)面移到了底座的后面。新的位置不僅方便線纜的布局,也方便設(shè)計(jì)兩側(cè)的扶手,新的位置可以放置1到2個(gè)2.5英寸磁盤(pán)。