下面,我就來嘗試,寫一篇最好懂的區(qū)塊鏈教程。畢竟它也不是很難的東西,核心概念非常簡單,幾句話就能說清楚。我希望讀完本文,你不僅可以理解區(qū)塊鏈,還會明白什么是挖礦、為什么挖礦越來越難等問題。
需要說明的是,我并非這方面的專家。雖然很早就關(guān)注,但是仔細(xì)地了解區(qū)塊鏈,還是從今年初開始。文中的錯誤和不準(zhǔn)確的地方,歡迎大家指正。
一、區(qū)塊鏈的本質(zhì)
區(qū)塊鏈?zhǔn)鞘裁矗恳痪湓挘且环N特殊的分布式數(shù)據(jù)庫。
首先,區(qū)塊鏈的主要作用是儲存信息。任何需要保存的信息,都可以寫入?yún)^(qū)塊鏈,也可以從里面讀取,所以它是數(shù)據(jù)庫。
其次,任何人都可以架設(shè)服務(wù)器,加入?yún)^(qū)塊鏈網(wǎng)絡(luò),成為一個節(jié)點。區(qū)塊鏈的世界里面,沒有中心節(jié)點,每個節(jié)點都是平等的,都保存著整個數(shù)據(jù)庫。你可以向任何一個節(jié)點,寫入/讀取數(shù)據(jù),因為所有節(jié)點最后都會同步,保證區(qū)塊鏈一致。
二、區(qū)塊鏈的最大特點
分布式數(shù)據(jù)庫并非新發(fā)明,市場上早有此類產(chǎn)品。但是,區(qū)塊鏈有一個革命性特點。
區(qū)塊鏈沒有管理員,它是徹底無中心的。其他的數(shù)據(jù)庫都有管理員,但是區(qū)塊鏈沒有。如果有人想對區(qū)塊鏈添加審核,也實現(xiàn)不了,因為它的設(shè)計目標(biāo)就是防止出現(xiàn)居于中心地位的管理當(dāng)局。
正是因為無法管理,區(qū)塊鏈才能做到無法被控制。否則一旦大公司大集團(tuán)控制了管理權(quán),他們就會控制整個平臺,其他使用者就都必須聽命于他們了。
但是,沒有了管理員,人人都可以往里面寫入數(shù)據(jù),怎么才能保證數(shù)據(jù)是可信的呢?被壞人改了怎么辦?請接著往下讀,這就是區(qū)塊鏈奇妙的地方。
三、區(qū)塊
區(qū)塊鏈由一個個區(qū)塊(block)組成。區(qū)塊很像數(shù)據(jù)庫的記錄,每次寫入數(shù)據(jù),就是創(chuàng)建一個區(qū)塊。
每個區(qū)塊包含兩個部分。
- 區(qū)塊頭(Head):記錄當(dāng)前區(qū)塊的元信息
- 區(qū)塊體(Body):實際數(shù)據(jù)
區(qū)塊頭包含了當(dāng)前區(qū)塊的多項元信息。
- 生成時間
- 實際數(shù)據(jù)(即區(qū)塊體)的 Hash
- 上一個區(qū)塊的 Hash
- …
這里,你需要理解什么叫 Hash,這是理解區(qū)塊鏈必需的。
所謂 Hash 就是計算機(jī)可以對任意內(nèi)容,計算出一個長度相同的特征值。區(qū)塊鏈的 Hash 長度是256位,這就是說,不管原始內(nèi)容是什么,最后都會計算出一個256位的二進(jìn)制數(shù)字。而且可以保證,只要原始內(nèi)容不同,對應(yīng)的 Hash 一定是不同的。
舉例來說,字符串123
的 Hash 是a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0
(十六進(jìn)制),轉(zhuǎn)成二進(jìn)制就是256位,而且只有123
能得到這個 Hash。
因此,就有兩個重要的推論。
- 推論1:每個區(qū)塊的 Hash 都是不一樣的,可以通過 Hash 標(biāo)識區(qū)塊。
- 推論2:如果區(qū)塊的內(nèi)容變了,它的 Hash 一定會改變。
四、 Hash 的不可修改性
區(qū)塊與 Hash 是一一對應(yīng)的,每個區(qū)塊的 Hash 都是針對”區(qū)塊頭”(Head)計算的。
Hash = SHA256(區(qū)塊頭)
上面就是區(qū)塊 Hash 的計算公式,Hash 由區(qū)塊頭唯一決定,SHA256
是區(qū)塊鏈的 Hash 算法。
前面說過,區(qū)塊頭包含很多內(nèi)容,其中有當(dāng)前區(qū)塊體的 Hash(注意是”區(qū)塊體”的 Hash,而不是整個區(qū)塊),還有上一個區(qū)塊的 Hash。這意味著,如果當(dāng)前區(qū)塊的內(nèi)容變了,或者上一個區(qū)塊的 Hash 變了,一定會引起當(dāng)前區(qū)塊的 Hash 改變。
這一點對區(qū)塊鏈有重大意義。如果有人修改了一個區(qū)塊,該區(qū)塊的 Hash 就變了。為了讓后面的區(qū)塊還能連到它,該人必須同時修改后面所有的區(qū)塊,否則被改掉的區(qū)塊就脫離區(qū)塊鏈了。由于后面要提到的原因,Hash 的計算很耗時,同時修改多個區(qū)塊幾乎不可能發(fā)生,除非有人掌握了全網(wǎng)51%以上的計算能力。
正是通過這種聯(lián)動機(jī)制,區(qū)塊鏈保證了自身的可靠性,數(shù)據(jù)一旦寫入,就無法被篡改。這就像歷史一樣,發(fā)生了就是發(fā)生了,從此再無法改變。
每個區(qū)塊都連著上一個區(qū)塊,這也是”區(qū)塊鏈”這個名字的由來。
五、采礦
由于必須保證節(jié)點之間的同步,所以新區(qū)塊的添加速度不能太快。試想一下,你剛剛同步了一個區(qū)塊,準(zhǔn)備基于它生成下一個區(qū)塊,但這時別的節(jié)點又有新區(qū)塊生成,你不得不放棄做了一半的計算,再次去同步。因為每個區(qū)塊的后面,只能跟著一個區(qū)塊,你永遠(yuǎn)只能在最新區(qū)塊的后面,生成下一個區(qū)塊。所以,你別無選擇,一聽到信號,就必須立刻同步。
所以,區(qū)塊鏈的發(fā)明者中本聰(這是假名,真實身份至今未知)故意讓添加新區(qū)塊,變得很困難。他的設(shè)計是,平均每10分鐘,全網(wǎng)才能生成一個新區(qū)塊,一小時也就六個。
這種產(chǎn)出速度不是通過命令達(dá)成的,而是故意設(shè)置了海量的計算。也就是說,只有通過極其大量的計算,才能得到當(dāng)前區(qū)塊的有效 Hash,從而把新區(qū)塊添加到區(qū)塊鏈。由于計算量太大,所以快不起來。
這個過程就叫做采礦(mining),因為計算有效 Hash 的難度,好比在全世界的沙子里面,找到一粒符合條件的沙子。計算 Hash 的機(jī)器就叫做礦機(jī),操作礦機(jī)的人就叫做礦工。
六、難度系數(shù)
讀到這里,你可能會有一個疑問,人們都說采礦很難,可是采礦不就是用計算機(jī)算出一個 Hash 嗎,這正是計算機(jī)的強(qiáng)項啊,怎么會變得很難,遲遲算不出來呢?
原來不是任意一個 Hash 都可以,只有滿足條件的 Hash 才會被區(qū)塊鏈接受。這個條件特別苛刻,使得絕大部分 Hash 都不滿足要求,必須重算。
原來,區(qū)塊頭包含一個難度系數(shù)(difficulty),這個值決定了計算 Hash 的難度。舉例來說,第100000個區(qū)塊的難度系數(shù)是 14484.16236122。
區(qū)塊鏈協(xié)議規(guī)定,使用一個常量除以難度系數(shù),可以得到目標(biāo)值(target)。顯然,難度系數(shù)越大,目標(biāo)值就越小。
Hash 的有效性跟目標(biāo)值密切相關(guān),只有小于目標(biāo)值的 Hash 才是有效的,否則 Hash 無效,必須重算。由于目標(biāo)值非常小,Hash 小于該值的機(jī)會極其渺茫,可能計算10億次,才算中一次。這就是采礦如此之慢的根本原因。
區(qū)塊頭里面還有一個 Nonce 值,記錄了 Hash 重算的次數(shù)。第 100000 個區(qū)塊的 Nonce 值是274148111
,即計算了 2.74 億次,才得到了一個有效的 Hash,該區(qū)塊才能加入?yún)^(qū)塊鏈。
七、難度系數(shù)的動態(tài)調(diào)節(jié)
就算采礦很難,但也沒法保證,正好十分鐘產(chǎn)出一個區(qū)塊,有時一分鐘就算出來了,有時幾個小時可能也沒結(jié)果。總體來看,隨著硬件設(shè)備的提升,以及礦機(jī)的數(shù)量增長,計算速度一定會越來越快。
為了將產(chǎn)出速率恒定在十分鐘,中本聰還設(shè)計了難度系數(shù)的動態(tài)調(diào)節(jié)機(jī)制。他規(guī)定,難度系數(shù)每兩周(2016個區(qū)塊)調(diào)整一次。如果這兩周里面,區(qū)塊的平均生成速度是9分鐘,就意味著比法定速度快了10%,因此難度系數(shù)就要調(diào)高10%;如果平均生成速度是11分鐘,就意味著比法定速度慢了10%,因此難度系數(shù)就要調(diào)低10%。
難度系數(shù)越調(diào)越高(目標(biāo)值越來越小),導(dǎo)致了采礦越來越難。
八、區(qū)塊鏈的分叉
即使區(qū)塊鏈?zhǔn)强煽康模F(xiàn)在還有一個問題沒有解決:如果兩個人同時向區(qū)塊鏈寫入數(shù)據(jù),也就是說,同時有兩個區(qū)塊加入,因為它們都連著前一個區(qū)塊,就形成了分叉。這時應(yīng)該采納哪一個區(qū)塊呢?
現(xiàn)在的規(guī)則是,新節(jié)點總是采用最長的那條區(qū)塊鏈。如果區(qū)塊鏈有分叉,將看哪個分支在分叉點后面,先達(dá)到6個新區(qū)塊(稱為”六次確認(rèn)”)。按照10分鐘一個區(qū)塊計算,一小時就可以確認(rèn)。
由于新區(qū)塊的生成速度由計算能力決定,所以這條規(guī)則就是說,擁有大多數(shù)計算能力的那條分支,就是正宗的比特鏈。
九、總結(jié)
區(qū)塊鏈作為無人管理的分布式數(shù)據(jù)庫,從2009年開始已經(jīng)運行了8年,沒有出現(xiàn)大的問題。這證明它是可行的。
但是,為了保證數(shù)據(jù)的可靠性,區(qū)塊鏈也有自己的代價。一是效率,數(shù)據(jù)寫入?yún)^(qū)塊鏈,最少要等待十分鐘,所有節(jié)點都同步數(shù)據(jù),則需要更多的時間;二是能耗,區(qū)塊的生成需要礦工進(jìn)行無數(shù)無意義的計算,這是非常耗費能源的。
因此,區(qū)塊鏈的適用場景,其實非常有限。
- 不存在所有成員都信任的管理當(dāng)局
- 寫入的數(shù)據(jù)不要求實時使用
- 挖礦的收益能夠彌補(bǔ)本身的成本
如果無法滿足上述的條件,那么傳統(tǒng)的數(shù)據(jù)庫是更好的解決方案。
目前,區(qū)塊鏈最大的應(yīng)用場景(可能也是唯一的應(yīng)用場景),就是以比特幣為代表的加密貨幣。下一篇文章,我將會介紹比特幣的入門知識。
十、參考鏈接
- How does blockchain really work?, by Sean Han
- Bitcoin mining the hard way: the algorithms, protocols, and bytes, by Ken Shirriff