fyty8888@163.com

我設(shè)想的未來計(jì)算機(jī)硬件架構(gòu)

作者:
安徽新天源建設(shè)咨詢有限公司
最后修訂:
2020-07-30 15:03:43

摘要:

目前的計(jì)算機(jī)硬件結(jié)構(gòu),是以CPU為中心,以芯片組配合CPU,各種功能卡或者集成或者獨(dú)立插卡形式組合成的。這種結(jié)構(gòu)存在弊端,就是:

1、各種功能組件是有層次結(jié)構(gòu)的,固定的層次結(jié)構(gòu)難以適應(yīng)多變的需求,比如普通用戶對硬盤傳輸速度需求不高,而對硬盤傳輸速度需求高的用戶卻發(fā)現(xiàn),現(xiàn)有硬盤傳輸接口速度達(dá)不到要求。

2、各種舊的投資在升級硬件后難于再利用,只能拋棄。

3、硬件一部分損壞,除了維修,沒有別的辦法,難于部分更換。

為此,我提出一個(gè)以光傳輸為中心的分列板卡的硬件結(jié)構(gòu)。這種結(jié)構(gòu),將計(jì)算機(jī)硬件各功能部分,拆成一個(gè)個(gè)標(biāo)準(zhǔn)尺寸的小板,通過光傳輸聯(lián)系到一個(gè)總控設(shè)備上,將各種需要處理的信息,通過光信號在各功能部件間傳輸。

一、某些需要說明的東西

計(jì)算機(jī)的各組件應(yīng)該采取平等的態(tài)度對待,具體就是把主板的概念拋棄,用一條統(tǒng)一的光通路鏈接各組件,而各組件采取小板的形式呈現(xiàn)。每個(gè)板子分配一個(gè)64位地址,其中高32位為硬件類型,低32位為在機(jī)器里的同類型編號。各組件以類似局域網(wǎng)形式鏈接。

好處就是,比如CPU板,可以任意的添加和異構(gòu)化組合,比如Intel結(jié)構(gòu)的CPU板只需要更換成AMD結(jié)構(gòu)的CPU 板就使整個(gè)機(jī)器改換。同樣道理,添加CPU板則使機(jī)器多CPU化,甚至一個(gè)板子上集成多核,使用多個(gè)板子則CPU核將依次增加,相當(dāng)容易。:)而且如果以 后升級CPU,舊的板子不需要拿下,還可以使用。

二、硬件通訊架構(gòu)

建立一個(gè)中心光交換節(jié)點(diǎn)S,有設(shè)備1、2,每個(gè)設(shè)備都有輸入和輸出兩條通訊鏈路與S連接,此時(shí)結(jié)構(gòu)圖如下。

 

假設(shè)1需要傳送數(shù)據(jù)到2,1發(fā)送含有地址的數(shù)據(jù)包到S,S發(fā)現(xiàn)目的是2的數(shù)據(jù),發(fā)送數(shù)據(jù)到2的輸入端,然后進(jìn)入2。如果目的地址是全1信號,則為廣播到所有設(shè)備的信號,如果低32位全1,則為廣播到所有相同類型設(shè)備的信號。

整個(gè)數(shù)據(jù)信號采取光信號形式傳送,假設(shè)信號為10Gbps,則整個(gè)鏈路的傳送速度是很快的,不排除技術(shù)進(jìn)步使信號比特率達(dá)到更高速度的可能??梢钥紤]把每個(gè)設(shè)備的光傳送部分獨(dú)立為可更換可兼容形式,方便以后的升級。

如果技術(shù)的進(jìn)步達(dá)到一定程度,甚至可每鏈路并行傳送多條信號,比如單路輸入輸出信號10Gbps,因?yàn)楣庑盘柌粫嗷ジ蓴_,則并行64路信號能輕易達(dá)到640Gbps,不過多并行的光信號會遇到同步的問題。

為了使整個(gè)系統(tǒng)的速度不會受影響,應(yīng)該限制系統(tǒng)最大的設(shè)備板的數(shù)量,當(dāng)然這個(gè)限制可根據(jù)機(jī)器的用途和總的S交換帶寬來規(guī)定,比如家用級最大不超過32塊,服務(wù)器級不超過128塊等等。 

三、設(shè)備板及其分類

每個(gè)設(shè)備板的尺寸應(yīng)該做統(tǒng)一的規(guī)定,以方便將來插在統(tǒng)一的接口上和系統(tǒng)連接,系統(tǒng)連接的接口應(yīng)該是數(shù)據(jù)傳送和電源的統(tǒng)一接口,電源部分應(yīng)該支持熱插拔。板子 上應(yīng)該存在能自動(dòng)確定板子地址的電路或者能手動(dòng)跳線設(shè)定地址的電路(某些特殊板子比如CPU、內(nèi)存板子可考慮能手動(dòng)更改地址的可能,以方便系統(tǒng)確定優(yōu)先板 的位置)。

標(biāo)準(zhǔn)尺寸的板子可稱為標(biāo)準(zhǔn)板或者全長板,還可以定制半尺寸或者1/4尺寸板子用在小尺寸的設(shè)備上比如閃存等。

另外,某些設(shè)備需要散熱,比如CPU、GPU,需要的厚度很大,我們可以把設(shè)備板的厚度規(guī)定一定的數(shù)值,標(biāo)準(zhǔn)厚度的稱為1U板,兩個(gè)標(biāo)準(zhǔn)厚度的稱為2U板,依次類推。需要屏蔽電磁干擾的設(shè)備則可覆蓋屏蔽金屬層。

為了方便連接設(shè)備板,對應(yīng)的機(jī)箱內(nèi)部應(yīng)該相抽屜一樣分成若干層,每層有凹槽和接口兩部分組成,設(shè)備在用力推入后,能依靠彈力鎖定在接口上,并用凹槽支撐。標(biāo)準(zhǔn)的1U板應(yīng)該是在立式機(jī)箱里平行于地面的,如現(xiàn)在的PCI卡一樣,方便散熱。而厚度大的板子如CPU、硬盤等,可考慮單獨(dú)于其他設(shè)備板,平行于機(jī)箱的側(cè) 板放置,甚至如現(xiàn)在的標(biāo)準(zhǔn)3.5寸存儲設(shè)備的位置可劃撥給厚設(shè)備板使用。當(dāng)然,如硬盤等,采取傳統(tǒng)的卡式用電纜鏈接的也可以,不過,每設(shè)備都應(yīng)該聯(lián)在獨(dú)立的設(shè)備卡上。(本來應(yīng)該有個(gè)圖片的,來說明實(shí)際機(jī)器里板子的物理形態(tài)和連接,可惜需要CAD做圖,來不及啊,呵呵)

四、傳統(tǒng)可稱為BIOS的部分

因?yàn)樗械挠布荚诓煌脑O(shè)備板上,此時(shí)統(tǒng)一控制的方法只能放棄,除了系統(tǒng)通訊鏈路的兩端有簡單的控制芯片外,每個(gè)設(shè)備板上都需要自己的單獨(dú)控制。內(nèi)存閃存上應(yīng)該有簡單控制芯片,而CPU板上則必須有更復(fù)雜的控制。

所以傳統(tǒng)的BIOS部分應(yīng)該分布在了各系統(tǒng)板上,而且在系統(tǒng)運(yùn)行過程中獨(dú)立發(fā)揮作用。

為了統(tǒng)一系統(tǒng)控制,還應(yīng)該考慮,在系統(tǒng)通訊鏈路部分增加一個(gè)閃存存儲部分,來設(shè)定系統(tǒng)參數(shù)、存儲系統(tǒng)相關(guān)信息。這個(gè)部分的容量應(yīng)該能支持很大的數(shù)據(jù)存儲,并且損壞掉后只能影響系統(tǒng)的啟動(dòng)速度,系統(tǒng)沒有這個(gè)部分,可自我檢測運(yùn)行。當(dāng)然也要能可廉價(jià)更換。

五、核心的CPU

關(guān)鍵的CPU板,除了CPU插槽、CPU之外,應(yīng)該包括供電部分,數(shù)據(jù)傳輸?shù)葌鹘y(tǒng)必需的部分,還要包括一個(gè)可寫的存儲單元,此單元在板子上不可寫,但可獨(dú)立 取下(帶電情況下),并連接系統(tǒng)的USB部分來更新其中的內(nèi)容。存儲單元的地址在CPU板初始加電后被映射入內(nèi)存空間,內(nèi)容是一段程序,支持CPU板正常 的初始化和設(shè)置。正常啟動(dòng)后,則不再需要(此時(shí)可以取下)。

每個(gè)板子能支持多核CPU,每個(gè)CPU核都能控制該板,象多個(gè)CPU板一樣工作。

因?yàn)橄到y(tǒng)里可能存在多個(gè)CPU板,且運(yùn)算能力不同,所以必須存在一個(gè)機(jī)制來決定哪個(gè)板子在系統(tǒng)里起控制作用,這可以制定一個(gè)參數(shù),存儲在CPU板子里,參數(shù) 的大小決定CPU板子的運(yùn)算能力的大概強(qiáng)度,或者簡單的參數(shù)大的運(yùn)算能力大,然后系統(tǒng)啟動(dòng)時(shí),所有CPU板子都廣播自己的參數(shù),選舉出參數(shù)大的做主控CPU板子。

六、存儲系統(tǒng)的構(gòu)成

存儲系統(tǒng)比較復(fù)雜,目前的技術(shù)不能找到一種廉價(jià)高速的存儲方式,所以還要有昂貴高速的內(nèi)存和廉價(jià)低速的外存。

內(nèi)存和外存必須區(qū)別對待。

對于外存,采取一般的設(shè)備板方式對待。需要考慮的是,本文方式下的外存儲器最好是帶比較大的緩存,方便快速的響應(yīng)系統(tǒng)的其他設(shè)備的高速通訊需求。

對于內(nèi)存板,考慮到很可能各種技術(shù)和形態(tài)的內(nèi)存存在,必須有一種機(jī)制規(guī)劃整個(gè)的系

統(tǒng)的內(nèi)存,可以考慮在CPU板上建立映射機(jī)制,把不同的內(nèi)存板映射到不同的內(nèi)存空間。具體的映射方式考慮和內(nèi)存的容量和速度有關(guān)。

考慮到可能最終的通訊速度和內(nèi)存速度不匹配。CPU板最好是帶有比較大的三級緩存器,比如64M。 :)

對于一般化的設(shè)備,我想比較方便的方式是按照現(xiàn)在的USB設(shè)備和系統(tǒng)鏈接的方式來設(shè)計(jì),但是,這種方式的設(shè)備支持和設(shè)備間通訊的速度應(yīng)該是沒有當(dāng)前USB系統(tǒng)的種種限制的。如果未來無線的速度能達(dá)到很大的數(shù)值,可考慮一部分的設(shè)備板以無線方式連接到系統(tǒng)。

七、系統(tǒng)啟動(dòng)流程

系統(tǒng)加電后,每塊設(shè)備板都自我初始化,然后廣播自己的設(shè)備地址,然后選舉出主CPU板。主CPU板接過控制權(quán),將開始各設(shè)備的高級的詢問和設(shè)定,內(nèi)存板的整合,找到表明為啟動(dòng)設(shè)備的板,裝入啟動(dòng)代碼。期間其他CPU板將開始以多線程類似的方式協(xié)助主CPU板工作,甚至可能會開始第二操作系統(tǒng)的啟動(dòng)。 :)

啟動(dòng)過程中遇到的任何錯(cuò)誤和導(dǎo)致停機(jī)的信號,都會以特殊系統(tǒng)廣播的方式在通訊鏈路里循環(huán)廣播(可被交換節(jié)點(diǎn)S捕捉到,并能顯示出來),致命錯(cuò)誤會一直廣播直到斷電。

八、可能遇到的困難

1、可能要重新設(shè)計(jì)現(xiàn)有的CPU的硬啟動(dòng)流程。

2、多種設(shè)備混合通訊,能否做到對主設(shè)備板,比如CPU通訊的實(shí)時(shí)響應(yīng)。

3、隨機(jī)加入和退出的設(shè)備板,必須以穩(wěn)妥的方式對待,比如一個(gè)CPU板突然壞掉就可能是致命的,特別是如果是主CPU板。

4、電源系統(tǒng)的設(shè)計(jì)需要重新進(jìn)行。

5、各設(shè)備板必須有一種速度很大并穩(wěn)定的方式進(jìn)行通訊,這種方式能以廉價(jià)的方法提高速度,目前我認(rèn)為光通訊比較好。 :)

九、優(yōu)缺點(diǎn)

優(yōu)點(diǎn)是擴(kuò)展容易,管理簡單,能有效隔離干擾,對高發(fā)熱設(shè)備能有效的和其他設(shè)備隔離,提供好的散熱環(huán)境,升級也變得極簡單。

缺點(diǎn)是可能不好找到廉價(jià)的高速光交換手段,現(xiàn)在的硬件設(shè)計(jì)都要變更,低端軟件要重新編寫。