您正在研究哪些研究問題?
超級計算中心(和數據中心)配備了比它們需要的更多的電力和冷卻能力——期望涵蓋“最壞情況”的負載,再加上一點安全。我們有足夠的軟件堆棧用于功率受限的超級計算,以允許“硬件過度配置”:在常見情況下,在電氣和冷卻能力的極限下購買盡可能多的計算硬件,并依靠軟件在可能超過該限制時動態分配和重新分配電力。
研究問題是,就增加計算能力而言,這能為你帶來多少收益。對于具有恒定、可預測工作負載的數據中心,可能不多。然而,對于超級計算中心來說,在工作負載之間和工作負載內部都存在更多的變化,尤其是在 GPU 運行時。根據初始電氣和冷卻配置的保守程度,我們可能能夠在相同的包絡中獲得更多 2-4 倍的計算。
大約十年前,Zhang等人在他們的“Trap Capacity”論文中探索了這個想法,遠在GPU吞噬世界之前。可能終于到了推出這個的時候了。
本站所有相關知識僅供大家參考、學習之用,部分來源于互聯網,其版權均歸原作者及網站所有,如無意侵犯您的權利,請與小編聯系,我們將會在第一時間核實并給予反饋。