追尋人類起源:那些伺服器才能應付基因排序研究運算?
現時世界上有很多不同的超級電腦,而一直以來這些超級電腦均主要為軍事以及研究所用,不過近年來隨著大數據分析需要,亦開始有以超級電腦作為大數據分析工具;提到數據分析,今次我們想帶大家看看波蘭華沙大學是如何以超級電腦去應付基因排序研究的運算工作。
華沙大學創新技術中心的次世代基因排序研究中心位於波蘭華沙,主要針對生物、醫學、診斷、以及治療進行尖端基因與生物資訊研究。而 ORION 集群系統的設計與建立目的,是為了儲存與處理該中心從基因排序產生的龐大數據。
華沙大學創新技術中心進行多項基因研究的合作計畫,為學界與業界提供次世代基因排序技術。現時全球各地的研究人員均運用該研究所進行各種次基因世代排序實驗,包含基因組、環境總體基因組、轉錄體、表觀遺傳等,協助完成許多奧妙的科學發現。很多在創新技術中心進行的生物資訊研究均是依賴由 ORION 集群系統所提供的極高運算效能。
而為了應付極高效能的運算需要及進一步支援次世代基因排序(NGS)的生物資訊研究,近日 AMD 便聯同 DELL 宣佈一個名為異構高效能運算(heterogeneous high performance computing,HPC)的研究成果,透過 AMD FirePro S9150 伺服器 GPU,最終成功為波蘭華沙大學創新技術中心(Centre of New Technologies)的次世代基因排序研究中心(Next Generation Sequencing Centre,NGSC),提供超過 1.5 petaFLOPS 的運算效能。
現時 ORION 集群系統共有 150 個 Dell PowerEdge R730 伺服器,每個伺服器內建 2 個 AMD FirePro S9150 伺服器GPU,單精確度運算效能達 1.52 petaFLOPS,雙精確度運算效能可達 0.76 petaFLOPS。此項省電集群系統為基因資料提供快速而高效的計算效能,可廣泛運用於各類基因與生物數據研究,在研究應用上充分發揮 OpenCL 的高速與省電效率;另外,AMD FirePro S9150 伺服器圖像方案亦搭載了 16GB 的超大記憶體容量,僅需要單個 GPU 便能運行各種先進生物資訊運算,而無需通過 GPU 間的溝通,使運作效率大幅提高。