崗位職責描述:
1.負責安裝和配置GPU服務器上的系統和驅動程序,能夠海量部署服務器,確保其正常運行并達到性能標準;
2.負責GPU服務器的維護和優化;
3. 負責GPU集群的搭建和管理以及集群方案的制定及優化;
4.輔助關鍵軟件的設計、開發、調試、集成等;
5.熟悉本領域的建設和發展規劃;
6.熟悉本領域科學研究相關的科研條件建設;
7.可以編制服務器技術解決方案及產品規格書等;
8.OEM廠商產品的檢測工作等。
任職要求:
1.本科及以上學歷,具有3年以上工作經歷,年齡不超過35周歲(特別優秀者,可適當放寬);
2.熟悉GPU服務器,具備豐富的GPU硬件維護經驗;
3.熟悉cuda架構,熟悉主流訓練框架;
4.具有大數據中心工作經驗或大模型訓練和應用工作經驗者優先;
5.具有良好的溝通能力、表達能力、團隊協作能力,能夠獨立開展調研工作。