Q 曙光与高校在集群系统方面有哪些合作?如何高效地实施集群系统管理?集群系统应用中遇到的问题以及如何解决?
A 曙光会积极地参与国内高校的高性能计算机集群地建设,这方面,我们已经取得了很多的成功,建成了很多高性能集群,比如有中南大学、中山大学、中国矿业大学、南京航空航天大学、湘潭大学等,曙光的高性能集群在国内高校中已经超过了上千套,目前正在积极参与的包括清华大学、复旦大学、大连理工大学、中山大学三期等等。
集群系统的建设其实是一个非常复杂的过程,除了最核心的计算系统、网络系统和存储系统等IT核心硬件设备,还包括基础设施建设、管理调度软件与应用软件建设、运维及应用支持、管理员及用户培训等等,大部分集群系统在建设初期往往只重视硬件设备地建设,而忽视管理运维、高性能应用软件支持和培训等方面的内容,造成了项目建成后应用缺乏,应用支持能力差,系统用户满意度低,集群使用效率低等问题,所以高性能集群系统的建设不仅仅是一个硬件设备建设的过程,更重要的是一个服务与运维的综合系统。
例如我们于去年年底建成的中南大学高性能计算中心,就是一个非常好的典型案例,该系统在硬件系统合理可靠的基础上,非常重视应用软件的支持和整体的管理运维,培训等方面的工作,所以项目建成后效果非常好,校内外用户众多,用户满意度高,集群使用效率长期保持在90%以上。
集群系统目前最大的问题是应用的支持和管理运维,解决方法就是通过专业应用支持,管理运维优化和培训来提高集群的使用率和用户满意度。

特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。