高性能计算和AI
联系我们

南京艾法益登信息技术有限公司

电  话:138-0516-7316

手  机:138-0516-7316

Q  Q:手机微信

E-mail:13805167316@139.com

本公司网站展示的产品数据可能存在误差,如您需要准确的产品规格,配置,价格等,敬请与我们联系。我们将竭诚为您提供更优惠的价格和更优质的服务。欢迎来电垂询!
您的位置:首页 - 高性能计算和AI
戴尔(DELL)T640塔式服务器GPU电脑主机AI人工智能深度学习仿真科研高性能计算
发布时间:2020-12-07  浏览:

笔记本电脑上安装ipmitools软件,

服务器需要打开iDRAC端口的IPMI功能;设置静态IP地址:192.168.0.120

然后网线连接笔记本网口和iDRAC端口,同时设置笔记本静态IP地址和iDRAC端口在同一网段,192.168.0.121

然后输入下面的命令把风扇转速设置为手动的:

ipmitool -I lanplus -U ipmi用户名 -P ipmi密码 -H 服务器地址 raw 0x30 0x30 0x01 0x00

之后就可以调节转速了:

ipmitool -I lanplus -U root -P calvin -H 192.168.0.120 raw 0x30 0x30 0x02 0xff 0x20

值得关注的是上面16进制的最后一个16进制当你输入0x20的时候,速度就是32%; 输入0x18的时候,速度就是24%。


记录戴尔t640切换集/独显及安装驱动时踩过的坑

写在前面

先大体说一下机器:我用的是一台dell的t640塔式服务器,ubuntu16.04,用来做DL的。服务器加了一块2080TI显卡,主板自带集显。由于安装ubuntu后系统使用主板自带的集显,导致分辨率无法更改,只能以1900x800显示,画面粗糙,并且浏览网页刷新率很低以至于卡顿,所以我想用独立显卡来输出画面(虽然发热量会增大也没办法啊…)。总结这次安装驱动的过程,简直是一把辛酸泪。本来我的nvidia显卡驱动、cuda和cuDNN都是配置好的,开发环境正常用,但期间在搞驱动时不知道动到了哪块地方导致分辨率变为1366*768画面显示不全且无法联网,索性直接重装系统了。期间也遇到了安装驱动后在登陆界面无限循环问题,nvidia-settings不显示prime切换显卡等问题。

Nvidia驱动安装篇

首先说一下,ubuntu自带了一个开源的nvidia驱动名为nouveau,默认使用此项。要安装驱动有很多种方式,网上方法较多,主要概括为以下3种:
1.添加驱动源:sudo add-apt-repository ppa:graphics-drivers/ppa,再执行:sudo apt-get update更新源,然后直接在系统设置-软件与更新-附加驱动里选择合适的nvidia安装驱动;
2.终端sudo ubuntu-drivers devices查看推荐驱动版本(后面带recommand的那项),如我的是430版本,通过sudo apt-get install nvidia-430安装;
3.去官网下载nvidia驱动文件(.run文件)通过命令行安装。具体下载安装步骤见我的另一篇博客:《ubuntu16.04/18.04安装卸载NVIDIA显卡驱动》

注0:无论何种安装方式,安装完驱动后输入nvidia-smi都能显示出gpu信息。
注1:由于我在使用前两种方式时遇到了安装完驱动后循环登陆的问题,推测是与驱动自动安装时安的opengl有关,所以我最后选择第三种方式安装。

服务器改配置篇

到这里,输入nvidia-smi已经可以显示gpu信息了。但是,通过sudo apt-get install nvidia-settings nvidia-prime安装完nvidia设置后,应该是这样子的:在这里插入图片描述
然而我的界面要么提示打不开,要么只有左边两个选项,右边基本是空的,详细信息里面也还是显示的集显的驱动,分辨率依旧不能调节。也就是说,还是在用集显输出!遂上网求助,经过各种查找,发现了百度贴吧的一篇帖子,其中说到:在这里插入图片描述
在此实名感谢这位童鞋。下面说一下dell服务器关闭集显的方法:
1.启动服务器按F2进入进入System BIOS设置;
2.进入Integrated DevicesEmbedded Video Controller设置为Disabled,即可关闭板载集成显卡。并将Secure Boot也关闭。有种说法是连Memory Mapped I/O above 4G也关闭。

然后,在进入系统后分辨率自动改成了1920x1080,已经看着很舒服了,无奈详细信息里面显示的还是集显驱动…心累,先不搞了,最起码画面看着舒服点了。


最近实验室的dell T640服务器安装了新的GPU。但是安装后发现,风扇太吵了,于是开始着手解决风扇转速过高的问题。

试过ipmi,但是不好用。

最后发现使用racadm可以让服务器重新安静下来。

解决方案来自:

https://www.dell.com/community/PowerEdge-Hardware-General/PowerEdge-T640-fan-full-speed-after-installing-graphic-card/td-p/5849479

https://www.dell.com/community/Systems-Management-General/iDRAC9-impossible-to-modify-Fan-Response-for-3rd-Party-PCI-cards/m-p/6021679/highlight/true#M25681

 

针对ubuntu,需要用这个网站的方法安装racadm。

https://www.claudiokuenzler.com/blog/747/install-dell-openmanage-9.x-racadm-ubuntu-16.04

 

 

安装完racadm,使用

sudo racadm get System.PCIESlotLFM

查看有几个PCIE的东西。

一般来说是最后一个。

之后,使用

sudo racadm set System.PCIESlotLFM.8.LFMMode

设置模式,应该只有0, 1, 2 三种,对应高中低。

设置为2后,耳朵终于清静了。

转载于:https://www.cnblogs.com/vegetables-Adanos/p/10986956.html