
您自己的学习服务器就像20世纪的机器一样:如果您认真地从事数据科学工作,迟早会发现您需要一个统一的自定义环境,对独立于雇主和管理员规则的资源充满信心。 有人会说一切都可以在云中完成,但是不断的访问,长时间的24/7实验甚至是数据存储都将是一分钱。
因此,如果您决定-您需要建造花园城市。
让我们看看我们需要什么:
- 数据集必须位于某处。 需要具有存储和快速访问大量数据的能力。
- 显卡 Resnet和Unet正在等待。
- 多核处理器。 许多人忘记了,但是numpy,pandas和渐变增强算法中的许多操作已完全并行化以用于多线程,但仍不适用于视频卡。
- 内存 必须包含所有内容。
- 其余的应该为这些参数服务:一个足够的电源,一个机箱和一个主板,一个可以满足所有需求的操作系统。
当然,最重要的决定因素是预算。 我把我的定义在15万卢布左右。
因此,第一个也是最昂贵的是
视频卡 。 让我们承认一个明显的事实:Nvidia现在是框架性能和兼容性的绝对领导者,如果您正在编写神经网络,则需要cudnn和cuda。 但是好的显卡值得一个舍不得:如果我们想要至少11 Gb的内存和相应的性能,我们需要为顶级型号支付$ 1000 +。 视频卡四处飞扬,价格上涨。 如何成为 我们必须记住,现在我们正处在一个独特的时代:加密货币泡沫在接缝处破裂,大量矿工的视频卡进入市场。 我是使用过的1080 Ti的骄傲拥有者,价格为3万卢布,并且在将近一年的时间里,她从未让我失望过,以24/7的速度工作。 使用Windows计算机(由于某种原因,大多数视频卡测试程序是专门为此系统设计的),储备程序,检查您的工作范围,大胆地使用便宜1.5-2倍的图形加速器。
继续计算器的思想,让我们继续进行
处理器 。 在这里,我想与上一个类比地说,英特尔是绝对的领导者(尤其是自从我在那儿工作以来)。 仅当我们在谈论单线程应用程序或无限预算时,这才是正确的。 但是,我们没有一个案例,而是另一个案例,但是我们想并行处理,把钱留在这里,尤其是AMD Ryzen,尤其是他们的Threadripper系列。 对于700-1,000美元,您可以购买Catboost可以在其上飞行的24-32核芯片,英特尔的类似参数要贵两倍。 当然,有一个很大的“ BUT”:Threadripper的性能要归功于特定的设计,这必须要加以考虑(下文有更多介绍)...

汇编者的一句话:“我认为,在最近Intel惨败10980XE之后,选择哪个处理器进行多线程计算的问题有了一个很明确的答案。 但是...一切都会改变。”
然后我们继续
记忆 。 如果服务器的RAM小于32 GB(这很容易让健身手环指望),并且拥有较高的内存(3200 +,ZEN和ZEN 2体系结构处理器喜欢它),那就更好了。 当然,RAM不是电路中最困难的组件,这意味着有很多制造商,但是最好选择经过验证的制造商(我选择了Corsair)。 在这里,您需要确定摄取多少以及通道数。 最简单的答案是:更多,以便每个裸片上都可以容纳16 GB。 看来您的PC中可以有256个工作人员。 但不是那么简单。 如果您使用双通道内存,则访问内存中相同信息量的活动核心将增加两倍,这意味着访问速度会降低-在此您需要记住快速访问内存的需求,这是一个关键要求。 因此,我们采用四通道。 在每个裸片上,我们将有8个内存。
收集者的另一个见解,或者说是关于Threadripper的承诺细节:“通常,如果您有口头禅,那么所有内存通道都必须已满”(并且Threadripper有4个),您可以向下滚动。 我提醒其他人,这种旧体系结构的处理器具有4个NUMA节点的有趣结构,这些节点具有异构内存访问权限。 它们可以使用一个通道,但是您将积累由该体系结构引起的延迟。 在已经基于ZEN 2构建的较新的Threadrippers中,该功能被取消,但计算机仍然希望拥有许多存储通道。”
因此,我们推算出
主板上的内存插槽数量限制,至少为4个(以获得32 GB),最好为8个。值得立即考虑是否要购买第二个视频卡,当然,也要咨询制造商。 在这里,我们发现市场上没有太多符合我们限制的PC(而不是服务器)的报价(至少在打算使用此机器时,报价很少)。 当然,华硕是我想起的事情,我会以无限制的预算来使用它,但是为了适应这个框架,我们选择了一家大公司的弟弟华擎(即使在卢布下跌之后也可以使用)。
当然,拥有如此快速的计算器,依靠硬盘的速度却很奇怪,这意味着我们需要SSD。 它们当然更昂贵,但是事实证明,很少有任务需要数TB的数据进行持续访问。 因此,您可以占用512 GB的空间,并将尚未删除的数据集以及一系列家庭电影保存在单独的经典TB磁盘上。 或更多。 需要多少,预算允许多少。
收集了主要组成部分之后,我们想知道什么可以赋予经济权力。 然后考虑发展,例如考虑第二个视频卡(最好留一点余地)。 而且,当然,有必要决定谁来冷却这种力量。 Threadrippers像3月8日的花朵价格一样温暖,因此您需要强大的冷却系统。 正式来说,采用强空气和水的方法是可行的,但我建议您采取水处理:价格与强空气可比,但是不会一直感觉到您生活在跑道上。 另外,近年来,提供专门用于Threadripper的高效冷却器的制造商数量有所增加-有很多选择。

通常,所有东西都是组装在一起的,仍然要装在一栋宽敞的建筑中-不会有任何建议,这是自我表达的机会-您可以选择自己喜欢的一个。
购买所有幸福有以下几种选择 :
- 为了在外面集合某人
- 优点 :可以再次检查软件包,没有兼容性问题
- 减去 :〜10-15%的成本,取决于工作的复杂性和组件的成本
- 将所有内容写在纸上,到Savelovsky / Gorbushka(如果您住在莫斯科)并在那里收集。
- 优点 :好像在交付过程中没有任何失败 ,它们将为您做所有事情,减少组装费用
- 缺点 :可能没有最便宜的组件(即使在一个市场的框架内,价格也上涨了50%,加上这个价格,我可以尝试使用B / Y)
- 在Yandex市场上订购所有东西
- 在国外订购所有商品(aliexpress / ebay)
- pluses :最便宜的选择,抵达后感到惊喜
- 减 :到达后感到惊讶(严重的是,不要这样做-他们在Sportloto中获胜的频率更高)
我本人选择了第一个选项(就个人而言,我可以推荐特定的人)。
当一切到达并组装好之后,它仍然可以滚动系统。
这是另外一篇文章的故事,我会简单地告诉您:由于我也想将其用作台式机并且具有Linux的经验,因此由于其受欢迎程度,我选择了Ubuntu Linux。
当一切正常时,请向您的ISP请求一个静态IP-它是免费的还是廉价的,并且将使您几乎可以在任何地方访问Jupiter笔记本电脑。
最后,我要说的是我的观点,它是通过研究市场和与专家沟通形成的。 我满足了预算,近一年来,现代技术奇迹一直在顺利进行。 一段时间后,我安装了jupyterhub并开始结识朋友,所以我们住在服务器上的小公社里,我们训练网格,这正是我想要的。

最终计算(2019年开始的价格):
由Jet Infosystems机器学习小组负责人Nikolai Knyazev发表