边缘硬件谁更能打?测评:谷歌 加速器与英特尔

< --="" -="">随着人工智能()和机器学习()逐渐从科幻小说中走向现实生活,我们现在需要一种快速便捷的方式来对这种类型的系统进行原型设计。尽管台式计算机也可以足以满足 / 的运行要求,甚至 之类的单板计算机都能满足这些需求。但是,如果你只想要一个简单的插件设备让你的系统运行地更快、更强大,那该怎么办?< -="-">别担心,其实你有多种选择,包括旗下系列硬件(加速器,下称) 和旗下的(神经计算棒 )。两个设备都是通过插入主机的计算设备。使用的是视觉处理单元(),而使用张量处理单元(),两者都是用于机器学习的专用处理设备。今天就来给大家测评比较一番:二者之间有什么区别?作为开发者的你,是选择好还是呢?话不多说,请参见下文。< -="">(加速器)< -="">- 加速器:由设计的 (专用集成电路) 芯片。专为 模型提供高性能的推理( + ,来自官方最新更新的数据)。< -="">-支持. 端口和缆线(, / 传输速度)< -="">-尺寸: < -="">-官方价格:$ .< ="--">< ="--">< -="_"> (英特尔神经计算棒 )< -="">-处理器:英特尔视觉处理单元()< -="-">- . -< -="">-尺寸:.< -="_">-官方价格:$ .< ="--">< ="--">< -="--">一、处理器与加速性能对比< -="">和比较传统计算机的方式不同,比较每个处理器/加速器的细节更加细微,主要取决于你打算如何使用它们。尽管输出格式略有不同(每次推理时间与每秒帧数),但是我们仍然可以将这两种设备进行一些总体性能模式的对比。< -="">在评估用于实时部署的模型和硬件平台时,首先要看的是——它们的速度如何。在计算机视觉任务中,基准通常以每秒帧数()进行测量。较高的数字表示更好的性能,对于实时视频流,至少需要大约才能使视频显得流畅。< -="">运行性能:首先,将添加到台式机时,可将性能提高大约倍,运行性能较为不错。(根据选择的型号不同,倍性能略有上下浮动)与较旧的处理器“合作”,可将处理速度提高近倍。但是,与更强大的处理器搭配使用时, 呈现的结果却并不令人惊喜。< -=""> 理论上可以以的速度执行推理。奇怪的是, 也拥有完全相同的费率,虽然两者都使用不同的操作来执行 。此外,英特尔声称的性能是初代神经计算棒的倍。(如果你乐意的话,你可以选择 ,而非初代神经计算棒,虽然价格较低。)< ="--">< ="--">< -="">官方评测< ="--">< ="--">< -=""> 可以使用 - 运行 分类模型,这一点还不错。但是,以 的速度进行对象检测就有点困难了。大约 的帧速率可能不足以进行实时对象跟踪,特别是对于高速运动,并且可能会丢失许多对象,并且开发者需要非常好的跟踪算法来弥补这个“漏洞”。(当然,官方给出的基准测试结果并不完全可信。通常,这些公司会将其手动优化的软件与竞争对手的开箱即用模型进行比较。)< ="--">< ="--">< -="">用户实操评测< -="">功率消耗: 的功耗较低。就而言,官方确实列出了每个所需.瓦。用户还可以根据需要将设置为默认速度或最大(默认值的倍)。< -="">值得注意的是, 的官方文档确实明确提醒:设备以最大速度运行时的功率传输以及最高环境温度,可能会烫伤你的皮肤。所以个人认为,除非你确实需要额外的处理能力,否则最好以正常模式运行它。< -="">同样重要的是,请记住,并非是让设备获得优秀性能的首选。这两种设备都支持 ++ ,这也是我在测试中让设备获得最佳性能的“窍门。< -="">二、软件支持< -=""> 可以与 ,,等其他操作系统一起使用。它可以通过开放神经网络转换来支持 ,,,以及和 。< -=""> 不支持 ,但可以在. 或更高版本(或任何衍生版本,如 .+)下运行。值得一提的是, 只能正式运行 模型。< -="">三、尺寸、原型设计和其他细节对比< -="_">涵盖了软件支持、计算能力和功耗之后,二者在实际构建产品原型上的具体情况如何?< -="">坦白说,这两种设备看起来都非常酷。为略银白色纹格机身,具有部分透明的主体以及似乎是散热槽的地方。而 为光滑的蓝色设计,蓝色机身和集成的散热器看起来似乎更加时尚。< ="--">< ="--">< ="--">< ="--">< -="">当然,外观只是次要的。重要的是,确实也会像一样,运行时会变热。不过它的散热器设计,让你可以将其握在较凉的集成散热片上,而无需用手指在中间握住,这一点到是非常的巧妙。< -="">的设计允许用户将多个计算棒一起使用以增强它的处理能力。你可以将它们整齐地排列在垂直的扩展坞中。同样的,一台主机也可以运行多个,不过你可能需要找到另一种方式来保存每个。值得一提的是,虽然二者都有相似的尺寸,但的厚度(毫米)几乎是的两倍。再加上它是通过插头(例如超大型拇指驱动器)插入的,而不是通过像这样的柔性电缆插入的,这意味着在某些操作场景中, 会让你在处理空间问题上很艰难。你必须大量使用数据线缆和扩展坞,这一点是在你做出选择前,需要考虑到的事。< ="--">< ="--">< -="_">最后, 和似乎都是为边缘计算应用程序设计的专属设备。如果你需要在系统上运行,或者需要在 框架之外运行,那么具有较为明显的优势。就其本身而言, 的周边配套硬件,还有更加简单粗暴的开发板 和以为核心设计的 加速器、以及和开发板很像的模块等等。如果你的需求是想将产品原型设计快速推向市场,那么则是你的不二之选,它对开发者的吸引力更为强劲。< ="--">< ="--">< ="--">< ="--">< -=""> 开发环境要求:一台带有端口的计算机;支持 .或更高版本,或其衍生系统(如 .+);_或具有指令集的系统架构< -="">所以,从上面这几点要求来看,加速器支持 。但是,必须是//+且运行系统(或其它衍生系统)。< -="_-">在这一点上,两者之间的功能很是相似,如果要将 / 添加到 或类似项目中,两种设备都可以正常工作。< -="_">许多预编译的网络模型让你可以轻松快速地获得更佳的结果。尽管如此,完全量化自己的网络仍然是一项高级任务。转换需要对网络以及操作方式有深入的了解。此外,当我从_升级到_,从_升级到时,关于准确性的损失也很大。有趣的是, 可处理其一半浮点, 仅能处理位浮点。这意味着可获得更高的准确性。< ="--">< -="">英特尔和显然采取了两种截然不同的“套路。 的优势在于产品可以帮助开发者们轻松构建和推广到-的一整套解决方案。我个人就非常喜欢所有组件如何组合在一起工作。另一方面,英特尔提供了插件,开发人员可以使用它们来优化其网络,使其能够在各种硬件上运行。 当前支持英特尔,,和。摆在英特尔面前的挑战是,这些”组合拳“始终难以利用每个组件的最优功能。< -="">能够在线训练网络模型,这对于进行迁移学习至关重要。显然, 相信他们的预训练网络和迁移学习为开发者们提供了高效的搭配。此外,英特尔具有三对内置的立体声深度硬件,在许多用例中(例如避障),它们是很有价值的。< -="">应用场景:< -="">英特尔还提供的原型、验证和部署。对于无人驾驶和无人驾驶车辆以及物联网设备而言,低功耗是必不可少的。对于希望开发深度学习推理应用程序的人来说, 是最节能,成本最低的棒之一。< -="">比如即将亮相的钛灵,也内置了英特尔运算加速芯片,降低的学习与开发门槛,帮助爱好者及开发者们快速构建会听、会说、会看的应用及解决方案。< -="-">不仅仅是硬件。它轻松地结合了定制硬件,开放软件和先进的算法的功能并提供了高质量的解决方案。在帮助工业发展领域有很多应用案例,包括预测性维护、异常检测、机器人技术、机器视觉和语音识别等。它对制造,医疗保健,零售,智能空间,内部监控和运输部门很有应用价值。< ="--"><>

Powered by ios加速器 @2013-2022 RSS地图 HTML地图