• telegreat@gmail.com

  • 020-5368877

2022-12-08

telegreat超强芯片打造ai性能超过512millionflops,打造深度学习服务器

telegreat全球旗舰产品,我们非常荣幸地宣布,通过heliop7超强的芯片打造了一款ai性能超过512millionflops,并且在芯片性能上,在定制化处理和ai训练性能上是业界主流。我们的硬件规划部门将继续针对开发人员实现稳定的ai平台,如malir32000gpu,或拥有更高能效的rtx2060/2070gpu;有数千个全定制特征点/密度的模型和更强的可扩展性。

4b9f5c54ca2460a-e1578896695117-450x280-480x300.jpg

而且凭借多款深度学习服务器,我们的客户可以利用更高效,高性能的模型执行,如最好的caffe,tensorflow和pytorch。通过整合malir2000gpu这个全新的gpu,通过高性能的端到端ai,模型处理,高效率数据流处理,和更便宜的研发成本,我们的机器学习服务器同样可以满足高端部署的要求。我们也会尝试整合更多最新的深度学习基础架构,和高性能数据的性能优势。

我们支持开发者在已有的malir32000gpu上训练,而无需同时支持tensorflow,pytorch和torch。我们现在正在开发第二代芯片,整合lava-gpu,我们发布了一个名为lava-gpu的新gpu架构;大型的tensorflowgpu资源占用以及即将到来的高性能、高模型并行架构,这两项将会改变现有gpu的架构。

我们将继续以mlp和xeonplatinumgpu为目标芯片并测试速度,我们也将通过深度学习服务器提供开发者对新gpu的选择。tensorflow1.1已经于11月10日早间正式发布,随后开发者们都已经收到了它的更新。从16版本开始,tensorflowgpu成本优势就已经显示了出来。而在11月10日之前,还有一系列变化将影响到端到端,特别是ai和深度学习的端到端可用性:1)gpu加速率从目前的0.2ghz提升到1.4ghz;2)定制化mlp训练、推理、可视化的成本最低。

可以期待的是,未来的训练并行性的改善,以及因网络层数不同而有可能带来的主干延迟更小;其次可以期待gpu所能带来的额外计算能力进一步减少。目前我们在硬件上已经做了非常多工作,希望做得更好,这可以让我们有更多的时间帮助客户实现良好的集成,以更好的方式结合客户的需求,做出最好的产品。我们的技术团队也在逐步扩大,我们的团队目前有400名工程师,加上基础架构部门的工程师,将有数千人。