信息互动

当前位置/ 首页/ 信息互动/ 正文

如何通过视频对象跟踪来加速机器学习

一个人真正变得擅长某件事通常需要很多次(重复)。这方面的例子包括拉小提琴,挥舞(和打)硬掷棒球,然后退回去完成长距离传球。同样,机器需要很多代表才能记住数据集,然后在有人需要信息时将其放到最前沿。许多人没有意识到这一点。

总部位于旧金山的初创公司Figure Figure 8完全了解这种做法,并专门教授人工智能引擎如何实现最佳性能,并通过视频代表来做到这一点。

图八将其产品描述为“在环机器学习平台”,8月14日推出了ML辅助视频对象跟踪解决方案,以加速为汽车等关键行业的客户创建培训数据以及运输,消费品和零售,媒体和娱乐以及安全和监视。

到目前为止,这是一个乏味的过程

迄今为止,该过程一直是缓慢,繁琐且昂贵的工作,要求每个帧中的每个对象都必须由人来标记。根据帧速率,每个帧中的对象数量以及视频的复杂程度,仅要注释一小时的视频,此过程可能需要数百或数千小时。

您可能已经看到了一个滚动式机器人设备的示例,该设备可以在田地中上下移动植物,识别杂草并将其抽出。或者,机械臂机器如何识别仓库中包装上的标签,并知道如何抓住它并将其移动到正确的传送带上。由非人类完成所有这些垃圾工作使生产系统对企业而言效率更高。

CTO Robert Munro告诉eWEEK,图八的名字源于人与机器之间的持续反馈循环。

Munro说:“世界上使用的现实世界90%的人工智能是由人提供动力的。” “这是您可以想象的所有用例。无人驾驶汽车在路边识别出行人的原因是,因为人们在许多小时的视频中都告诉了它-车道是什么,行人是什么。

“当您告诉手机搜索路线时,您的手机也可以理解,因为成千上万的人曾经为它提供相同的方向。”

数据集包括机器学习知识的主体

它是云存储系统和单个设备中的聚合数据集,构成了AI用于提供其功能的知识体系。图八一次又一次地使用视频循环进行训练,直到AI引擎识别出它应该知道的所有视频为止。然后,图八在其整个云服务中共享知识。

Munro说,借助机器学习辅助的视频对象跟踪程序包,用户可以注释视频帧中的对象,然后使机器学习预测持续存在于视频帧中的注释中。人工注释者可以查看机器预测并在必要时进行调整,以提供高度准确的视频注释,但其速度要比人工解决方案快100倍,在人工解决方案中,必须手动注释每个帧中的每个对象。

因此,它可以看到图像,记住图像,并能够将该图像放大100倍或更多倍,以加快注释过程。

Munro表示:“大规模创建高质量训练数据的唯一可行解决方案是将最佳的机器学习和人类智能相结合。” “去年,我们已经在图8平台中集成了深度学习集成模型,因此我们可以将数十亿个计算周期应用于先前针对计算机视觉和自然语言处理用例生成的数十亿个人判断。

“今天的结果是,我们的客户现在可以比以前更快的速度创建培训数据一百倍。通过将机器学习应用于质量控制过程,与纯手工过程相比,我们还可以更准确地进行注释,从而为我们的客户提供两全其美的优势:规模和准确性。”

ML不是什么神奇的代码

这篇文章完成了。希望您现在对机器学习的工作方式有了更多的了解,而这并不是一些神奇的秘密代码可以使这一切变得可行。

图八的机器学习辅助视频对象跟踪现已作为图八平台的一部分向所有客户提供。