2023-05-12 14:44:02
近年来,以高度相似性模拟特定人的语音、AI谱曲、AI作画和ChatGPT为代表的人工智能内容生成技术(AIGC)逐渐成为社会大众关注的热点。事实上,人工智能技术在智慧城市里早已深入应用,例如人脸识别、车牌识别、指纹识别、二维码扫码和语音识别等。在传统工业领域,以计算机模式识别为代表的软件模块早已经是一些工业自动化系统高效运转的强大基石,例如光电鼠标,通过图像帧差的实时分析能够精准、高速锁定鼠标的移动位置,等等。当前这一波人工智能技术与传统的侧重于“检测、识别”的技术的重大不同在于,它是专注于“内容的合成”,就像氢气和氧气燃烧生水、以及水可电离分解成氢气和氧气那样,是正好相反的两个过程。
对于检测、识别过程,其最大的难点在于克服各种天然的噪声和人为的干扰,这几乎是不可能彻底避免的。以视觉检测识别类AI为例,算法需要克服平移、旋转、缩放、失焦模糊、遮挡、镜反、光照差异、仿射畸变和加性噪声等九种因素带来的图像差异对目标模式的干扰。一般在工业自动化系统里由于生产线环境的可控,使得影响干扰因素较少,因而容易取得更好的识别效果,例如光电鼠标对位置的识别,在鼠标底部接触桌面的空间容易形成一个封闭的环境,较少地产生对于图像干扰的上述因素。在智慧城市领域,刚好和工业自动化领域相反,视觉类AI往往会涉及到图像采集带来的诸多模式干扰噪声。最典型的例子是二维码扫码,很多情况下,二维码的卡纸、拍摄的相机,两者都是可以自由移位的,并且环境光照也有户内户外、白昼黑夜的差异,然而二维码由于其强大而特殊的设计,使得标准的扫码算法都可以获得较高的精度和可靠度。美国国家工业标准委NIST前年宣布人脸识别达到双九标准,而二维码刷码应该是更早达到双九可靠度的。
在ChatGPT背后的大模型出现以前,深度学习更为“水涨船高”的依赖红利其实是大数据,正是由于训练数据的更趋于充分带来了深度学习对于AI识别精度的提升,使得人工智能进一步摆脱“人工智障”的魔咒,可以说大数据因素“吃占”的算力更甚于深度模型本身的复杂度带来的消耗。而今天,随着深度学习大语言模型的崛起,人工智能正凭借空前复杂的计算模型和天量的数据在创造着不可思议的奇迹。
但是,相对于算力的门槛只是钱多钱少的问题,数据的积累问题不是钱多钱少能解决的。对于专注视频智能分析和时空数据管理的新一代AI中台公司杭州数聚链科技有限公司而言,在解决船舶水尺模式识别的过程里,意识到AIGC技术给视觉类检测、识别任务带来的机遇。
公司在实现水尺识别算法时面临着数据储备不够丰富、非典型性数据类别不足等问题,使用上述九因素干扰的数学模型进行自动化数据模拟,然后基于GAN神经网络进行数据多样化生成,获得了极为充沛的训练、测试数据,系统在一期上线阶段,经过实际运行统计,有效识别精度达到97%以上,这大大缩短了该AI模块的产品上市的时间。杭州数聚链科技有限公司正拥抱AIGC浪潮,将以更加强大的数据模拟技术闯入一个个的机遇之岛。
榜单收录、高管收录、融资收录、活动收录可发送邮件至645528#qq.com(把#换成@)。