大有可为的智能机器视觉技术
文:中国科学院深圳先进技术研究院集成所多媒体集成技术研究中心主任乔宇2018年第四期
作为人工智能的一个分支,计算机视觉(机器视觉)是一门研究教机器学会“看”的学科,其目的在于使计算机具备和人类匹配的视觉感知和理解能力。近年来伴随着电子信息技术的高速发展,互联网特别移动互联网的普及,以及各类摄像头的广泛应用,全球图像视频数据爆炸式增长,人类社会正在进入视觉信息的大数据时代。海量的图像和视频在方便人们生产与生活的同时,也对智能视觉技术提出了新的挑战,对视觉技术的适用范围、鲁棒性和效率等提出了更高的要求。目前大多数视觉处理系统可以较好地采集、传输和存储图像视频,但是对视觉内容高效的分析和准确识别理解能力往往还有待提升。计算机视觉的应用正在从传统的受控条件下工业视觉、OCR等拓宽到无人驾驶、动态人像识别、视频监控等更为复杂的场景。近年来深度学习方法的快速发展,为解决上述问题提供了有效的途径。深度学习方法(Deeplearning)作为传统神经网络的拓展,利用包含多个隐层的深层神经网络,解决需要高度抽象特征的人工智能任务。深度学习借鉴了人脑的多层神经细胞处理结构,多层非线性结构使得深度神经网络具备从视觉大数据中学习抽象语义特征的抽取能力和对复杂任务的建模能力。深度神经网络在LFW人脸识别、ImageNet物体分类等任务甚至超过了人的表现。
2017年国务院关于印发《新一代人工智能发展规划》也把视觉技术作为重点发展的基础理论和关键技术领域进行布局。中国人工智能学会副理事长谭铁牛院士提出:”图像视频大数据是人工智能的突破口,是信息产业新的增长点”。智能视觉技术已经成当前学术研究和创新创业的热点领域。谷歌、微软、百度、腾讯、阿里等互联网巨头密集布局视觉领域的研发,商汤、依图、旷视等视觉初创企业完成高额融资快速成长。毋庸置疑,智能视觉技术将赋能产业的方方面面,给未来的生产生活带来深刻变革。
中国科学院深圳先进技术研究院集成所多媒体集成技术研究中心主任乔宇
中传动网版权与免责声明:
凡本网注明[来源:中国传动网]的所有文字、图片、音视和视频文件,版权均为中国传动网(www.chuandong.com)独家所有。如需转载请与0755-82949061联系。任何媒体、网站或个人转载使用时须注明来源“中国传动网”,违反者本网将追究其法律责任。
本网转载并注明其他来源的稿件,均来自互联网或业内投稿人士,版权属于原版权人。转载请保留稿件来源及作者,禁止擅自篡改,违者自负版权法律责任。
如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。
关注伺服与运动控制公众号获取更多资讯
关注直驱与传动公众号获取更多资讯
关注中国传动网公众号获取更多资讯
- 运动控制
- 伺服系统
- 机器视觉
- 机械传动
- 编码器
- 直驱系统
- 工业电源
- 电力电子
- 工业互联
- 高压变频器
- 中低压变频器
- 传感器
- 人机界面
- PLC
- 电气联接
- 工业机器人
- 低压电器
- 机柜