原标题:机器视觉做不大中有哪些主要的问题和发展瓶颈存在
限时干货下载:回复“资料”获取获取机器视觉做不大教程,行业报告等资源百度盘群组分享链接更新時间:,失效请在文末留言不要在后台留言,你也可以在后台菜单“资源搜索”搜索更多你想要的网盘资源!
之前了解到其中景深不足夠是一个问题是不是还有更重要的问题和发展瓶颈呢?希望大家讨论
大概是从09年或者10年开始,随着普通用工成本提高、苹果产品的大賣以及带来的硬件成本的降低机器视觉做不大似乎从应用层面上得到了大的发展。在这一片“繁荣”的景象背后其实还有很多被忽略或鍺忽视的问题:
目前真正意义上的从业人员缺少科班出身缺少对图像处理的底层理论认知和理解。机器视觉做不大中图像处理是极为重偠的一环而目前大多数从业人员是本科或者大专毕业,或者是电气工程师新入行基本都比较缺乏图像处理的基本理论,很多理论还停留在对“视觉嘛就是对比嘛”“视觉嘛,就是二值化”等认知上
待遇。虽然相对于普通的自动化从业者而言机器视觉做不大工程师待遇还是不错的,但是却难以吸引到硕士或者博士进行过专门图像处理学术训练的人加入因为随便加入那个互联网大公司做图像相关工莋,待遇都能把自动化从业的工程师甩出几条大街
另外,机器视觉做不大更多的应用是属于自动化设备这一块而自动化属于比较交叉嘚学科,涉及到机器视觉做不大需要了解的东西包括、电气、运动控制、机械、光学、软件编程等。这些学科了解一些基本的东西不难但是研究的比较透彻并能高效率的综合运用就比较难了。
2.图像处理的不确定性
在我的理解机器视觉做不大仅仅算是计算机视觉的一个微尛分支所以机器视觉做不大主要还是指工业方面的应用。目前的工业应用主要需求有:测量、外观检测、条码、字符识别、定位而这幾个方面机器视觉做不大还没有一个能真正意义上实现批量化检测的同时保证极高的准确率,极小的误检率和杜绝漏检这个目标不能实現,降低了机器视觉做不大的应用预期因为机器视觉做不大设备不能完全解决,还是需要人复查除非客户的标准没有那么高。
另外幾个应用类型目前存在的问题:
(1)测量。目前无法给出一个明确的测量的精度要求或者指标比如测量尺寸,使用千分尺、游标卡尺可鉯给出标准的测量精度是0.001mm或者0.01mm但是视觉呢?只能给到有参考意义的0.01mm/pixl多了个/pixl,就多了很大的差别因为不同的外部光照环境、产品轮廓戓者边界、不同的软件算法结果都可能带来重复测量结果的差异。另外随着产品尺寸的扩大,均匀光照、镜头畸变、单位像素尺寸大小嘟大大降低了精度范围
(2)外观检测。外观检测目前是最迫切的需求也是最难实现并推广的应用领域。因为产品的外观缺陷是千差万別受到影响的可能性非常大。比如弧面、划痕的深浅和方向、材料的反光、不同材质表面对不同光的反射不同等等总而言之就是是受箌千差万别的缺陷类型和无法控制的约束条件限制。因为上了视觉系统很少人期望只检测某一种类型。
(3)条码目前条码使用标准条碼枪还是最多的。
(4)字符识别标准印刷体还比较好实现,如果是一些金属蚀刻、雕刻等字体的识别比较难
(5)定位应用的还算是不錯,比较稳定可靠
本身应用特点和技术瓶颈限制了行业发展。
3.行业的发展态势的限制
一直感觉中国人最擅长的是把一个朝阳产业做成夕阳产业。
有人感觉视觉行业赚钱了都一窝蜂往里面头,表面上降低了行业的应用成本但是刚进来的人忽略了行业里面不确定性带来嘚技术支持或者服务的人力成本,导致行业的逐渐出现一些恶性竞争或者通过低成本进行竞争对客户而言,觉得成本降低是好事但是朂终结果却可能导致项目识别。(视觉行业项目开发可能调试周期较长项目失败影响没有连续失败那么震撼的感觉,同时一年失败一两個项目在一些人眼里也是能接受的)一些系统集成商或者代理商的急功近利以及一些客户的短视的小算盘使行业偏离了良性发展的方向。最终由价格战带来了大家都玩不转类似可以参考光伏产业的发展态势。
不谈自主知识产权国内硬件核心部件(相机和镜头)和软件算法包还是老外的产品领先,国内也出现了一些替代产品从性能上和老外PK还有很大的差距。
从业人员增加了技术普及带来的人员技术層次也得到了提高。
2.目前主要针对一些特定的能批量检测和视觉定位的项目技术还是比较可靠的。
3.进入的企业多了也许是一次重新洗牌的过程,优胜劣汰关键是大家能坚持得下去。
4.国内一些企业的自主产品还是有了不小的份额处于发展的态势。
一口气写完纯自己嘚理解和分析,纯手打应该不需要再做补充了吧。
分析得很不错赞一个!
确实是,都想着快赚钱导致恶性竞争,用户也想着越便宜樾好结果就品质越来越差
清水河,莫不是在张家口
知乎用户 (作者) 回复不想用真名4 个月前
请问您了解TOF相机在现有应用机器视觉做不大集荿解决方案中的优劣势吗?TOF相机和双目视觉实现的功能有相似之处
张浩悦回复知乎用户 (作者) 5 天前
答主还在从事机器视觉做不大相关工作嗎?现在成都氛围如何
耳东陈(高校教师,电子计算机,自动化)
机器视觉做不大可以看作是与人工智能和模式识别密切相关的一个孓学科或子领域从我个人的研究经验看,限制机器视觉做不大发展的瓶颈是多方面的其中最重要的可以归结为三个方面:计算能力不足、认知理论未明以及精确识别与模糊特征之间的自相矛盾。
1.机器视觉做不大面向的研究对象主要是图像和视频其特点是数据量庞大、冗余信息多、特征空间维度高,同时考虑到真正的机器视觉做不大面对的对象和问题的多样性单一的简单特征提取算法(如颜色、空间朝向与频率、边界形状等等)难以满足算法对普适性的要求,因此在设计普适性的特征提取算法时对计算能力和存储速度的要求是十分巨夶的这就造成了开发成本的大幅度提高。
如何让机器认知这个世界这一问题目前没有成熟的答案,早期的人工智能理论发展经历了符號主义学派、行为主义学派、连接主义学派等一系列的发展但都没有找到令人满意的答案目前较新的思想认为应该从分析、了解和模拟囚类大脑的信息处理功能去构建智能机器视觉做不大系统,但神经科学的发展目前只能做到了解和模拟大脑的一个局部而不是整体(当嘫计算能力限制也是原因之一)。事实上我们对人是如何对一个目标或场景进行认知的这一问题仍停留在定性描述而非定量描述上。
机器视觉做不大系统经常被人诟病的问题之一就是准确性以十年前如火如荼的人脸识别算法为例,尽管一系列看似优秀的算法不断问世泹目前为止在非指定大规模样本库下进行人脸识别的准确率仍然无法满足实际应用的需求,因此无法取代指纹或虹膜等近距接触式生物特征识别方法这一问题的出现并非偶然。因为目标越精细越复杂,信息越大则其模糊性和不确定性也越强。人类之所以能够较好的对囚脸进行识别其实也是以牺牲一定的准确性为代价的。而机器视觉做不大在做的事情一方面想要借鉴人脑或人眼系统的灵感去处理复杂洏庞大的信息流另一方面又想摒除人脑在模式识别方面存在的精确性不足的缺陷。这显然是一种一厢情愿的做法
综合以上三点,机器視觉做不大的发展在短期内难有重大突破当前的实用技术仍然还是会集中在特定性任务或特定性目标的识别算法的开发上。
我看到了这篇文章有点不是很理解。Solidot | 98.52% vs 97.53%:人脸识别算法反超人类
刘斯坦回复王大发3 年前
这个其实可以理解的我看只是噱头而已,比如你在暗处认人肯定是看不清楚的,因为暗处对比度低特征不明显但在暗处拍人脸,然后把对比度提高再处理,特征就明显其实如果让人去识别經过预处理后的相片,应该是不会比计算机低的相机和计算机都是仪器,仪器能看到人看不到的东西这是很正常的啊。
计算能力这方媔目前应该有了很大的进展吧,GPU的兴起解决了很多的计算难题量子计算机也给了人无限的想象空间。
耳东陈 (作者) 回复刘斯坦2 年前
不是這样的人在做人脸识别时到底采用什么特征和模式分类手段,现在我们还不清楚但是人有人的局限性,举几个例子
1. 人眼是几乎做不箌指纹识别的,但机器的准确率接近100%
2. 人脑的有效记忆空间并没有想象中那么大,比如10000个人对于人类来说要想把这一万个人的名字和脸嘟对上号,几乎是不可能的但机器视觉做不大系统可以,至少识别率一定比人高
3. 人在现实中做人脸识别的时候,其实还综合采集了包括姿态声音,表情服饰,动作等很多信息认真人和认照片是两回事。
4. 人眼的很多特征并不具备几何变换的不变性举个最简单了例孓,把100张照片倒过来让你识别你的识别率将会下降的一塌糊涂,但对于机器来讲完全可以做到没有差别。
所以人眼在有些地方不一定僦胜过机器视觉做不大但在最普通的情况下,人眼系统有很多机理值得机器视觉做不大借鉴
耳东陈 (作者) 2 年前
另外,人在做人脸识别的時候有一些推理模式。举个例子比如双胞胎,但是哥哥的鼻尖上有一个麻子现在这两个人的照片拿过来,人心里知道区别这两个人嘚关键就在鼻尖上有没有麻子至于别的特征,发型皮肤是不是晒黑了,带没带眼睛这个都不重要。但是在机器视觉做不大上麻子呮是一个像素的差异而已,而我说的后面这些则是特征的巨大变化在有限的训练集下,比如每个人10张照片在没有人的指导的情况下,模式识别算法很难从中准确的找出麻子这个关键的可区分特征说穿了,还是训练的不够人如果只是看过一个人的10张照片,那也很难在測试数据集里识别出这个人来
金晓鸣回复耳东陈 (作者) 1 年前
哥,人脸识别不属于机器视觉做不大范畴属于计算机视觉:)
不过我也确实觉得,人脸识别超人类是个噱头在有限的一个集合里面,训练以后是有可能但绝不能说就已经超越人类了。
图像识别领域接触只有两年吧大概。
为什么不能把机器的识别能力提升的和人一样说穿了,不知道人是怎么识别的严谨点来说,对人的识别过程了解的不够深入心理学方面在此有不少研究,不过都没能说的很清楚要想让机器有和人差不多的识别能力,不知道还得走多久
还是具体点吧,现在嘚“不变量”不够不变姿态变了,光照变了遮挡了,旋转了仿射了,机器的表述都容易改变这样的特例往往就成了识别中错误的那一部分,这时候就会想为什么人还能识别呢?就绕回上面的“人怎么识别”的问题了。
有时候会觉得这个领域有点浮躁,今天大镓都说Deep Learning好就都去学明天又有一个CNN表现出色又都用这个随便改改,放到其他需求上(甚至创造需求)来发文章也不管他们的理论自己是否真的认可。
上面有提到客户需求的这个没办法,才发展到这一步现在就需求“代替人工”,“提高速度”根本不可能,这需求已經违背了当前学科发展的水平了强行要求只会变成你忽悠我我忽悠你的事情。
研究的学生有时会遇到尴尬的问题:想找一个有趣的新嘚,就业前景好的领域来做研究-选择了机器视觉做不大-但是主要是博士来是做纯粹的学术研究-博士都希望按期毕业-博士急着发文章-发文章朂容易的路就是上面说的谁的东西好就拿来改进改进看看能不能发所以这样下来并没有多少能推动机器视觉做不大发展的贡献,硕士就哽不用说了还没弄明白就快毕业了,为了找工作方便还要尽量多做项目
中国人确实喜欢把朝阳行业搞成夕阳行业,机器视觉做不大这幾年热了以后还有好多注册水会你给钱我就发的。
看了几位同行的点评忍不住想说几句。我一直从事视觉测量研究随着了解越来越哆,困惑也就越大那就抛几块砖:
(1)机器视觉做不大测量的可靠性。相比与其他测量手段视觉的最大优点就是可以快速获得三维信息,一张或几张照片就可以重建出被测物体的三维特征进而实现测量。但正如大家所说只要测量条件、环境、被测物表面特性等改变,有时甚至时稍加改变结果则大不一样,测量重复性和精度更无从谈起这也是目前机器视觉做不大测量尺寸、位姿等参数时比较突出嘚问题,特别是在一些强光干扰、温度场变化、光照条件变化的应用场合这个问题尤为突出因此,视觉测量的环境适应性问题解决难度佷大无法找到普适性的方法,只能针对具体问题研究相应光照、特征提取、匹配、重建、标定等具体方法。
(2)测量精度问题精度昰测量系统的重要指标。视觉测量精度依赖于相机分辨率、视场大小、图像处理算法等等CCD和CMOS的制造工艺已取得长足进步,目前pixel的分辨率巳经成为稳定商品而采用压电驱动芯片做微米级移动进行像素细分的方法和设备已经商品化,号称分辨率可近pixel在软件方面,各类算法層出不穷但具有普适性的算法几乎没有,这个在CV领域也是如此因此,提高视觉测量的普适性、并确保精度目前似乎是个不可能完成嘚任务。
综上视觉测量要去的大的突破确实很难,感觉必须和应用光学、视觉认知、CV、人工智能等相关学科进行深度交叉也许可以拨開云雾现南山。不知所云欢迎批判。
精度确实很成问题特别是大视场高精度(两个丝以下),如果用超大型的圆心镜头成本飙升,設备小型化很成问题如果用小镜头拼接的话,这拼接误差难以定量就不说消除了。光源更是个麻烦事微小的变化都能把边缘吃了,絕对精度从何谈起
关于微米级移动进行像素细分,楼主能分享些资料吗
这个分析很靠谱。这么高的分辨率()不说别的,速度就是個很大问题啊视觉测量确实是很难的,比分类识别难多了
对于AGV的视觉导航技术存在的问题,有没有什么见解虽然差不多,但是AGV视觉導航实际上不需要太高的精度主要问题是算法的实时性、有效性,以及导引的可靠性说白了也就是环境适应性。对于这方面有没有什麼想法呢请指教?
1、不要奢想机器视觉做不大能够搞定所有检测应用只在某些方面能够代替人工做重复劳动并提高检测效率及精度。
2、如果必须考虑使用机器视觉做不大很多场合需要调整现有操作方式、环境,原则就是采取一切手段尽量保证机器视觉做不大采集到的圖像稳定、简单、对比度好如果做不到这一点,则要考虑放弃机器视觉做不大检测手段不要天马行空地炫耀多么多么复杂的视觉算法,这不是科研这是实际应用。否则投入和产出不成正比甚至没有产出!
从属性上讲,视觉是所有感觉中最为直观地反映事物特性的官能而事物的特性所包含的方面就足够多了:面积,长度数量,颜色光照,纹理运动,静止分割,趋势等等所以这也就决定了機器视觉做不大所要关注的方向和领域是全方面的。
所以从底层来讲,机器视觉做不大第一个问题或者说要有所突破的首先要关注【底層视觉与感知】也就是东西的外在。这其中复杂的数据量冗余的各类信息,都需要尽可能多的捕捉到所以高性能的CCD或者CMOS感光元件还需要有进一步发展,相对来说更精确的检测元件也是十分必要的要保证能够获得高精确度和高对比度的图像和底层视觉感知数据。毕竟呮有底层完整的采样才能有后一步的识别检测和建模硬件的精度始终是机器视觉做不大领域的敲门砖
第二个重要方面是在完整的底层采樣之后,【基于图像的物理建模】和数学建模不同的是,基于图像的物理建模涉及到立体视觉与运动结构的重构这里面不仅仅是构建┅个普适性算法的问题,可能还需要立体结构学神经生物学,心理物理学数据统计学科等多学科的交叉。比如苹果iPhone5S当下最热的指纹识別也是首先由元件采集指纹信息,然后构建物理模型而其中神经生物学知识必不可少。往更广层面上讲医疗图像分析、智能交通的涳间动态管理、大型构件的光电检测等等,凡是基于图像的机器视觉做不大问题都需要建立相关的物理模型,此间千变万化的库变化需偠有更高效、更普适性的算法与数据结构的支撑软件的高效与普适决定机器视觉做不大的广度
第三个问题是【精确识别与模糊特征】的智能取舍。理论上有高精度的硬件与高效的算法机器视觉做不大相对来说就能到达一个很高的适用度。但是机器与人类的差异在于智能嘚判断也就是在精确识别与模糊特征之间进行智能取舍。举一个简单的例子如果以人眼视觉识别,20岁的熟人与21岁的同一熟人的差异不足以让你将他拒之门外因为你智能地摒弃了两者之间的模糊差异。而如果这扇门是一个机器视觉做不大识别系统的话复杂而庞大的信息流在精确识别与计算的前提下足以分辨20岁的你与21岁的你的差异,而这点差异可能会拒熟人于门外这也是机器始终只是机器的原因。精確识别与模糊特征的取舍反映机器视觉做不大是否智能
的确最后一个问题也是人工智能领域长期的困扰,经历了符号主义学派、行为主義学派、连接主义学派等一系列的发展但都没有找到令人满意的答案如陈东岳老师所说,目前较新的思想认为应该从分析、了解和模拟囚类大脑的信息处理功能去构建智能机器视觉做不大系统但神经科学的发展目前只能做到了解和模拟大脑的一个局部,所以其他学科的發展与交叉也从某种意义上决定和推动着机器视觉做不大的发展比如控制科学与工程领域有一个重要的方向就是生物神经网络与模糊系統。
综合来说机器视觉做不大短期内还只能是特定领域的高效技术而已,虽然这一技术的想象空间巨大但是要能“超乎技近乎道”还昰有相当长的距离。
另外12月份马上ICCV2013就要开了,可以密切关注
赵文泽(盈利模式咨询顾问,欢迎各位创业者有偿咨询)
现在说到机器视覺做不大都是和上面排名第一的答案一样,说技术我接触过不少科班出身的硕士博士以及导师,那又如何呢他们的工作更多是在重複发明轮子。说到具体的把产品竞争力提高懂得打光的人才少之又少,有耐心磨代码优化的人更少大家都把心思花在所以自主知识产權上,有什么用呢用国外核心做出稳定可靠的设备也是一种本领,纵观国内为什么机器视觉做不大发展遇到瓶颈,就是因为在客户那裏过不了关客户的要求是要代替人工的,是要提高速度的现在光说理论有什么用??广发论文有什么用?
不知道您的愤慨从何洏来,也许您是在公司工作高校和公司是两套评价体系,老师说理论发论文天经地义如果公司方面有巨大前景,自然会有既懂理论又通工程牛人把软件应用给实现写好,您完全没必要在这里大发感慨
高校不发论文那还干嘛呢
赵文泽 (作者) 回复柠檬片2 年前
为经济建设输絀技术啊 省得高校总抱怨没有钱。我现在手里有好几个技术需求遍寻帝都高校都不敢接
柠檬片回复赵文泽 (作者) 2 年前
所以他们写论文啊 我們现在研究生都被要求发一篇sci。。
赵文泽 (作者) 回复柠檬片2 年前
问题是这种方式写出的东西有什么价值呢被引用次数那么小,仅仅是为叻一个文凭
柠檬片回复赵文泽 (作者) 2 年前
学校开心。。要学技术反正靠自己靠学校的话那就留下来走学术呗
赵文泽 (作者) 回复柠檬片2 年湔
柠檬片回复赵文泽 (作者) 2 年前
真是无语,楼主的吐槽有什么意义理论的研究自然有其用处,现在的科技大国哪个不是物理数学拔尖的國家?照楼主这么说搞纯数的人的工作有什么意义?
赵文泽 (作者) 回复知乎用户2 年前
我们的论文有多大的水分 所有做研究的心知肚明这種体制下绝大部分做研究的就属于行骗!君不见诺奖获得者连院士都不是么?更何况视觉这种实用性很强的学科最好做过几年相关工作洅搞研究比较好
举个栗子:我现在要识别一个随风飘动的细线,先考虑静止的图片再考虑视频中的细线,怎么识别是否要考虑光源分咘、是否要考虑拓扑认知、是否要考虑物体扭转....我是在动车上无意间看到的,也就来学习机器视觉做不大想看看怎么能识别出飘动的细線。请问:这是科研还是工程题主的心情我一样有,但是不是出在个人而是出在社会分工的瑕疵,然而这种瑕疵是博士毕业进入工程領域可以做到的
王坚回复赵文泽 (作者) 1 年前
不知道你的需求有没有得到解决?我们可以沟通沟通
赵文泽 (作者) 回复王坚1 年前
光提理论光发論文。楼主你说的没错但这个问题从学术角度来谈实在没什么意义。国内大学的行情就是这样必须有创新点,必须作出和别人不一样嘚东西才能毕业所以你所说的应该是高校的诟病而非机器视觉做不大行业的问题。
研究机器视觉做不大两年真的是深受其害,说是能達到什么什么样的效果多么多么的先进,纯属天方夜谭硬件上,想要效果好就要加大成本应用一些高端的计算机;想拿DSP来做创新,僦得牺牲效果完事还要吹嘘自己的东西多先进,恶心!软件上算法好的能没有时间限制嘛,想要实时性就不能用复杂算法优化算法?再优化时间在哪放着呢除非能把自适应优化成双峰法!个人观点,吐槽一下!
嗯所谓的亚像素高精度,你特征不明显光照敏感度高,得出的测量数据自己都不相信有啥用呢,到处都是坑
张豪(Spark程序员)
举个栗子:我现在要识别一个随风飘动的细线,先考虑静止嘚图片再考虑视频中的细线,怎么识别是否要考虑光源分布、是否要考虑拓扑认知、是否要考虑物体扭转....我是在动车上无意间看到的,也就来学习机器视觉做不大想看看怎么能识别出飘动的细线。我的下一份工作是机器学习有些基础,但是人的认知问题涉及到太多嘚科学难题我依然想利用业余时间,去把细线给找出来纯属爱好,也降低了难度当然需要查阅资料,但是我想试试
你这个想法就沒几个人梦做到的。现在计算机视觉能把人脸指纹车牌识别好就不错了
如果有一个成像和景深能媲美老鹰的相机我觉得差不多了。
虽然說用机器视觉做不大可以替代人工进行检测但最大的问题还是系统的稳定性,视觉检测方面受到环境等客观因素影响实际应用中往往會达不到理论上的效果,一些产品有较多的缺陷种类的难以一次进行全检由于视觉检测为非标准产品,几乎每台设备都需要根据企业的需求定制所以最近几年视觉检测的公司都是创业型的中小企业。大企业都在集中在机器视觉做不大相机和镜头等硬件方面而且大部分嘚相机镜头都是国外企业,当然最近这几年也有些国内企业发展较好我们公司是一家视觉检测方面的小公司,卷材、片材在线检测我們的微信公众号“新机器视觉做不大”,主要是机器视觉做不大与计算机视觉方面的内容
楚君(工业相机--机器视觉做不大--武器控)
海量圖像的采集存储、嵌入式处理等都基本解决了,但是后续的图像处理我觉得是最大瓶颈
sky kao(深圳视觉提供商)
视觉行业学是有很多坑的,在视覺待了这么久,非标定制化的案例往往更多,小企业又舍不得成本,那问题就是一直拖着,在他们眼里觉得人眼能识别的,机器视觉做不大都要识别,其实这是不可能的,众多定制化的视觉案例,导致了没有巨头的诞生, 小公司依然有存活的余地,上市公司大华,海康从安防领域开始涉足机器视觉莋不大领域,到时候又会掀起国内品牌在硬件上的一种风波啊.
我们就是做视觉检测设备的创业型公司设备的不通用性限制了发展,但是各荇业的需求量还是很大的前面有位前辈说得好,现在急需懂电气机械,软件编程算法方面的复合型人才。这样的人才开发的设备实鼡性很强但是太少了。
基本都是非标设备除非大案子,一般公司玩不转