加入收藏 | 设为首页 | 我要投稿 | RSS
您当前的位置:首页 > 亚洲博彩资讯,棋牌游戏充值,网上现金德州扑克 > 棋牌游戏充值

D.Marr的计算视觉理论

时间:2017-10-03 05:24:23  来源:  作者:

原标题:D.Marr的打算视觉实践

剑桥大学三一巷

Marr其人

Marr生于1945年1月19日,从前就读于剑桥大学三一学院,得到数学硕士、神全心理学博士学位,同时还受过神经解剖学、心理学、生物化学等方面的严格练习。他在英国曾从事新皮层、海马,特别是小脑方面的实践研究。1974年访问美国,并应M.Minsky教授之请,留在麻省理工学院展开知觉和记忆方面的研究工作。他从打算机科学的观点出发,熔数学、心理物理学、神全心理学于一炉,开创人的视觉打算实践,从而使视觉研究的面貌为之一新。Marr于1980年11月17日在波士顿病死,享年35岁。他的实践由他创建的一个以博士研究生为主体的研究小组继承、丰富和成长,并由其弟子归纳总结为一本打算机视觉领域著作:Vision: A computational investigation into the human representation and processing of visual information (ISBN 0-7167-1567-8),于他后发表。从人工智能杂志1981年第17卷“打算机视觉”专辑中,我们能够清楚地看到这一实践已产生宏大的影响。

Marr的视觉实践

D.Marr打算视觉实践视觉信息处理

视觉研究的终纵目标是要说明视觉系统究竟是如何完成视觉任务的。Marr觉得:神经系统所作的信息处理与机器类似。视觉是一种复杂的信息处理任务,目标是要掌握对我们有效的外部世界的各种情况,并把它们表白出来。这种任务必须在三个不同的水平上来理解,这便是:a.打算实践 b.算法 c.机制(见表1)。这一分别其实不是很严格的,但如果不符合上述分类,则没有一个或一组描绘将是完美的。在视知觉中,上述三个水平各有其特定的地位,它们基本上是互相独立的。因此,在探究实践成绩时必须把它与法、机制严格地差别开来,并采用新的研究方法。

打算实践

算法

机制

信息处理成绩的定义,它的解便是计

算的目标。这种打算的形象性质的特

征。在可见世界内找出这些性质,构

成这个成绩的约束前提

为完成期望结束的

打算所采用的算法

的研究。

完成算法的物理实

体,它由给定的硬

件系统构成.机器

硬件的构架。

表【1】

从打算实践这一级水平来看,所谓信息处理(process),其实便是把一些标志表象变成另外一些标志表象。这一处理过程从外部世界投射到视网膜上的图像开始,不停到构成某种知觉为止。因此表象是打算实践中最重要的观点。所谓表象(representation),简略地说,便是与所述成绩有关的某种特别的信息表白方法,其重要特色是使一些对后级处理有效的重要信息变明确。表象作为信息的一种表白方法其实是被普遍采用的。比喻,物理系统中的能量是表象;数学中的数字、直角坐标系中的点是表象;表象在人脑中的“痕迹”在一定的安慰前提下会再现出来,这种痕迹也是一种表象。用表象来描绘某一全体现象即利用表象的详细实例则称为该表象中的一个描绘(desc1’i-Ption)。比喻12便是阿拉伯数字表象中的一个描绘。异常一个成绩能够用很多不同范例的表象来表示,其中有些打算简略而有效,有些则不是那样,因此必须准确地决定表象。表象的详细结构是与现实场景相联系的。但长期以来,人们并没有重视这一点;甚至在70年代早期,打算机科学和人工智能专家也仍未认识视觉信息处理的艰难所在。其原因起因是我们的视觉系统工作得极好,而有些东西又难以填密地自察出来。正由于如此,神经科学的传统方法和技能一律都失败了。Marr觉得成绩的关键在于:视觉信息处理必须分析给定的任务,而分析的基础则是客观的物资世界。用公式来表示打算实践的一个决定性的步骤,便是要找出视觉世界的特性,给打算成绩加上约束前提,使它寄义明确,能够或者获解。有很多详细实例表明,如果不把视觉世界的一样平常性量变成打算成绩的特别假设,成绩就肯定不下来。高级水平的特别的先验性的知识是不用要的,有效的仅仅是物理世界的一样平常性质。视觉成绩的一个约束前提便是终极得出的描绘一律由图像导出。因此在一样平常情况下,视觉早期处理的表象结构重要决定于我们能从图像中打算出什么东西来,而前期处理的表象结构则还受视觉任务的影响。

Marr提出的上述方法是强有力的,它使视觉信息科学得以迅速成长壮大,其结果就像物理学那样具有永远的性质。由于它们是在现实世界的物理学和图像的公式化的基本定律这样坚固的基础上树立起来的。所以视觉打算实践这一水平在其成长过程当中能够成为一门真实的科学。Marr的工作—从打算方法的弘旨到分析详细成绩的细节方法论基础。

D.Marr打算视觉实践表象结构和功能块分析

从信息处理的观点出发,Marr已能用公式把视觉处理的全体实践框架表白出来。除上述处理成绩的方法方法外,这是Marr作出的非常重要的贡献,由于它向我们供应了一个向视觉成绩发起新攻击的适当的战略。这个实践框架重要由视觉所树立、保持、并予以说明的三级表象结构构成,这便是:

a.基元图(the primal sketch)—由于图像的密度变更能够与物体界限这种详细的物感性质绝对应,因此它重要描绘图像的密度变更及其部分多少相干。

b. 2.5维图(2.5 Dimensional sketch)—以观察者为中央,描绘可见表面的方位、表面、深度及别的性质。

c. 3维模型(3D Model)—以物体为中央,是用来处理和识别物体的三维外形表象。

根据Marr的观点,各种不同的视觉处理凑在一起产生各级表象,在表象中它们有机地结合起来。其中一些处理见表2。把视觉处理当作是一组绝对独立的功能块,这一思想特别重要,特别有效。它不只有打算的、退化论的、方法论的论据支持,而且更重要的是某些视觉功能块已经用实验方法分别出来。双眼立体视觉便是一个适例。只需有双眼视差,随机点立体图对也能引起体视现象。如果人的视觉系统确实是功能块型的,那么在图像中被编码的各种不同范例的信息(比喻亮度、被观察物体的表面反射性质、物体的表面外形,观察者与物体的距离或方位等)即可以用一些独立的处理(如体视、活动等)来解码,其精密度至少可达一级类似。明显,一切这些处理必须全体辨别出来,相应的打算实践才能得到成长。这方面的研究已经获得了很有渴望的结果。

D.Marr打算视觉实践图像密度检洲及其心理学和心理学根据

Marr的实践同神全心理学和心理学相干非常密切。上面我们仅对视觉信息处理第一阶段的一部门内容即抽提表面作一简要阐述,以便从另外一个正面来理解Marr工作的特色。视觉处理第一阶段的目标是检测图像的部分性质。图像中密度激烈变更的部门正是物体表面的物理变更的最好标志。Marr觉得:对付一定的空间分辨率,用中央—周边型感触传染野即算子V“G(其中v“是拉普拉斯算子,G是二维高斯函数)对图像滤波,而后再找出经滤波处理的图像的零交叉点(即二阶导数的零值地位),即可求出图像密度变更的情况。在自然图像中,密度变更的「空间标准是很宽的。要把一切空间标准上的密度变更都检测出来,就必须采用几个大小不同的滤波器。大的检测模糊边,小的检测图像细节。然把各通道的零交叉合并成一组对后级处理有效的团圆基元“边”。基元边和别的一些基元标志构成Marr称之为原始基元图的图像密度表象。

由多少中央—周边型感触传染野得出的零交叉乃是从原始的持续密度值得到图像的团圆标志表象的一种自然形式。由于在某些前提下,一个带宽小于l倍频程时一维带通旗子灯号能由其零交叉完整回复复兴。从视觉信息处理的观点看,重建原始旗子灯号明显是弗成能的,但由零交叉得出的团圆标志一定含有原始图像的极其丰富的信息。从经验性的研究中得出结论:用算子V“G作滤波处理的图像是能够用其零交叉和斜率充分类似地规复的。

上述结果的心理学和心理学寄义是明显的。看来它们阐清楚明了视觉通道第一级的一些基天性质,并使视觉心理物理学和神经生物学中对于空间频率通道和边检测器之间的辩论得以解决。现实上,视觉的第一阶段在很大水平上是由“边”检测器(其实是零交叉检测器)而不是由付里叶分析完成的;但零交叉检测器要抽提故意义的信息,就必须对多少独立通道的输入结束运算。能够有掌握地说:二阶导数滤波运算是由视网膜神经节细胞和外侧膝状体核完成的,而有向的零交叉线段(即“边”)则是由视皮层中的x细胞检测的。

由上可见,Marr起初提出的一些基本观点在打算实践这一级水平上已经成为一种几乎是精美绝伦的实践。这一实践的特性便是它力求令人的视觉信息处理研究变得越来越严密,从而使它成为一门真实的科学。

棋牌游戏充值

来顶一下
返回首页
返回首页
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
推荐资讯
相关文章
    无相关信息
栏目更新
栏目热门