» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[业评] 从一个computer vision从业者角度看微软的“火星科技”

当然是比较成熟的技术了


TOP

引用:
原帖由 RestlessDream 于 2009-6-3 13:08 发表
我发现很多人的思维真的很简单……或者说,单线程的

只能听到声音,可能是瞎子

只能看到图画,可能是聋子

微软反复说,RGB摄像头+深度传感器+多阵列麦克风,还有一个关键的,综合处理这些数据的可定制芯片 ...
你辛辛苦苦翻译的技术贴,早晨我一瞅在第二页呢

战你大爷的,爽就行了,技术是毛啊,灭活活活 :D



TOP

引用:
原帖由 RestlessDream 于 2009-6-3 13:04 发表

你又再次成功突破下限了……
嗯,这很有可能就是我每次做点小买卖都屡干屡败的原因~~

你有空说说。。。


TOP

引用:
原帖由 猎狼者 于 2009-6-3 12:53 发表
发现这个东西真的是一点实体感觉都没有。。。这样玩的话 就明白了 试玩视频上面为什么地上要放上一块地毯了,以后买这个设备估计要送一块地毯。
简称YY

TOP

业余爱好着讲讲见识,是以前发的帖子,当时是结合S3D呈像来讲的,可给大家参考一下

* 由于不是专业人士,只是在几年在网络上找到零星信息的汇总,所以不能保证一些理论完全准确

* 对于深度信息,应该是利用红外计算距离信息,比如以前用红外射线往返时间信息计算月球距离那种,不过这是个人猜想

* 帖子有点老,里面youtube视频可以通过一个sneakme什么什么的网站代理来看

* Natal的技术,包括wiimote的技术,都有人做事后诸葛亮,说是老技术,不过总得有商业机构或者军事机构来将这些技术请出研究院,怎么整合、怎么应用才是关键

* Natal的精彩之处,至少一半在于其“网络社交”层面的应用,影象识别只是Natal大计划中的一部分而已,而Natal的其他部分也赋予影象识别技术更大的活力和发展空间,仅仅靠游戏应用来推广和普及——以当今所谓CU玩家狭隘的包容能力和游戏制作厂商的胆量来看,是不太现实的

* 其实我个人认为我这帖子里的应用模式也是蛮好的想法,把headtracking和S3D结合起来,达到“准全息呈像”的效果,大家可以参考批评一下
引用:
深夜惊魂之headtrack

其实就讲了近两年的所见所闻, 题目可能并不恰当



| Johnny Lee的wiimote headtracking

一切都是从两年前johnny Lee在youtube发布的这段视频开始

  
Johnny Lee.jpg (15.01 KB)
28/3/2009 00:26



这个视频造成了轰动性的效应,包括国内各大IT网站在内的世界范围内IT媒体都对这个技术作了介绍

根据最新情报,Johnny Lee在推出这个视频不久,立即被Microsoft招安到旗下游戏部门行研发(根据个人估计应该是应用到下一代主机上)

其实,Headtracking并不是Johnny Lee的发明,在更早之前,使用电脑玩模拟游戏的玩家就开始使用各种形式的头部动作捕捉,例如下面这个视频:

http://www.youtube.com/watch?v=HIu87lKxZsI

   track ir.jpg (29.13 KB)
28/3/2009 00:26

那么,也许会有人问,既然早就有了headtracking,Johnny Lee的贡献在哪里?





| 进入正题:Johnny Lee headtracking技术的思路

通过上面的两个视频,相信大家也可以得出两个结论:

1、Headtracking并不是Johnny Lee的发明

2、Johnny Lee是应用headtracking这个技术,把软件应用带到了更高的层面——虚拟3D

以往,人们观察电脑屏幕,人头部动作、位置的变化并不会造成显示内容的任何改变,这是一切“平面图象”的基本属性

而实际上,现实生活中,有“横看成岭侧成峰 远近高低各不同”的说法,因为观察角度不同我们都会看到不一样的景致

Johnny Lee最大的贡献——他利用一个已经成熟的技术,也就是headtracking,来实现了“立体观察”3D物件的原理

是的,Johnny Lee胜在他对Headtracking的应用思路上





| J.L式Headtracking应用,对于3D呈像的贡献

第一,我们通过红蓝眼镜、分时眼镜等方式,以左右眼不同角度的交错图实现了视觉上的立体纵深感

第二,J.L通过Headtracking实现了电脑内部处理3D物件在观察形式上的立体感

想象一下当这两种技术结合在一起——电脑呈像技术将进入“准全息”时代

这就是我在上一张帖子里提到的“S3D+headtracking是未来3D的趋势”,而这贴就是向不了解这个技术的朋友作入门介绍

我把这两个技术提到一起来比较,还有两个原因:

1、他们在技术上实际上都已经相当成熟,只是缺乏大众广泛的认识

2、他们实现的成本实际上都可以做到很低,普及的可实施性很大




| 要实现Headtracking,成本可以做到多低?

Johnny Lee视频在发布之处,很多人着迷于利用wiimote来实现headtracking,因为这样的技术比之前使用track ir成本低了不少

不久之后,就有更逆天的技术出现了,请见下面的视频:

http://www.youtube.com/watch?v=Q-nrmxNKt84

   webcam track.jpg (21.36 KB)
28/3/2009 00:34



实际上,在J.L视频之后一个月左右,我就看到国外有高手利用webcam(也就是很常见的网络摄像头)实现了J.L视频一模一样的效果

这种技术被称为webcam track

其成本可以想象——从人民币20元起价到100多元,电脑城遍地都有这种产品买



| Webcam Track的原理

仅仅靠摄像头,如何判断人头部在显示器之前空间内的三维位置呢?

这是托IBM(或者是Intel?)一个叫Open CV的开源项目的福

这个项目中提供一个关键性技术——人类面部识别,这个技术允许电脑通过分析webcam捕捉到的图象,得到人类面部的信息,并通过对这张脸大小变化、眼鼻嘴相对位置的变化,来解读人脸距离摄像头远近、高低、左右的信息

远近、高低、左右——这实际上包括了三维空间中的关键性维度,在这个层面的三维追踪被称为6dof(6 degrees of freedom)

也就是通过这个技术,利用普通摄像头webcam电脑也能判断出用户脑袋和显示器的相对位置——从而实现了headtrack,头部动作捕捉和追踪

webcam headtrack实验性应用的网络游戏,想象一下headtrack + S3D的效果
http://www.youtube.com/watch?v=SewngkDJCyY&NR=1






| Webcam Track的其他应用

既然提到webcam track,就顺带介绍一下主流利用webcam来捕捉、追踪的利用形式:

1、头部动作捕捉,headtrack,前面已经提到了,主要用在模拟游戏驾驶仓模拟观察以及3D物体立体观察,另外一个没提到的应用是这个:http://www.youtube.com/watch?v=f6caQ0IxBIo

2、红外线捕捉,leaser track,利用摄像头一样可以捕捉红外线,可以用于鼠标模拟,当然也有把红外发射器绑在帽子上来实现头部动作捕捉的

3、形状捕捉,分析webcam拍摄下的特定形状,如蓝色方块、红色方块等,根据方块的形状、大小变化来分析解度三维空间数据,基于这个技术的有camspace提供的用色块替代手柄的软件,还有日本人开发的虚拟女仆(Camspace:http://www.youtube.com/watch?v=v0srY37kkMw , 虚拟女仆:http://www.geishatokyo.com/jp/ar-figure/figure.html

4、多点触碰捕捉,网上有高手在摄像头前设置毛玻璃一块,当手指点到毛玻璃的另外一面,摄像头捕捉到手指的黑色阴影,并将其转换成多点触碰的信号,国内有达人用此来diy了microsoft的surface互动桌面技术(surface的视频:http://www.youtube.com/watch?v=rP5y7yp06n0





| 前景展望

很多技术其实已经存在很多年,只是一直缺乏推广

例如nintendo在nds上加入的触摸屏,在wii上加入的leaser track和动作感应(nintedo早年还有一个失败的尝试,vitual boy,实际上就是如今我们玩的3D游戏眼镜的远古版本),实际上都是成型多年的老技术,得到厂商推广后立即风起云涌,从这个角度上来说,wii最早被命名为revolution,改变的不仅仅是一时市场占有率,更让所有厂商和玩家(可能不包括“从小玩FC长大的资深高级非样板戏不玩高品位玩家”)转换了思路,让竞争对手也意识到原来主机的发展还有很多方向,技术发展之路上的未来明星技术还有很多被遗落在了身后、缺乏伯乐的赏识,等待人们去开发

现在而言,3D立体呈像技术在nvidia的推动下已经初具规模,接下来我仅期望能有有识之士能让J.L试headtrack发扬光大起来,这样我们就可以早日进入“准全息3D游戏时代”了[
[ 本帖最后由 superjay 于 2009-6-3 13:52 编辑 ]

TOP

马勒鼻

我辛苦码这么多字,到哪个论坛都只有沉底的命,多细得?

TOP

这些识别都是基于模型的,比较容易遇到鲁棒性上的问题。

例如一个残疾的、畸形的、假肢的人。。。或者一张烧伤的脸。。。
到时候极容易被人告上法院啊。。。

TOP

[posted by wap]

技术这种东西,原理都很简单,实现起来就未必。不要说用到现实中了。未来几年内大家估计还是拿着手柄在玩游戏。

TOP

引用:
原帖由 cuberoot 于 2009-6-3 14:32 发表
这些识别都是基于模型的,比较容易遇到鲁棒性上的问题。

例如一个残疾的、畸形的、假肢的人。。。或者一张烧伤的脸。。。
到时候极容易被人告上法院啊。。。
这种极端个例根本不用纳入讨论范畴。盲人还根本不能玩 Video Game呢,告谁去

TOP

Johnny Lee 現在也是natal計劃的一員,詳情可見他的BLOG

http://procrastineering.blogspot.com/2009/06/project-natal.html
引用:
Now, I should preface by saying I don't deserve credit for anything that you saw at E3. A large team of very smart, very hard working people were involved in building the demos you saw on stage. The part I am working on has much more to do with making sure this can transition from the E3 stage to your living room
一個cmu的互動科技博士生進了微軟先進科技研究部門,才猶如發現自己只是一位智慧與經驗遠不及其他學術前輩的小夥子...

太強大了.

[ 本帖最后由 村上春樹 于 2009-6-3 15:53 编辑 ]

TOP

我觉得这些东西还是没法应用到主流游戏类型里面

TOP

其实,不少公司花巨款搞motion capture设备的原因是什么?

TOP

从wii上来看,最受欢迎的应用了体感的游戏都是有现实运动基础的游戏,光枪,球类,赛车,刀剑;
体感能有效降低这类运动的难度并且实现良好的体验
可惜这类游戏在没有实体手感和振动的NATAL下玩的感觉都会及其SB,参考空手抓空气换轮胎开车视频

[ 本帖最后由 doomking 于 2009-6-3 18:16 编辑 ]

TOP

看软件支持,能不能开发出适合的游戏了
XO主流游戏我看都不适合,都对手感有高要求
射击用动作捕捉还真不如用光枪实在,赛车也没有方向盘实在,ACT更别说

针对蓝海就不好说了

TOP

引用:
原帖由 村上春樹 于 2009-6-3 15:50 发表
Johnny Lee 現在也是natal計劃的一員,詳情可見他的BLOG

http://procrastineering.blogspot.com/2009/06/project-natal.html

一個cmu的互動科技博士生進了微軟先進科技研究部門,才猶如發現自己只是一位智慧 ...
是的。Johnny Lee说了,真正进入每家每户客厅的时候,还会更加震撼。

TOP

发新话题
     
官方公众号及微博