北京白癜风治疗医院哪家效果好 https://yyk.39.net/bj/zhuanke/89ac7.html
摘要:人类进入人工智能时代,从机械地替代人类动作的自动化技术到智能地代替人类“思考”的AI技术,一场交互方式革命正在发生,已经爆发的AI语音控制交互方式,正在崛起的AI手势控制交互方式,甚至未来的高层次脑电流交互方式,我们需要重新审视技术世界的交互思维。
一、概述
在语言诞生前,手势是人类最基本、最原始、最简单的沟通方式,也是最能抵抗环境干扰的交互方式,如语音控制需要近距离安静、单纯的环境才能进行精准识别,智汇有初SpaceTouching技术为语音控制之外提供一种新的AI交互方式。
以噪音环境、无菌环境、触电环境、野战环境……激烈的谈话环境不适合语音识别的使用,无菌实验室需要尽可能避免交叉感染,高电压场景无接触绝缘;野外作战传递信息不允许语音为例,单一的AI交互方式无法满足,为手势控制提供了发挥空间。
或者更具体的场景,如智能汽车、智能手机、平板电脑、笔记本电脑、智能手表和智能电视……AI交互方式正在进入科技巨头IoT体系:
在智能电视(或智慧屏)的客厅,正在播放中的电视不适合语音控制精准识别,一个手势就能解决问题。
在驾驶汽车时,正在播放的广播或音乐不适合语音控制,而手势控制不仅可以避开声音干扰,更可以避免视线离开的交通事故风险,一个手势搞定。
在厨房油烟机运转时,厨房的噪音形成强大语音干扰,而手势控制不仅绕开噪音干扰,更避免做饭的手接触油烟机。
也就是说,像手机、台灯、开关、门、窗……智慧生活全场景,都可以手势控制代替语音控制,毕竟眼睛比耳朵信息读取能力更强。
二、SpaceTouching技术业务场景
在AI视觉算法领域,有人脸识别、肢体识别、步态识别、手势识别……智汇有初的主要研究方向“高精度”人机交互视觉算法,包括物体识别、肢体识别、步态识别、手势识别,重点突破高精度算法,做到0.01mm(八分之一头发丝直径)动作的识别。
而且,智汇有初SpaceTouching技术可以识别种动作,识别距离做到了3米以上,做到无网络物体识别,进一步扩大了高精度应用场景:
在高精度电路板场景
大批量电路板表面瑕疵
人眼无法做到
智汇有初0.01毫米识别精度可以
在高精度宝石加工表面场景
珍贵珠宝艺术要求无止境
人眼和放大镜难以识别瑕疵
智汇有初0.01毫米识别精度可以
在高精度机器人动作矫正场景
分毫误差决定工业品生死的领域
人的波动性大而不准
智汇有初0.01毫米识别精度可以
……
一瓶红酒需要长时间静止
一旦红酒柜存在震动
酒的品质就大受影响
而小震动肉眼难见
除了这些高精度使用场景的客户需求外,智汇有初的业务场景已经做到了“汽车的门、空调、音箱、窗、后视镜手势控制改装”、“智能油烟机开关、风量手势控制改装”、“抓娃娃机前后左右移动、抓取手势控制定制”、“电脑触控板前后左右移动、隐藏网页、放大网页、开关手势控制”、“窗帘的开关”、“实体大屏的手势控制游戏互动”、“投影屏幕的手势控制游戏互动”等消费场景。
在AIxIoT互联互通生态中,智汇有初已经具备高精度识别与控制技术能力,并得到实体场景验证,联合智能电视(或智慧屏)厂商、智能汽车厂商定制手势控制交互方式,相信这一天不会太久。
三、SpaceTouching技术逻辑
在技术方面来讲,AI语音识别模拟人类耳朵,而AI视觉识别模拟人类眼睛,是一种继一维按键、二维触屏的第三代三维交互方式,取代遥控器、按键、触控板,实现“手势识别、步态识别、人体动作识别”,用户“少交互、AI交互、隔空交互”,提升交互效率和体验,也更科技、安全、方便。
第一步:识别动作
摄像头或位置传感器,对空间的手势、关节姿态、物体运动等精准识别;
第二步:信息处理
图像处理器和处理软件,基于图像处理算法,建立人体动作模型;
第三步:执行动作
驱动硬件交互执行,实现人体空间动作的精准定位与识控。
一个技术商业化就要做到商业化需求的指标,SpaceTouching技术有三大技术指标领跑全球。
a.微:将空间动作识别技术实现模块化;
b.精:识别精准度达0.01mm;
c.小:模块体积全球最小。
以手势控制娃娃机为例,技术模块约为“1元硬币”大小。
以光电脑为例,没有硬件外设,体积做到了巴掌大。
四、AI的学习与数据优化闭环
像人一样,从一个懵懂的婴儿什么都不懂到一个博士毕业的科技工作者,人的学习让人变得越来越适应、理解世界的规则,并形成自己的独特智商资产壁垒,领先不学无术的人。
其实,AI手势控制也经历了AI语音控制、AI人脸识别同样的算法、数据问题,从一个只有初级算法工具的阶段到数据不断积累迭代,不断完善、升级算法的策略、方式,深度学习的AI算法逐渐达到用户的需求目标,并越来越精确,越来越好用,形成精准度和大数据的壁垒,建立自己的护城河。
10年前开始,智汇有初的哈尔滨工业大学博士团队就开始做SpaceTouching技术研发工作,而航天领域的工科强校哈尔滨工业大学机器人专业又是中国第一,大批企业合作实验数据和长期的算法策略实践成为难得的资源,可以说,0.01mm识别精度非哈尔滨工业大学机器人博士无法突破。
五、未来憧憬
智汇有初的哈尔滨工业大学机器人博士研发团队,10年的研发做到了多点手势识别、0.01mm识别精度、种动作识别以及技术的小模块化,在识别精度、算法策略、业务场景方面进行了许多探索和尝试,大场景低精度的肢体识别难度不大,人场景更近的高精度手势识别需求更高频,也坚信手势控制技术的爆发是时间问题:
憧憬一:三维手势建模的商业场景应用
把人的手关键进行三维建模,并精准定位关节点进行动态跟踪,完成手势一举一动的意图识别和定义识别。
人体运动本能与生俱来,手势的识别嵌入商业场景,成为关键的交互模块,如电商产品试穿试戴、VR/AR的手部动作识别、手语的识别、动作有关的在线培训、创意视频特效拍摄等场景,让非面对面沟通更立体、具象,也更有趣、高效。
憧憬二:手势交互的入口级场景应用
在智能汽车、家居、手机等使用场景,单纯的语音控制无法解决许很多关键场景问题,而手势控制轻而易举就做到了,尤其智能手机、平板电脑、智能电视(或智慧屏)、智能手表等入口级应用,连接着AIxIoT智能生活生态。
一些品牌已经探索简单的手势控制应用,如手机、平板电脑等,甚至这些入口应用控制全屋、全生态。
憧憬三:非语音或安全需求场景应用
没有一种交互方式能解决所有交互需求,一种交互方式有主要使用场景,也有使用场景的局限,需要其它交互方式弥补,包括语音交互、手势交互、脑电流交互。
在噪音干扰环境,单纯的AI语音控制瞬间失效,如工厂车间、音视频播放、演唱会、油烟机等,手势控制成为很好的解决方案,而安全要求的环境,如野外作战、触电环境、细菌环境、会议环境,手势控制成为绝佳替代方案。