皋兰| 永寿| 宁化| 承德市| 利辛| 吕梁| 武穴| 天等| 藁城| 潮州| 荥经| 金昌| 六枝| 曲松| 日土| 盘山| 民和| 黄岛| 常熟| 房山| 大新| 清河门| 宁阳| 姚安| 汉阳| 莘县| 峨眉山| 石台| 江孜| 西吉| 长沙县| 桂平| 珊瑚岛| 海晏| 海城| 科尔沁右翼中旗| 开鲁| 成都| 武强| 山阴| 缙云| 托克逊| 剑阁| 保德| 丹江口| 巫山| 沽源| 建昌| 临沂| 龙井| 崂山| 灵寿| 邗江| 安义| 丰润| 延川| 泰安| 金佛山| 湖口| 三门| 翠峦| 谢家集| 武冈| 易门| 长安| 海阳| 恒山| 建瓯| 宿松| 驻马店| 峨眉山| 沙圪堵| 永新| 宁海| 华坪| 云集镇| 儋州| 四川| 昌图| 泸州| 台中县| 霍邱| 宁强| 马尾| 疏附| 乌审旗| 都昌| 慈利| 延寿| 新竹市| 海林| 磁县| 西林| 泰和| 蕉岭| 武陟| 贾汪| 双牌| 达拉特旗| 相城| 德安| 连山| 萍乡| 射洪| 文安| 兴国| 昌都| 兴安| 天水| 昆明| 福清| 香港| 延津| 蒙城| 阿城| 汪清| 库尔勒| 井陉矿| 岳西| 大理| 侯马| 临漳| 孝感| 下陆| 香港| 资溪| 永丰| 尉犁| 塔城| 黄石| 张家口| 新竹县| 彰武| 青县| 当涂| 金坛| 孟村| 浮梁| 乾县| 新郑| 张家口| 勉县| 琼中| 曲麻莱| 阿克塞| 德钦| 张掖| 新河| 项城| 四会| 蓬莱| 贡嘎| 昭通| 庐江| 察隅| 綦江| 宝坻| 横县| 太仆寺旗| 康平| 万荣| 通江| 磴口| 赣州| 辉南| 德兴| 东西湖| 杜集| 镇宁| 望谟| 锦州| 白碱滩| 阿拉尔| 通城| 庆阳| 张家界| 清原| 德庆| 荣县| 徐州| 涞水| 凭祥| 南乐| 文登| 索县| 莱芜| 大埔| 义县| 尼勒克| 木里| 永顺| 林周| 阿克陶| 雁山| 南木林| 安县| 泾县| 石渠| 永济| 镇沅| 长乐| 靖边| 河间| 定陶| 华安| 临猗| 呼和浩特| 泰来| 綦江| 冠县| 白玉| 陇川| 永和| 拉孜| 王益| 二连浩特| 兴安| 柞水| 荆门| 漠河| 米易| 新乡| 阿荣旗| 和平| 涟水| 福山| 阿勒泰| 盂县| 林芝县| 高阳| 乌马河| 麻阳| 八一镇| 泽州| 壶关| 黟县| 苍山| 达县| 淮阳| 甘南| 克东| 五通桥| 定陶| 云县| 田阳| 湖北| 友好| 木里| 布拖| 梓潼| 昭觉| 平乡| 景东| 榆林| 开化| 乌兰| 东兰| 聊城| 乌鲁木齐| 东兴| 桓台| 新安| 离石| 元坝| 澳门在线博彩
第一时间get全球最新科技知识与数据
下载钛媒体客户端

扫描下载App

伯克利和Deepmind前赴后继,只为教出一个会做家务的机器人?

标签:四通五达 现金网排名 热水港桥

摘要: 家政任务提供了一个从零开始学习复杂控制任务的训练环境,这对通用机器智能来说至关重要。

文|脑极体

新年伊始,伯克利就传出新进展,他们教机器人做家务的能力更上一层楼了。

在最新的论文中,伯克利介绍了他们是如何让机器学会读懂人类的潜台词或未尽之意,而不是傻乎乎地按照字面意思或者奖励系统来机械地运动。

举个例子,当餐桌机器人上菜时,它会知道躲避酒柜,或者在停电等紧急情况下停止端盘子,而不是为了尽可能多地得到奖赏(端一个盘子系统会提供一个奖励),而马不停蹄地送盘子。甚至还可能直接把盘子打碎,这样就可以获得更多的“盘子”(奖励)了……

反正我看到这个新闻时,第一反应是机器人可真笨啊,这么简单的任务我两岁的小侄子都会做。第二反应是伯克利教机器人做家务的执念也未免太深了吧!

之前还开发过引擎教机器人铺床单、叠衣服、收拾桌面,总之,非要让机器人掺和家务这件事不可。

想要挑战家务技能的除了伯克利,还有Deepmind。去年2月,Deepmind就提出了一种新的学习范式“计划辅助控制SAC-X”,来帮助机器人学会整理桌子和堆叠衣物。

前不久佐治亚理工学院的研究人员,也发表了新的强化学习算法,可以教会机器人穿衣服。

为什么这么多AI巨头不约而同地走上了家务培训的道路?未来我们能拥有《底特律》中卡拉小姐姐那样温柔能干的家政机器人吗?本文就来尝试解释一下这些疑惑。

家务三十六计:家政机器人都掌握了哪些技能?

首先我们来看看,在这么多人类学霸、AI巨头的助攻下,机器人都学会了哪些家务小技能。

先来说说“家政狂魔”伯克利。

早在去年,我们就解读过伯克利的通用预测模型,它可以帮助机器人自主学习和掌握很多通用基础技能,在此基础上学习和预测主人的意图和任务的共性,从而可以举一反三执行广泛的任务类别,成长为一个优秀的“家务多面手”。比如折叠短裤毛巾、挪移苹果、整理桌面等等。

伯克利还推出了一个深度学习模型Dex-NET,基于角点检测和抓取策略,让机器人完成铺床单这一艰巨任务。

最值得一提的是新的研究成果“偏好优化模型”。机器人不仅能完成通用任务,而且还能够推断出更优解,适应带有隐藏条件的复杂现实环境。

比如在常规的“actor-critic”增强学习反馈机制中,主人要求机器人导航前往紫色的门,那么机器人就会选择最短路径(传统意义上的最优解),而忽略这么做会打碎路上的花瓶。

因为机器人无法获知,主人是否关心花瓶会不会被打碎。但如果机器人能自己模拟和演练过去发生过的行为轨迹,比如主人一直都绕着花瓶走,说明她是重视花瓶的完整状态的,由此推断出绕过花瓶是最有可能获得奖励、应该积极追求的目标。

机器人拥有洞察隐藏条件的能力,意味着它们可以从一种状态中学习人类的偏好,系统无需事无巨细地列出所有现实环境中的因果联系和条件,奖励函数也不再是线性机械的,机器人可以自主模拟和学习过去的经验,判断和应对未知的动态环境。

对于做家务这个任务来说,判断主人的喜好来进行作业,可以说是必杀技了。

与伯克利相比,Deepmind其实对医疗这种高精尖任务更感兴趣。但这并不妨碍它在家政领域发光发热。

Deepmind的“计划辅助控制SAC-X”模型,就旨在帮助机器人学会探索和掌握家务方面的基本技能。就像婴儿在爬行和走路之前必须发展出协调和平衡能力一样,SAC-X也有助于帮助机器掌握几种核心的视觉-运动技能。

比如运用模拟手臂,按照正确的顺序,即使没有见过这各任务,也能从零开始学习,并按要求顺利地把物体举起来。这样就能在无需额外编程的前提下,完成整理桌面这样的复杂任务。

此外,乔治亚理工学院将布料引入学习框架,教机器人学会穿衣服的论文也非常别出心裁。

因为衣服的布料材质各不相同,穿衣服的动作也无法遵循特定的运动轨迹,会和布料产生复杂的交互变化,机器人必须不断练习,对各个子任务(拽起边缘、扯平衣角等)进行模拟和优化,在不断变化的环境条件中学习到稳定的创意控制策略,最终完成穿不同衣服的任务目标。无论衬衫、套头毛衣,还是外套,都是妥妥滴!

听起来,好像大部分家务活儿机器人都可以驾驭嘛,但杯具的是,现实中能够见到的家务机器人,干起活来依然是一副又慢又笨的蠢样子。

比如由伯克利设计、Rethink Robotics公司开发的家庭助手,叠一个毛巾就要15分钟;而加州 FoldiMate推出的智能洗叠机器,可以按照程序把衣服叠成需要的方块,但需要人手动放置在展台上,并没有节省多少人力,售价还高达980美金(约7000块人民币)……emmmm还是自己动手丰衣足食吧。

不是比人慢,就是比人贵,靠机器人做家务性价比实在是太低了。那么,既然不能真的帮人类做家务,教机器人学习这些技能,究竟有何意义?

为什么是做家务,去工厂搬砖不行吗?

这么多研究人才齐上阵,要是去教小学生,怕是都能考上清华了。实在不行,去工厂搬砖也能缓解下劳动力紧张啊,干嘛非要跟家务活儿较劲呢?

原因恐怕在于,家政任务提供了一个从零开始学习复杂控制任务的训练环境,这对通用机器智能来说至关重要。

首先,家政任务的真实性和多样性,有助于智能体学会如何用最少的先验知识来解决复杂问题。

先验知识指的是一种不依赖于经验总结(类似编写好的程序,从结果推导过程)的一种元能力,通过观察学会推理和判断。而机器人就没有这种“天生的”知识,但显然我们也不可能将机器人服务的每个家庭、每个可能任务都进行预先编程,这时,训练机器人的通用能力就显得尤为关键了。

尽管机器永远不可能拥有像人一样的先验能力和通用性,在各个学科、各个工作岗位都能表现差不多。但在很多垂直领域,比如工业、家务、语言等,先验能力强的机器智能体就可以低成本、高适应性、灵活地完成工作任务,解决那些现在只有人才能解决的问题。

另外,家政任务是一个集视觉、触觉、运动、关节控制等为一体的任务,综合性很强,这是其他碎片应用不具备的环境,对训练多元功能协作的智能体很有帮助。

比如伯克利教机器人从垃圾桶中拾取原本看不见的物体,就需要通过摄像头采集深度图像,形成模拟数据集,再利用该数据集训练质量卷积神经网络(GQ-CNN),对物体进行图像分割,确定抓取尝试成功的可能性,最后形成抓取成功概率最高的策略,再对夹持器关节进行实时精密控制,才能最终完成这一操作。一次训练,多种收获。

更重要的是,家务的操作环境比起工业机器人、电子游戏等,都更加松散,充满变化,任务的主观预期和隐藏含义更难界定和预测,无形中加大了训练难度。与此同时,家政任务的训练成本也比较低,也更容易为大众所理解,社会效益和营销价值双丰收。

相比对机器狗拳打脚踢、在《Dota》中血虐真人玩家,让机器做做家务简直堪称是最政治正确、价廉物美的训练方式了。

醉翁之意:做完家务,这些研究还有什么用?

在家政机器人背后,实际隐含的是一种智能体创生的本质逻辑:在复杂的环境中自己探索出解决随机和非结构化问题的合理方案,可以安全地与环境交互,同时高效地完成任务。

具体一点说,训练家政机器人,主要有一下三个方面的好处:

一是培养更具有通用智能的机器人,在不需要过多指导的前提下,执行一系列任务,提高机器自动化的安全性和工作效率。

二是有助于开发用于分层规划、感知和推理的算法,可以帮助自动驾驶、工业自动化、智能物联网等等领域解决应用问题;

三是推动零样本学习、少样本学习等技术的进步。在缺乏外部奖励信号的情况下,算法也能很好地推理出行为的意图,可以显著提升电商、内容产品推荐系统的使用体验。

这样,大家恐怕就不难理解,为什家务会成为通用智能体成长道路上无法绕过的“垫脚石”了。

最后可能还有人想问:不爱做家务星人,我只关心机器人啥时候能进我家给我叠被铺床?我只能说:亲亲这边建议直接睡觉呢梦里什么都有。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

本文系作者 脑极体 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
分享到:

第一时间获取TMT行业新鲜资讯和深度商业分析,请在微信公众账号中搜索「钛媒体」或者「taimeiti」,或用手机扫描左方二维码,即可获得钛媒体每日精华内容推送和最优搜索体验,并参与编辑活动。

脑极体
脑极体

写让你脑洞大开且能看懂的人工智能、流媒体、海外科技

评论(0

Oh! no

您是否确认要删除该条评论吗?

分享到微信朋友圈

右江区向阳路号 西乡街道 房山成教中心 青芬 宗学夹道
蛟尾堡 窝把 才古庄村委会 龙眼南 学士路南段
亲朋棋牌 澳门百家乐玩法 澳门博彩 全讯线上娱乐 mg电子游戏官网
澳门银河开户平台 银河娱乐平台登录 线上博彩公司 澳门永利赌场可靠吗 ag电子游戏试玩
斗地主赌博网 澳门永利官网 澳门永利赌场靠谱吗 ag电子游戏试玩 申博游戏
龙虎斗游戏 威尼斯人平台 澳门永利赌场网址是多少 澳门至尊网址 pt电子游戏程序破解器
老虎机定位器 澳门大富豪网址 现金三公注册网址 牛牛游戏下载 现金骰宝 年度十大电子游戏 大小点游戏 玩什么游戏可以挣钱 电子游戏厅 方法奇葩赌博网 巴黎人网站 pt电子游戏哪个最会爆 澳门巴黎人游戏 澳门龙虎斗注册 澳门大富豪网站 押大小排行 真钱打牌 明升网站 十三水技巧 电子游戏下载 二十一点平台 现金网游戏开户平台 澳门百老汇游戏官网 皇博压大小 真钱捕鱼 跑马机游戏 赌博技巧 巴比伦赌场官网 现金三公 地下网址 捕鱼游戏技巧 英皇网站 手机玩游戏赚钱平台 现金网排行 pt电子游戏注册 赌博技巧 电脑玩游戏赚钱平台 海立方游戏 ag电子游戏排行 希尔顿官网 太阳网上压大小 现金赌钱游戏 现金棋牌游戏 真人网站网址 地下开户 九五至尊娱乐网址 澳门梭哈游戏官网 奇葩袖赌博网 鸿胜国际压大小 博狗扑克游戏 德州扑克游戏规则 庄闲代理 奔驰宝马老虎机下载 现金三公开户注册 免费试玩电子游戏 GT压大小 新濠天地注册 现金老虎机网站 纸牌赌博种类 乐天堂开户 澳门永利平台 电脑版捕鱼达人 玩电子游戏入门 斗牛游戏 bbin压大小 网上电子游戏网址 澳门网络下注平台 明升国际网址 明升娱乐 捕鱼达人电子游戏 mg电子游戏试玩 二十一点游戏赌场 澳门万利赌场官网 大小对比网站 现金电子游戏 电子游戏实用技术 老虎机破解器 澳门梭哈官网 澳门百老汇赌场注册 千炮捕鱼兑换现金 网上合法赌场 PT电子游戏 波克棋牌官方下载 天天棋牌 凤凰棋牌 美少女战士电子游戏 什么游戏可以赚人民币 银河国际娱乐 澳门番摊官网 澳门梭哈官网 胜博发电子游戏 电子游戏打鱼机 澳门现金网 大三巴网站 PT电子游戏 澳门银河国际娱乐 皇冠比分 老虎机 真钱斗地主 德州扑克游戏下载 申博 澳门金沙 澳门金沙 澳门金沙 申博 申博 申博 申博 申博 申博 申博 申博 澳门葡京 澳门葡京 澳门永利赌场 澳门永利赌场 澳门永利赌场 澳门永利赌场 澳门永利赌场 澳门百家乐 澳门百家乐 威尼斯人注册 威尼斯人注册 威尼斯人注册 威尼斯人注册 澳门葡京赌场 澳门葡京赌场 澳门葡京赌场 澳门葡京赌场 澳门葡京赌场 澳门葡京赌场 澳门葡京赌场 澳门葡京赌场 澳门葡京赌场 葡京赌场 葡京赌场 葡京赌场 必赢亚洲 必赢亚洲 必赢亚洲 必赢亚洲 必赢亚洲 必赢亚洲 必赢亚洲 必赢亚洲 必赢亚洲 必赢亚洲 必赢亚洲 必赢亚洲 葡京网址 葡京网址 葡京网址 葡京网址 葡京网址 永利 永利棋牌 永利棋牌 永利棋牌 永利棋牌 永利棋牌 永利棋牌 永利棋牌 永利棋牌 永利棋牌 永利棋牌 永利棋牌 现金网 现金网 现金网