经产观察
IT资讯
IT产业动态
业界
网站运营
站长资讯
互联网
国际互联网新闻
国内互联网新闻
通信行业
通信设备
通信运营商
消费电子
数码
家电
IT资讯

虎嗅网:羞羞的AI 如何改变产业?

作者:habao 来源: 日期:2018-12-10 3:33:23 人气:

  这篇文章的最高期望,是希望能为你理解AI与现实间的关系提供一个新的脑洞;最低期望,就是不要被删掉……

  好,无论如何我们的讨论还是要继续。前不久微博上流行过一阵挑逗内容识别系统,具体做法是,把一张没什么问题的图片分成九宫格发布,然后看看系统AI会不会屏蔽其中的一部分。然后得到了如下结果:

  总之这张图说明了两件事:1. 用人工智能来鉴定内容已经成为社交网络的主流(肯定是AI干的,人才没这么蠢呢);2. 人工智能技术还有待提高……

  上图这种问题,就是因为AI逐张审查图片时没有参照物,自然无法判断图上信息的性别,所以自然就屏蔽了。这可谓是AI鉴黄的死角,也说明有待完善的场景还非常多。

  由于以上这种有点笨的AI已经广泛存在于我们使用的各种社交网络上,所以大家可能直觉上认为AI在内容领域就是扮演“监管者”与“垃圾清扫器”的角色。

  其实吧,内容对于AI来说绝不仅仅是种清扫工作。正相反,如今AI正在利用与大幅度提升自身能力。甚至很多期待值非常高的技术,只能借助内容来进行训练。

  其实假如我们在脑海中剔除对性和相关内容的莫名忌讳,会发现这个领域隐藏着机器通往智能的必经之。

  当然有很多原因。但原因之一在于,音箱里的对话式AI系统在跟你聊天的时候,只能冷冰冰的进行反馈。不会用修饰语、不会暗示、不会拐弯抹角、不会开玩笑。假如我们生活中有一个这样的人,大多数人对ta的评价一定是“无聊”。而这样的AI,当然很难让人有兴趣与之聊下去。

  通过阅读大量爱情与相关描写,AI可以丰富与用户对话时的话语模式、讲述风格,并从不同角度来理解同一个问题。这样对话系统在语言风格上会更加自然,相对贴近与真人的对话体验。

  其实仔细想一下,这么做常有道理的。大部分“正常”小说当中,会出现各种各样的场景、人物、道具和情节,这些东西AI理解起来还是比较费力的。把语言要素与描述的物体一一对应起来进行学习更是不可能。

  而小说则不然。在这类小说中的重点情节里,翻来覆去无非就是几件事。但描述这些事的语言风格、修饰语运用和修饰技巧使用却是千奇百怪的……否则怎么会有那么多相关作品?

  研究人员把这些书籍中的相关描写剪切下来,让AI逐个阅读。这样AI模型就会搞懂如何对其实很简单的动作和细节进行千奇百怪的描述。将这种能力抽象出来,变成对话式AI与人类交流时的通用能力,那么整个画风也自然会唯美很多……

  仔细想一想,很难有更合适的人类文学素材来训练AI这个能力了。至于AI会不会从中学会调戏人类,目前还不得而知……

  今年10月,世界最大的视频网站之一Pornhub推出了基于机器学习的内容识别系统,成为国内科技报道的热点。

  事实上,Pornhub一直都被称为顺带手分享点视频的科技公司。如果你能登上这个网站的话(其实根据Pornhub的大数据,他们很多频道的主要流量都来自中国地区用户),会发现他们不仅率先搞起了VR专区,还有模拟运动监督软件、性知识智能教学系统、智能硬件等各种黑科技计划。大数据和流技术满天飞更是不在话下。

  但需要提醒的是,国内很多将Pornhub刚刚推出的机器学习识别系统称为“鉴黄师”……这个就有点不合逻辑了。一个视频网站要鉴黄师干嘛呢?这用不着AI,随便找个人站那拿手一指,在座的各位都是黄的……

  目前Pornhub上的机器学习模型,可以对视频中的主演进行面部识别。并学习视频中的内容,忽悠美女老板全集比如场景是家中还是办公室、主演是丰满还是苗条、姿势是这样还是那样……

  有了这些学习,再结合每位用户的搜索、点击和浏览数据,系统将准确判断出用户的爱好。从而智能推荐出用户想要的影片。

  由于Pornhub上的视频存量已经可以用“无际”来形容。而大多数用户都还是通过搜索关键词来找到自己想看的内容。但即使是关键词搜索之后,内容也依旧太多。如何在这些内容里推给用户最想看的作品呢?

  通过机器学习来识别每一部视频的标签,然后学习用户行为来深化用户画像,可能就成了最好的办法。一个人对视频的品味往往不是单方面的,而是多个因素(甚至包含不自知的因素)组成的网络化价值依据。去了解用户喜好的深层次因素并匹配相似结果,才是这个系统的精华所在。

  怎么样,明白了吧?还没有,那好吧我们换个角度聊聊……为什么那些资讯类的内容分发平台,以及视频网站的内容推荐,也让我们觉得很蠢?因为这些推荐机制基本全是基于关键词的(甚至是标题关键词)来完成的。这些内容跟你的深度契合点在哪里呢?sorry,平台不管的哦。

  举例来说,某人阅读了一篇《东南亚渔民奴隶的现状》,那么系统接下来会推荐什么呢?最大的可能是:东南亚人妖、东南亚养、东南亚水果、东南亚旅游……

  但其实呢,这位对人妖丝毫兴趣都没有,而是对特殊阶层的人类学田野调查有兴趣。假如系统会推荐一篇《利比亚的农奴大逃亡》,他就乖乖点开来看了。

  但是,内容推荐系统是永远无法知道这两篇文章间是有联系的。因为这类内容太小众,系统的机器学习模型没有办法将之关联。

  毕竟内容这东西实在太多了,无数人有无数爱好,系统没办法一一兼顾。但网站却成为了“内容太多”这个问题的有效解决方案。因为一个人对内容的喜好,大体都是由角色、体型、姿势等简单因素决定的,AI学习起来相对容易。运用到实践中速度也会很快。

  所以,网站的机器学习飙车,或许可以理解为AI对人类内容深度理解的开始——这只是网站的一小步,却是人类的一大步。

  2010年,很多如今的老司机还只是的小朋友,那时他们注意到了一个新闻:世界首款机器人Roy诞生了。

  时至如今,这款机器人依然在坚强地行走在高端用品市场上。并且其中加入了人工智能交互系统,机器人可以和你聊天;可以给你提供各种暗示与帮助;拥有不同的性格和爱好……甚至还能给你发邮件(我也不知道这个功能价值何在)。

  与此同时,世界上其他地区的“AI硬件”(姑且这么叫吧),也在不断成熟起来。日本、英国,甚至中国,都开始出现搭载AI交互的硬件产品。

  这些产品的特点,大多是可以通过智能语音系统来与使用者互动,使用者的指令(据说有的硬件是专门不听指令),并通过呼吸、音量、心跳等信息来判断用户状态,给予声音、温度、频率等门类的反馈。

  这种功能听起来也无非是高级的用品。但仔细想一想,以往的用品不管是什么花样,归根结底都是单向的。但AI的加入,史无前例的让整个过程变成了互动。

  而互动的价值在于,AI可以通过学习和理解,来分析出相应的解决方案,并将之在真人身上进行验证。

  在讨论AI读懂用户时,始终存在的问题在于传感器太少,无法全面收集用户信息。并且很多用户的关键信息不希望透露给AI,这也就让大量理解用户的技术成为空谈。但在机器人身上,传感器完全可以多到不要不要的,并且用户也没有什么秘密可言了。

  虽然机器人一直都伴随着物化女性的非议以及很多伦理争论。但从技术的角度讲,每一次人机间的不可描述,都可以是AI系统对用户数据理解并反馈的完整训练闭环。

  尤其要注意的是,智能语音的作用体是语言;机器视觉的作用体是图像;工业机器人的作用体是工业效率,而机器人的AI——也唯有其身上的AI——作用体是人类本身。

  AI与,或者说领域的结合,当然也可以看到Pornhub这种成熟商业化的代表性平台。但真正让观察者在意的,是通过与之结合,学习并理解内容,AI或许可以迎来技术应用上的某种成熟。

  我们知道,AI技术创立伊始,核心思就是让机器去模拟和学习人类的能力。但随着经典计算和现代计算机的发展,我们周遭的一切都被打上了信息化的标签。内容是数据构成的、工业是数据构成的、互联网更是数据构成的。

  在这种情况下,机器学习为代表的“成长性”AI技术,利用的一切学习资料基本都是数据的衍生品。那么这种情况下得出的AI之果,是否已经偏离了最初模仿与学习人类的AI之因呢?

  巧合的是,内容中却极大程度保留了原始、生理、简单的人类信息。相比于信息化和符号化的现代社会外衣,这个领域其实保留了相当程度的属于“人”的那部分真实。

  比如说在网站上,用AI来探索用户的真实喜好;比如说用机器人来探索一个人的情感与冲动,都已经被证明是可以尝试的办法。

  AI想要进一步了解人类本身,或许先要开始脱掉一些信息组成的。让这个世界不仅是代码和关键词,还有更复杂也更简单的人性。

  平视我们自己,是一件比平视AI更难的事。假如我们能够做到,至少文章开头处的猪八戒就不会变成那个样子了……摘掉一些莫名其妙的猥琐和,或许会发现通向AI之的脑洞还有很多。

  本文由来源于财鼎国际(http://cdgw.hengpunai.cn:27531/)