虎嗅网：羞羞的AI 如何改变产业？

作者：habao 来源：日期：2018-12-10 3:33:23 人气：

　　这篇文章的最高期望，是希望能为你理解AI与现实间的关系提供一个新的脑洞；最低期望，就是不要被删掉……

　　好，无论如何我们的讨论还是要继续。前不久微博上流行过一阵挑逗内容识别系统，具体做法是，把一张没什么问题的图片分成九宫格发布，然后看看系统AI会不会屏蔽其中的一部分。然后得到了如下结果：

　　总之这张图说明了两件事：1. 用人工智能来鉴定内容已经成为社交网络的主流（肯定是AI干的，人才没这么蠢呢）；2. 人工智能技术还有待提高……

　　上图这种问题，就是因为AI逐张审查图片时没有参照物，自然无法判断图上信息的性别，所以自然就屏蔽了。这可谓是AI鉴黄的死角，也说明有待完善的场景还非常多。

　　由于以上这种有点笨的AI已经广泛存在于我们使用的各种社交网络上，所以大家可能直觉上认为AI在内容领域就是扮演“监管者”与“垃圾清扫器”的角色。

　　其实吧，内容对于AI来说绝不仅仅是种清扫工作。正相反，如今AI正在利用与大幅度提升自身能力。甚至很多期待值非常高的技术，只能借助内容来进行训练。

　　其实假如我们在脑海中剔除对性和相关内容的莫名忌讳，会发现这个领域隐藏着机器通往智能的必经之。

　　当然有很多原因。但原因之一在于，音箱里的对话式AI系统在跟你聊天的时候，只能冷冰冰的进行反馈。不会用修饰语、不会暗示、不会拐弯抹角、不会开玩笑。假如我们生活中有一个这样的人，大多数人对ta的评价一定是“无聊”。而这样的AI，当然很难让人有兴趣与之聊下去。

　　通过阅读大量爱情与相关描写，AI可以丰富与用户对话时的话语模式、讲述风格，并从不同角度来理解同一个问题。这样对话系统在语言风格上会更加自然，相对贴近与真人的对话体验。

　　其实仔细想一下，这么做常有道理的。大部分“正常”小说当中，会出现各种各样的场景、人物、道具和情节，这些东西AI理解起来还是比较费力的。把语言要素与描述的物体一一对应起来进行学习更是不可能。

　　而小说则不然。在这类小说中的重点情节里，翻来覆去无非就是几件事。但描述这些事的语言风格、修饰语运用和修饰技巧使用却是千奇百怪的……否则怎么会有那么多相关作品？

　　研究人员把这些书籍中的相关描写剪切下来，让AI逐个阅读。这样AI模型就会搞懂如何对其实很简单的动作和细节进行千奇百怪的描述。将这种能力抽象出来，变成对话式AI与人类交流时的通用能力，那么整个画风也自然会唯美很多……

　　仔细想一想，很难有更合适的人类文学素材来训练AI这个能力了。至于AI会不会从中学会调戏人类，目前还不得而知……

　　今年10月，世界最大的视频网站之一Pornhub推出了基于机器学习的内容识别系统，成为国内科技报道的热点。

　　事实上，Pornhub一直都被称为顺带手分享点视频的科技公司。如果你能登上这个网站的话（其实根据Pornhub的大数据，他们很多频道的主要流量都来自中国地区用户），会发现他们不仅率先搞起了VR专区，还有模拟运动监督软件、性知识智能教学系统、智能硬件等各种黑科技计划。大数据和流技术满天飞更是不在话下。

　　但需要提醒的是，国内很多将Pornhub刚刚推出的机器学习识别系统称为“鉴黄师”……这个就有点不合逻辑了。一个视频网站要鉴黄师干嘛呢？这用不着AI，随便找个人站那拿手一指，在座的各位都是黄的……

　　目前Pornhub上的机器学习模型，可以对视频中的主演进行面部识别。并学习视频中的内容，忽悠美女老板全集比如场景是家中还是办公室、主演是丰满还是苗条、姿势是这样还是那样……

　　有了这些学习，再结合每位用户的搜索、点击和浏览数据，系统将准确判断出用户的爱好。从而智能推荐出用户想要的影片。

　　由于Pornhub上的视频存量已经可以用“无际”来形容。而大多数用户都还是通过搜索关键词来找到自己想看的内容。但即使是关键词搜索之后，内容也依旧太多。如何在这些内容里推给用户最想看的作品呢？

　　通过机器学习来识别每一部视频的标签，然后学习用户行为来深化用户画像，可能就成了最好的办法。一个人对视频的品味往往不是单方面的，而是多个因素（甚至包含不自知的因素）组成的网络化价值依据。去了解用户喜好的深层次因素并匹配相似结果，才是这个系统的精华所在。

　　怎么样，明白了吧？还没有，那好吧我们换个角度聊聊……为什么那些资讯类的内容分发平台，以及视频网站的内容推荐，也让我们觉得很蠢？因为这些推荐机制基本全是基于关键词的（甚至是标题关键词）来完成的。这些内容跟你的深度契合点在哪里呢？sorry，平台不管的哦。

　　举例来说，某人阅读了一篇《东南亚渔民奴隶的现状》，那么系统接下来会推荐什么呢？最大的可能是：东南亚人妖、东南亚养、东南亚水果、东南亚旅游……

　　但其实呢，这位对人妖丝毫兴趣都没有，而是对特殊阶层的人类学田野调查有兴趣。假如系统会推荐一篇《利比亚的农奴大逃亡》，他就乖乖点开来看了。

　　但是，内容推荐系统是永远无法知道这两篇文章间是有联系的。因为这类内容太小众，系统的机器学习模型没有办法将之关联。

　　毕竟内容这东西实在太多了，无数人有无数爱好，系统没办法一一兼顾。但网站却成为了“内容太多”这个问题的有效解决方案。因为一个人对内容的喜好，大体都是由角色、体型、姿势等简单因素决定的，AI学习起来相对容易。运用到实践中速度也会很快。

　　所以，网站的机器学习飙车，或许可以理解为AI对人类内容深度理解的开始——这只是网站的一小步，却是人类的一大步。

　　2010年，很多如今的老司机还只是的小朋友，那时他们注意到了一个新闻：世界首款机器人Roy诞生了。

　　时至如今，这款机器人依然在坚强地行走在高端用品市场上。并且其中加入了人工智能交互系统，机器人可以和你聊天；可以给你提供各种暗示与帮助；拥有不同的性格和爱好……甚至还能给你发邮件（我也不知道这个功能价值何在）。

　　与此同时，世界上其他地区的“AI硬件”（姑且这么叫吧），也在不断成熟起来。日本、英国，甚至中国，都开始出现搭载AI交互的硬件产品。

　　这些产品的特点，大多是可以通过智能语音系统来与使用者互动，使用者的指令（据说有的硬件是专门不听指令），并通过呼吸、音量、心跳等信息来判断用户状态，给予声音、温度、频率等门类的反馈。

　　这种功能听起来也无非是高级的用品。但仔细想一想，以往的用品不管是什么花样，归根结底都是单向的。但AI的加入，史无前例的让整个过程变成了互动。

　　而互动的价值在于，AI可以通过学习和理解，来分析出相应的解决方案，并将之在真人身上进行验证。

　　在讨论AI读懂用户时，始终存在的问题在于传感器太少，无法全面收集用户信息。并且很多用户的关键信息不希望透露给AI，这也就让大量理解用户的技术成为空谈。但在机器人身上，传感器完全可以多到不要不要的，并且用户也没有什么秘密可言了。

　　虽然机器人一直都伴随着物化女性的非议以及很多伦理争论。但从技术的角度讲，每一次人机间的不可描述，都可以是AI系统对用户数据理解并反馈的完整训练闭环。

　　尤其要注意的是，智能语音的作用体是语言；机器视觉的作用体是图像；工业机器人的作用体是工业效率，而机器人的AI——也唯有其身上的AI——作用体是人类本身。

　　AI与，或者说领域的结合，当然也可以看到Pornhub这种成熟商业化的代表性平台。但真正让观察者在意的，是通过与之结合，学习并理解内容，AI或许可以迎来技术应用上的某种成熟。

　　我们知道，AI技术创立伊始，核心思就是让机器去模拟和学习人类的能力。但随着经典计算和现代计算机的发展，我们周遭的一切都被打上了信息化的标签。内容是数据构成的、工业是数据构成的、互联网更是数据构成的。

　　在这种情况下，机器学习为代表的“成长性”AI技术，利用的一切学习资料基本都是数据的衍生品。那么这种情况下得出的AI之果，是否已经偏离了最初模仿与学习人类的AI之因呢？

　　巧合的是，内容中却极大程度保留了原始、生理、简单的人类信息。相比于信息化和符号化的现代社会外衣，这个领域其实保留了相当程度的属于“人”的那部分真实。

　　比如说在网站上，用AI来探索用户的真实喜好；比如说用机器人来探索一个人的情感与冲动，都已经被证明是可以尝试的办法。

　　AI想要进一步了解人类本身，或许先要开始脱掉一些信息组成的。让这个世界不仅是代码和关键词，还有更复杂也更简单的人性。

　　平视我们自己，是一件比平视AI更难的事。假如我们能够做到，至少文章开头处的猪八戒就不会变成那个样子了……摘掉一些莫名其妙的猥琐和，或许会发现通向AI之的脑洞还有很多。

　　本文由来源于财鼎国际(http://cdgw.hengpunai.cn:27531/)

关键词：类似虎嗅网的网站

上一篇：IT之家版638发布：新增账号快捷切换

公主坟草根网

搜索

虎嗅网：羞羞的AI 如何改变产业？