AI画的驴肉火烧，差点把我笑死！

最近我搞了个AI内测账号，每天沉迷于请AI作画。下边是几张我请AI画的画，出乎你的意料吗？

就在过去这几个月里，以ChatGPT为典型的一类“善解人意”的AI忽然火了起来。这类AI的实用性特别高，能画画、能翻译句子、能写报告，最重要的是人指挥TA做这些事情都不用费心费力输入命令，只需要像聊天一样打字即可，不费劲。

AI理解人类语言，有点像坐标系

中国人民大学高瓴人工智能学院助理教授周骁表示，ChatGPT这类AI可以叫做自然语言型AI，其主要学习方向就是理解分析人类语言。在这之前，人机博弈型AI早在2016年左右就实现了突破，阿法狗战胜世界冠军柯洁就是最好的例子；图像识别型AI则是在过去几年达到满意的精度，能广泛应用于各种人脸识别、车牌识别的场景。

至于最近大火的ChatGPT则是语言模型，通过多种人工智能技术和算法实现了对自然语言的理解和生成，从而能够与人类进行自然的对话交互，它的出现让人工智能强势地摘掉了“人工智障”的帽子。GPT的全称叫生成预训练转换器(Generative Pretrained Transformer)，复旦大学附属中山医院院长、中国科学院院士葛均波曾经很形象地解释过这三个词：

Generative是生成的意思，表示它区别于既往搜索引擎，能自己生成创作出新的内容；Pretrained是预先训练意思，表示它之前已经在一些数据库里经过训练过，已经具有一些自身逻辑及判断；Transformer是一种全新的算法架构，能够在处理长文本时更高效，训练时间更短。

百姓网创始人、CEO王建硕试图通过坐标系的概念解释GPT识别人类语言的原理。“好比在三维空间中，知道三个坐标值就能确定一个点的位置，这三个坐标可以叫做参数，”他边比划边说：“但当我们提起某个物体时，可能需要上千个参数才能确定这一物体究竟是什么。比如苹果的参数有能吃、水果、颜色红或绿、在树上生长、一般直径不超过10厘米等等。类似参数越多，我们就越能精准确定某物体。”

当苹果和香蕉同时出现时，能吃、甜、水果等参数就不够了，光凭这三个参数谁也没有办法确定讲述的是苹果还是香蕉。这时候就得增加参数，比如形状是长条还是类似圆形？颜色是红绿还是黄？“这就是GPT的基本算法，本质上是建了一个上千甚至更高维度的模型。其实人脑中也有无数个这样的模型并且在随时调用，只是我们不会感受到罢了。”

所以有时候AI对句子的理解异于我们常人。比如下图就是我请它画的驴肉火烧，肉、火、烧的元素都齐备了，驴则以两只长耳朵的形式出现。

要从如此多的维度描述一个物体，其计算量自然可想而知。据复旦大学计算机科学技术学院教授张军平表示，ChatGPT大概用了285000个CPU和10000多颗GPU、其训练文本数据达到45Tb(1Tb=1024Gb)，训练成本高达1200万美元。

在一篇题为“ChatGPT：潜力、期待与限制”的论文中，张军平进一步解释道，ChatGPT主要受益于大型语言模型（Large Language Model），使用语言模型（LM）用大规模数据训练庞大的神经网络模型。

“ChatGPT会生成与用户意图相匹配的多个回合的响应。ChatGPT捕获先前的会话上下文来回答某些假设问题，这大大增强了会话交互模式下的用户体验。”

为测试这些AI对人类语言的理解能力，我分别在三个AI对话框中输入“anlyze how Artifical Intelligenz works”，错误都被轻松忽略。王建硕则教了个更直观的测试方法：问AI《家庭问答》的主播年龄的平方根是多少？要回答这一问题，AI需要搞清楚《家庭问答》是什么、其主播是谁、年龄多大了，最后再算一次平方根。

简直完美。

AI成熟后，连上班关门都会变得简单

前边讲的几种AI都深刻改变了我们的生活。比如人机博弈AI成熟后，游戏行业发展得到加速，人机对战不再是“虐菜”的代名词；人脸识别AI成熟后，“刷脸”也成为了人们的主流支付方式。

在风云协会陈经看来，GPT的发展将给人机交流方式带来革命性的改变。看看电脑的发展历史，电脑“输出”一直在进步，从文字到图像再到今天绚丽的建模与视频，但“输入”始终还是电脑鼠标，直到几年前声控才走入大家的生活，Siri还经常听不懂人话。随着GPT的发展与声音识别的结合，声控的准确性将大大提高。

3月15日，Open AI发布GPT-4，在GPT-3的基础上增加了图像识别功能。这就为人机进一步高效互动提供了可能性，比如目前还比较初级的手势控制将更快成熟。

陈经甚至设想了一个场景：早上离家上班时，不用再锁门关灯，而只需要对着大门口的摄像头挥手道别。AI立即会领会主人的意思，关灯反锁以待主人归来；等主人回来了，再对大门招招手，门就自动开了，走到哪个屋子里灯光也随着打开，躺到沙发上电视也会自己打开。

AI会取代人类的工作吗?

大家并不是都认同人工智能的出色表现的。据观察，这种认同与否往往与一个人从事的行业有关系。

比如我的一位画家朋友就对AI作画这件事比较抵触。“AI画的画是没有灵魂的”，他不无愤慨地表示：“其实那都不应该叫做画啦。AI不过是从网上扒拉点素材，再拼起来而已。”

再比如，我一位强烈要求匿名的科幻作家朋友对AI写稿表示鄙视，认为AI不可能像人类一样把握各种词汇的运用。我问不是“文无第一、武无第二”吗？这位作家表示同意这句话，但再三强调“AI写的小说抓不住读者的心”。

社科院人口与劳动经济所研究员屈小博教授一直研究AI对就业的影响，他就很理解这些人的感受。“大家都担心自己的工作被取代嘛，”他笑笑说：“我们这些研究员也担心啊。”

不过屈教授总体还是持乐观态度的，因为他觉得在旧岗位被取代同时AI也会带来新岗位。他表示劳动经济学里有个“全要素生产率”的概念，AI能在很大程度上提高全社会的生产率，从而创造更多的社会财富以供分配，也需要更多的岗位。

我还真跑到招聘网站上搜了一下带AI的招聘岗位，“AI顾问”、“AI工程师”、“AI指导”基本都能占据好几页，而且薪水看起来不算低。曲教授管这些岗位叫“人机交互岗位”，认为这种岗位会越来越多。

王建硕更是比较乐观，他还表示每次科技进步都会消灭旧岗位带来新岗位。“汽车发明了，马车夫这个工种慢慢淘汰了，但汽车司机是不是比那时的马车夫多多了？待遇也好吧？飞机发明出来，不就有了飞行员这个职业？而且有了飞机大家的生活水平也被带着提高了不少。AI进步越快，我们的总体生活就越好。”

不过曲教授强调，对个人来说压力还是有的，而且不小，因为自己的技能未必能适配新的岗位，要小心被劳动力市场的结构性矛盾所挤压。他的意见是，作为个人要终身学习、努力适应新情况，作为国家与社会则需要重视这一问题，给劳动者提供足够的培训与适应机制，尽量最小化甚至避免结构性矛盾带来的阵痛。

不会“追求幸福”是AI的死穴

作为一名毕业于自动化专业、参与过人工智能研发的记者，在本篇末尾我想自己说几段。人类有一个特性AI目前赶不上，在肉眼可见的将来也赶不上，那就是对美好生活的向往。

这个表述听起来似乎有点大，其实跟我们的生活连接十分紧密，因为人类社会就是在不断地追求幸福中前进的。原始人厌倦了靠双脚丈量大地的日子，所以发明了车轮，后来又发明了火车汽车；人类不满足于被囚禁在陆地上，老想去探索海洋，由此才发明了独木舟、木船以及后来的轮船；人类羡慕鸟儿的翅膀，想在天空自由地翱翔，于是飞机火箭一个个从梦想成为了现实。

某种意义上，是人类对美好生活的向往倒逼了技术进步，从而推动了历史的车轮滚滚向前。

到目前为止所有的AI都没有追求幸福的能力。它们就像最顶尖的仆人，训练有素反应迅捷，能在最短时间内解决人类提出的所有问题与需求，却唯独没有自己提出需求的能力。不提出需求也就没法进步，就只能止步于满足当下的循环。

如果以人类目前的技术水平创造出一个人工智能世界，那这个世界将能够顺畅运行却无法进步。原因很简单，没有进步的需求，人工智能在本质上只是人类编写的一段段程序，能够在已有的材料中精中取精建造大厦，却永远不会想着给这个世界增添片瓦。

有时候“求生欲”也是进步的一种动力，而这恰恰是生命的专属。当生命在38亿年前诞生于地球上时，就已经注定了生存繁衍的本能，其一切活动都是为了更好地生存，为此才能改变世界；人工智能就不一样了，不过是代码，是人类为解决问题而创造出来的，其本能是解决问题。这就决定了二者“主”和“仆”的区别，是被服务与服务的根本差别。

只有生命才想着给自己创造一个更好的环境，只有人类作为智慧生命有能力给自己创造这样的环境，人工智能还没法达到这样的境界。

我的采访对象王建硕表示只能部分赞同我的意见。他说他们曾经做过测试，问AI生命的本质是什么，根据回答再一句句追问，结果AI答了三天三夜。他觉得有了这么强的思考能力，AI终究会获得这种求生欲，从而想着改变自己的境遇。至于完成这个突变所需要的时间，他认为是五年甚至更短，但机器真的将求生欲实施起来可能要非常久远。。

五年不过一瞬间，让我们拭目以待。