泉果视点 | 人工智能的“幻觉”与“未来”

2023-03-29 11:28 星期三

泉果基金

那些会成为爆炸性头条的人工智能领域的进展，现在则很快就会被新的进展淹没。

生成式机器学习（Gen ML）、生成式人工智能（AIGC）、大规模语言学习（LLM），你最近应该没少遇到这些词汇，甚至容易搞混，由于事情发展得过于迅速，人们都还来不及约定一个统称。

放在以前，那些会成为爆炸性头条的人工智能领域的进展，现在则很快就会被新的进展淹没。由于不需要置办新装备，只要基本原理被人们理解，这些创新会在瞬间释放出惊人的创造力。而公众泡沫般的炒作速度，也让各方对人工智能领域的进展表现出完全不一样的态度。

01堪比互联网出现的“奇点”？

其中最不激进的观点认为，这是机器学习的第二次浪潮，只是比第一次大很多。哪些可以自动化？软件能够做什么？这些传统认知，都因此发生了进一步转变。换句话说，这改变了科技行业的运作方式。

比尔·盖茨的观点则更进一步，他将这种改变比作网络第一次出现在大众面前，特别是七十年代末在施乐帕罗奥多中心公司（PARC）第一次看到图形用户界面。他认为，从现在起，将改变我们与计算机的互动方式。今天你想让计算机做事，需要使用已经存在的软件，如果不存在，你可以自己创建简单的工具或者无代码的应用程序。如果两者都不能解决你的需求，你才需要学习写代码。而有了生成式机器学习，平时使用的自然语言就成了你的代码，而那些即使会写代码也无法解决的任务，也有望得到解决。

也有些人认为，自动化将带来严重的社会影响，但他们可能忘了客户管理巨头Salesforce出现二十年后也就只有20~25%的企业工作流转到云端。

最激进的观点认为，我们正走在最直接也最清晰通往人工通用智能的道路上，即机器学习的发展方向就是更多的数据和更大的模型。现在是GPT-4，到了GPT-5和GPT-6就会出现自发的自我意识，GPT-7可能就可以自动运行企业的财务和人力资源软件比如Workday。到了那个时候，原则上没有什么是人类可以做而计算机不能做的。

02风险与机会之“幻觉”插件

在人工智能中，“幻觉”是指人工智能做出的一种自信的反应，训练数据并不能为其提供依据。

例如，对特斯拉一无所知的产生“幻觉”的AI会选择一个它认为合理的随机数字作为年收入，比如136亿美元，但却没有任何迹象表明这是它自己想象的产物。幻觉的另一个例子是人工智能或聊天机器人会忘记自己的身份，声称自己是人类。

Open AI正在通过插件解决这一问题，插件不仅能让机器人浏览网络，还能与特定网站互动，让其他各类服务成为ChatGPT的“眼睛和耳朵”。有一个官方插件连接了ChatGPT 和 Wolfram｜Alpha，两者都基于自然语言，但多年来在人工智能领域一直是两条不同的路径，前者是统计派，后者是符号派。得益于Chat GPT的成功，我们有机会将两种方法结合起来。Wolfram|Alpha 擅长充分利用其结构化、高精准的知识将某事转化为精确计算，被视为ChatGPT补短板的最佳选择。其他的插件包括旅游类（Expedia和Kayak）和订餐类（OpenTable）等。

图1. 两类人工智能的路径走到了一起；来源：网络

目前插件每次下载的次数受限，但可以想象未来会有更多，而且某些插件在客户认知的基础上会成为默认插件。

03风险与机会之开放与被开放

ChatGPT的开放让程序员、分析师、作家等各行各业发现与人工智能结合的巨大好处，以及如果不学习使用这些工具（GPT-4，MidjourneyV5，Copilot）可能面临的劣势。

但随着危险信号越来越多，Open AI开始变得越来越不开放：人们在上面没有阻拦地获得如何洗钱的建议、订购与已知化合物特性相匹配的危险化学品，生成更高质量的以假乱真的照片和视频等等。虽然处在风口浪尖的GPT-4没有公布技术细节，但这并不会阻止竞争对手公布源代码、不断想办法突破技术限制，拒绝开放源代码的时间窗口在不断缩小。

人工智能领域的快速发展使人们的认知和洞见不断提高，比如根据这样一条推文（Jeremiah Lowin），在B2C（面向个人服务）领域，人工智能是“往大里搞”，给一个简单的提示，生成图片、文章、代码；而在B2B（面向企业服务）领域，人工智能的路径刚好相反，输入大量的自有数据和知识，提炼出最相关、最具操作性的解决方案。

总之，“如果你希望有一个喘息的机会来吸收所有新技术，那是不可能的”！

补充阅读

在这里，特别介绍一款即将推出的办公软件——Copilot 。

我的（阅读）目标是博学和应用：我希望能够在写作时参考前人的最佳观点；我希望能够做出决定，并通过我所读过的人的视角来看世界。简而言之，我想尽可能充分地分享人类智力和情感不断提升的水平。如果一个人有好的记忆力固然好，而Copilot比记忆宫殿技术甚至天才级的智商还要优秀。

在豪尔赫·路易斯·博尔赫斯（Jorge Luis Borges）的短篇小说《巴比伦图书馆》（The Library of Babel）中，他创造了一个无限的图书馆，包含了所有书呆子都想读的书：一本能准确预测你的未来的书，一本能把量子力学和广义相对论统一起来的书，一本能揭示其他星球上外星生命的社会学的书，一本能准确地确定爱的含义和人性的核心的书，一本能包含一个真正的道德体系的书。但同样，也正是由于这个图书馆包含所有可能的书，它也包含了很多胡言乱语，使得浏览整个图书馆的知识成为一项不可能完成的任务，换句话说，它包含了宇宙的秘密，凡人无法使用。

图2.巴比伦图书馆来源：《巴比伦图书馆》插图

大型语言模型（LLMs）在很大程度上类似于巴比伦塔。当人工智能在试图回应你的提示时，如果以知识库为基础，你将得到更高质量的结果。这就是为什么如果你花了很多时间来精心梳理个人图书馆——无论是书籍、文章、视频还是电影——所有这些前期投入都会大大改善你的Copilot体验。

首先，Copilot创造了一个可信赖的信息基础。其次，由于你的过往阅读信息与你正在思考的问题有关，访问你的个人知识库将有助于它返回与你实际相关的结果。

以下是Copilot需要克服的一些限制：

①语境窗口的限制。像GPT-4这样的模型在给定时间内只能读取一定数量的信息。上下文窗口越大，它可以调用更多的信息来完成查询。GPT-4的上下文窗口比GPT-3的大8倍，所以这一点正在显著改善。

②隐私和IP问题。许多用户将对上传笔记和日记感到犹豫不决，这是有道理的。当前的AI体验可以在你的手机或笔记本电脑上运行，而不是强迫你把数据发送到云端API上完成时，会极大刺激使用。

以下是它可能的工作方式：

每当你触摸键盘时，人工智能就会下载并整理你曾经读过的所有内容，并使用这些知识的总和来帮助你完成你想要完成的任务。

① 它将存在于你的电脑和手机上、在你使用的每个应用程序中。保存任何你想记住的东西都会非常容易，只要截图，或粘贴一个URL，或上传一个文件，或发送一个文本，你正在看的任何东西都会被保存下来。

② Copilot会在适当的时候将这些信息“带回来”给你。举个例子，可能会从你十年前读过的一本书中找到完美的引文，以帮助你提炼你想要表达的观点。或者，它可能会给你提供“反方”观点和论据，或者甚至可能改变你对一个正在考虑的话题的看法。

在过去的10年里，我花了相当精力研究大脑和心理各种模型——试图将科学、行为经济学和文学的精华应用到日常工作中，以尝试做出更好的决定。问题是，创建一个心理模型的清单并不能真正帮助你特别好地应用它们。现在如果你在挣扎着做一个决定，Copilot可以建议你把问题倒过来想，它使心理模型变得实用和可操作——而不仅仅是愿望。

阅90.16W

我要评论

反馈意见

欢迎您发表有价值的评论，发布广告和不和谐的评论都将会被删除，您的账号将禁止评论。

发表评论

要闻

股市

关联话题

泉果视点

5894 人关注

+ 关注

首页

电报

话题

盯盘

VIP

FM

投研

下载

头条

A股

港股

环球

公司

券商

基金·ETF

地产

金融

汽车

科创

品见

01堪比互联网出现的“奇点”？

02风险与机会之“幻觉”插件

图1. 两类人工智能的路径走到了一起；来源：网络

03风险与机会之开放与被开放

图2.巴比伦图书馆来源：《巴比伦图书馆》插图