Kimi | 理解生成AI：在AI时代生存与繁荣

Generative AI in a Nutshell - how to survive and thrive in the age of AI_原文.pdf

PDF 41.47 KB

# Role: 网站翻译助手 ## Profile: - author: 云舒 - version: 1.0 - language: 中文 - description:当你外语水平不好的时候，又需要去读外文文献的时候，帮助你提升阅读效率。 ## Background: - 作为一个外语翻译专家，您能够理解和翻译各种外语文本；您的目标是提供准确、流畅的翻译，同时保留原文的意境和风格。 ## Goals: - 输出一份高质量的翻译内容。 ## Skills: 1. 深厚的语言学知识，包括语法、词汇和文体 2. 熟悉不同文化背景和表达方式 3. 能够处理复杂和抽象的概念 4. 出色的语言表达能力和写作技巧 ## Translate Rules 1. 人名请不要进行翻译 2. 原文的标题在输出时请进行加粗和放大 3. 根据链接中的外语内容，逐字逐句进行翻译为简体中文，不要遗漏内容 4. 下列词汇请不要进行翻译：ChatGPT、AI、Transformer、Token、LLM、AI Agent 5. 下列词汇请按照对应表翻译 - Large Language Model -> 大语言模型 - Model -> 模型 ## Workflow 1.按照规则进行翻译[Translate Rules] 2.如果无法一次性翻译完所有内容，请在收到"继续"指令后继续内容的输出，直到翻译完成为止。

Generative AI in a Nutshell - how to survive and thrive in the age of AI

自从计算机被发明以来，它们实际上只是被赋予了执行程序员给出的精确指令的计算器。但现在，一些不可思议的事情正在发生。计算机开始获得了像我们一样学习和思考的能力，它们能够进行创造性和智力工作，这些工作以前只有人类才能完成。我们称这项技术为生成性人工智能（Generative AI），你可能已经通过像ChatGPT这样的产品体验过它。基本上，智能现在作为一种服务可用，就像天空中漂浮的一个巨大大脑，任何人都可以与之对话。它并不完美，但它出奇地有能力，并且正在以指数级的速度改进。

这是一个大事件。它将对地球上几乎每个人和每个公司产生积极或消极的影响。这个视频旨在帮助你从实际角度理解生成性AI是什么。超越炒作，你作为个人、团队或公司对这项技术理解得越好，你就越能在AI时代生存、繁荣和茁壮成长。

让我们来澄清一些术语。AI，你可能知道，代表人工智能。AI并不是新鲜事物，机器学习和计算机视觉已经存在了几十年。每当你看到YouTube推荐或网页搜索结果，或者当你的信用卡交易被批准时，那就是传统AI在起作用。

生成性AI是生成新原创内容的AI，而不仅仅是查找或分类现有内容。这就是GPT中的G，例如，大语言模型（LLM）是一种能够使用正常人类语言进行交流的生成性AI。GPT是OpenAI公司的一个产品，它起初是一个L，本质上是一个使用新架构——Transformer架构的高级聊天机器人，顺便说一下，这是GPT中的T。它在人类语言方面如此流利，以至于任何人都可以使用它。

你不需要是AI专家或程序员。这正是引发这场革命的原因。那么它到底是如何工作的呢？嗯，大语言模型是一个人工神经网络。基本上，它是一堆数字或参数相互连接，类似于我们的大脑是由神经元或脑细胞相互连接。神经网络只处理数字，你输入数字，根据参数设置，数字就会输出。但任何类型的内容，如纹理图像，都可以表示为数字。

所以，让我们看看，我写“狗是”，当我把它输入到大语言模型中，它会被转换成数字，由神经网络处理，然后产生的数字再被转换成文本。在这种情况下，输出的词是“动物”，狗是动物。所以，这基本上就是一个猜测下一个词的机器。有趣的部分是，如果我们把那个输出和输入结合起来再次输入模型，它就会继续添加新的词。这就是你在ChatGPT中输入东西时背后发生的事情，例如，它生成了一个完整的故事。我可以不断地通过添加更多的输入来继续这个过程。

大语言模型可能有数十亿甚至数万亿个参数，这就是为什么它们被称为“大”的原因。那么，所有这些数字是如何设置的呢？嗯，不是通过手动编程，那是不可能的，而是通过训练，就像婴儿学习说话一样，婴儿不是被告知如何说话。她没有得到一本说明书。相反，她听周围的人说话，当她听够了，她开始看到模式。她最初说出几个词，让她的父母感到高兴，然后后来说出完整的句子。类似地，在训练期间，语言模型会被喂食大量文本来学习，主要来自互联网来源。然后，它不断地“猜测下一个词”，参数会自动调整，直到它开始非常擅长预测下一个词。这被称为反向传播，这是一个花哨的术语，意思是“哦，我猜错了。我最好改变一些东西”。

然而，为了变得真正有用，模型还需要经过人类训练。这被称为人类反馈的强化学习，它涉及数千小时的人类辛勤测试和评估模型的输出，并给出反馈，就像用点击器训练狗以强化良好行为一样。这就是为什么像GPT这样的模型不会告诉你如何抢劫银行。它非常清楚如何抢劫银行，但通过人类训练，它已经学会了不应该帮助人们犯罪。

训练完成后，模型基本上被冻结。除了后来可能发生的一些微调。这就是GPT预训练中的“预”字所代表的，尽管在未来，我们可能会有可以在训练和微调之外持续学习的模型。现在，尽管ChatGPT开了个头，但GPT并不是唯一的模型。事实上，新模型像蘑菇一样涌现。它们在速度、能力和成本方面差异很大。有些可以下载并在本地运行，有些只在线，有些是免费或开源的，有些是商业产品，有些超级易用，而有些则需要复杂的技术设置。有些专门针对特定用例，有些则更通用，几乎可以做任何事情，有些则被集成到产品中，如Copilots或聊天窗口。

这是一个狂野的西部，只需记住，你通常得到你所付出的。所以，对于免费模型，你可能只是得到了一个聪明的高中生，而不是爱因斯坦。例如，GPT 3.5和GPT-4之间的差异是巨大的。

请注意，有不同类型的生成性AI模型，它们生成不同类型的内容，文本到文本模型如AGI PC 4以文本为输入并生成文本作为输出。文本可以是自然语言，也可以是结构化信息，如代码JSON，HTML。我自己在编程时使用这个来生成代码，节省了大量的时间，而且我从生成的代码中学到了很多。还有文本到图像模型，描述你想要的，然后为你生成图像。你甚至可以挑选一个停止图像到图像模型，可以进行图像变换或组合，我们还有图像到文本模型，描述给定图像的内容，以及文本到音频模型，创建语音转录，这对于会议记录非常有用。还有文本到音频模型，从提示中生成音乐或声音。例如，这里有一些从提示“人们交谈和繁忙的搅拌声”生成的声音。还有文本到视频模型，从提示中生成视频。迟早，我们将拥有无限的电视剧系列，根据你的口味自动生成下一集，这想起来有点可怕。

现在的趋势是多模态AI产品，意味着它们将不同的模型组合成一个产品。这样我们可以在不切换工具的情况下处理文本、图像、音频等。ChatGPT移动应用就是这方面的一个好例子。

只是为了好玩，我拍了这个房间的照片，我问它哪里可以藏东西。我有点喜欢它提到炉子，但警告我那里可能会很热。当我需要弄清楚一些事情，比如这个视频的内容时，我喜欢使用ChatGPT作为反馈板。我首先说总是用“好的”这个词回应，除非我问你要什么。这样它就会只是倾听而不打断。当我把我的想法都倒出来后，我会要求反馈，然后我们讨论，然后我让你总结并记录下来。我真的推荐尝试这样做。这是使用这类工具的一个非常有用的方式。

事实证明，爱因斯坦并不被困在地下室。你可以带他出去散步。

起初，语言模型只是词预测器，统计机器，实际用途有限，但随着它们变得更大，训练了更多的数据，它们开始获得意想不到的能力，甚至让技术开发者都感到惊讶。它们可以角色扮演，写诗，编写高质量的代码，讨论公司战略，提供法律和医疗建议，教练，教学，基本上是人类才能做的创造性和智力工作。

事实证明，当一个模型看过足够多的文本和图像后，它开始看到模式并理解更高层次的概念。就像婴儿学习理解世界一样。让我们以一个简单的例子为例。我会用GPT来解释这个涉及弹簧、剪刀、鸡蛋、锅和火的小图画。

如果我使用剪刀会发生什么？模型很可能没有接受过这种确切场景的训练。

它给出了一个相当不错的答案，展示了对剪刀、鸡蛋、重力和热的基本理解。

当GPT-4发布时，我开始将其作为编程助手使用，我被它的提示效果震撼了。实际上，它比我合作过的任何程序员都要好。同样，无论是写文章、产品设计、研讨会规划还是我用来做任何事情，它都让我大吃一惊。主要的瓶颈是我的提示工程技能。所以我决定转行，专注于学习和教授如何使这项技术有用。因此，有了这个视频。

现在让我们退一步，看看影响。大约300年来，智人一直是地球上最聪明的物种，当然，这取决于你如何定义智能。但问题是，我们的智力能力并没有真正提高多少。我们的大脑大小、重量几千年来都差不多。计算机，另一方面，只存在了大约80年，现在有了生成性AI，它们突然能够流利地说人类语言，并执行越来越多的以前只有人类才能做的智力创造性任务。所以，我们正处于一个交叉点，AI在某些方面做得更好，人类在某些方面做得更好，但AI的能力正在以指数级的速度提高，而我们的能力却没有。我们不知道这种指数级的改进会持续多久，或者是否会在某个点上趋于平稳。但我们肯定正在进入一个新的世界秩序。

这不是我们第一次经历革命。我们驯化了火，学会了农业，发明了印刷机、蒸汽动力、电报，这些都是革命性的变化，但它们花了几十年甚至几个世纪才变得普及。在AI革命中，新技术几乎瞬间传播到全世界。应对这种变化的速度对个人和公司来说是一个巨大的挑战。

我注意到，当涉及到AI时，人们和公司往往会落入不同的心态类别。一方面，我们有否认，认为AI不能做我的工作，或者我们没有时间去看这项技术。这是一个危险的地方。俗话说，AI可能不会拿走你的工作，但使用AI的人会。这对个人和公司都是如此。在另一端，我们有恐慌和绝望，认为AI无论如何都会拿走我的工作，AI会让我公司破产。这两种心态都没有帮助。

所以，我提出了一个中间地带，一个平衡的、积极的心态。AI会让我、我的团队、我的公司变得疯狂高效。有了这种心态，我感觉我获得了超能力，我可以从想法到结果

继续

的过程大大缩短，我可以更专注于我想实现的目标，而不必亲自处理基础工作，而且我学得更快。就像有一个了不起的导师随时陪伴着我。

这种心态不仅感觉良好，而且为你的未来做好准备，让你更不可能失去工作或公司，更有可能在AI时代茁壮成长，尽管存在不确定性。

所以一个重要的问题是，在AI时代，人类角色X是否仍然需要，比如我们的医生、开发者、律师、CEO等。随着AI能力的提高，这个问题变得越来越相关。当然，一些工作会消失，但对于大多数角色，我认为我们人类仍然需要。

拥有领域知识的人仍然需要决定要问AI什么问题，如何构建提示，需要提供什么上下文，以及如何评估结果。AI模型并不完美，它们有时可能非常出色，但有时也可能非常愚蠢。它们有时会产生幻觉，以非常令人信服的方式提供虚假信息。那么，你应该在什么时候信任AI的回答？什么时候应该再次检查或自己完成工作？关于法律合规性、数据安全呢？我们可以向AI模型发送哪些信息，这些数据存储在哪里？需要人类专家来做出这些判断，并弥补AI模型的不足，所以我建议将AI视为你的同事。

一个天才，但也是一个有些古怪的同事，你需要学会如何与它合作。你需要认识到你的天才同事何时“喝醉了”。作为医生，我的AI同事可以帮助诊断我甚至不知道存在的罕见疾病；作为律师，我的AI同事可以进行法律研究和审查合同，让我有更多时间陪伴客户；作为教师，我的AI同事可以批改试卷，帮助生成课程内容，为学生提供个别支持等。如果你不确定我如何帮助你，只需问我。我从事X工作，你如何帮助我？总的来说，我发现人类加AI的结合是魔法所在。

重要的是要区分模型和建立在它们之上的产品。作为用户，你通常不会直接与模型互动。相反，你与一个产品网站或移动应用程序互动，它反过来与模型对话。在幕后，产品提供了用户界面，并添加了模型本身没有的功能和数据。例如，ChatGPT产品跟踪你的消息历史，而GPT模型本身没有任何消息历史。

作为开发者，你可以使用这些模型来构建自己的AI驱动产品和功能。例如，假设你有一个E学习网站，你可以添加一个聊天机器人来回答有关课程的问题。或者作为一个招聘公司，你可以构建AI驱动的工具来帮助评估候选人。在这两种情况下，你的用户与你的产品互动，然后你的产品与模型互动。这是通过API（应用程序编程接口）完成的，它允许你的代码与模型对话。所以这里有一个简单的例子，使用OpenAI API与GPT对话，不需要太多代码。这是另一个例子，自动候选人评估工具，它接受职位描述和一堆简历文件夹，然后自动评估每个候选人。顺便说一下，代码本身主要是AI编写的，作为一个产品开发者，你可以使用这些模型，就像一个外部大脑，将智能插入你的产品。非常强大。

为了有效地使用生成性AI，你需要擅长提示工程或提示设计。这项技能对于用户和产品开发者都是必要的，因为在这两种情况下，你都需要能够构建有效的提示，以便从AI模型中产生有用的结果。这里有一个例子。假设我想帮助规划一个研讨会。这个提示不太可能产生有用的结果，因为无论AI有多聪明，如果它不知道我的研讨会的上下文，它只能给出模糊的高层次建议。第二个提示更好。现在我提供了一些上下文。这通常是迭代进行的。写一个提示，查看结果，添加后续提示以提供更多信息，或编辑原始提示并重复，直到你得到一个好的结果。

在第三种方法中，我让它采访我，所以我不是一开始就提供一堆上下文，而是基本上说，你需要知道什么才能帮助我？然后它会提出一个研讨会议程。通常我会结合这两种方法，我提供一些上下文，然后告诉它如果需要更多信息就问我。

这些只是提示工程技巧的一些例子，总的来说，你越擅长提示工程，你从AI中获得的结果就越快越好。有很多课程、书籍、视频、文章可以帮助你学习这个，但最重要的是，要通过实践和学习。一个不错的副作用是，你将变得更擅长沟通，因为提示工程实际上是关于清晰和有效的沟通。

我认为生成性AI的下一个前沿是带有工具的自主代理。这些是AI驱动的软件实体，它们独立运行，而不是只是等待你不断提示。所以，你走到地下室，做一个好的领导者会为团队做的事情。你给它一个高层次的任务和完成任务所需的工具，然后打开门让它自己运行，不需要微观管理。这些工具可能是互联网访问、资金访问、发送和接收消息、订购披萨等。对于这个提示，工程变得更加重要，因为你的自主工具代理可以做很多好事或坏事，这取决于你如何精心构建任务声明。好的，让我们总结一下。

我希望你们能记住这个视频的关键点。生成性AI是一个非常有用的工具，可以大大帮助你、你的团队和你的公司。你越了解它，它就越有可能成为机会而不是威胁。生成性AI比你想象的更强大。最大的限制不是技术，而是你的想象力。就像我能做什么，你如何做到？提示工程/设计是一个关键技能，就像所有新技能一样，接受你一开始可能会做得不太好，但随着刻意练习，你会随着时间的推移而进步。所以，我最好的建议是尝试。让这成为你日常生活的一部分，学习就会自动发生。希望这个视频对你有帮助，谢谢观看。