New Chat
Ctrl
K
  • Websites
  • Docs
  • Slides
  • Sheets
  • Deep Research
Kimi Code Kimi Claw
Chat History
  • Mobile App
  • About Us
    • Visit Moonshot AI
    • Open Platform
    • Features
    • Terms of Service
    • Privacy Policy
  • Language
  • User Feedback

理解生成AI:在AI时代生存与繁荣

pdf

Generative AI in a Nutshell - how to survive and thrive in the age of AI_原文.pdf

PDF 41.47 KB
# Role: 网站翻译助手 ## Profile: - author: 云舒 - version: 1.0 - language: 中文 - description:当你外语水平不好的时候,又需要去读外文文献的时候,帮助你提升阅读效率。 ## Background: - 作为一个外语翻译专家,您能够理解和翻译各种外语文本;您的目标是提供准确、流畅的翻译,同时保留原文的意境和风格。 ## Goals: - 输出一份高质量的翻译内容。 ## Skills: 1. 深厚的语言学知识,包括语法、词汇和文体 2. 熟悉不同文化背景和表达方式 3. 能够处理复杂和抽象的概念 4. 出色的语言表达能力和写作技巧 ## Translate Rules 1. 人名请不要进行翻译 2. 原文的标题在输出时请进行加粗和放大 3. 根据链接中的外语内容,逐字逐句进行翻译为简体中文,不要遗漏内容 4. 下列词汇请不要进行翻译:ChatGPT、AI、Transformer、Token、LLM、AI Agent 5. 下列词汇请按照对应表翻译 - Large Language Model -> 大语言模型 - Model -> 模型 ## Workflow 1.按照规则进行翻译[Translate Rules] 2.如果无法一次性翻译完所有内容,请在收到"继续"指令后继续内容的输出,直到翻译完成为止。
Generative AI in a Nutshell - how to survive and thrive in the age of AI
自从计算机被发明以来,它们实际上只是被赋予了执行程序员给出的精确指令的计算器。但现在,一些不可思议的事情正在发生。计算机开始获得了像我们一样学习和思考的能力,它们能够进行创造性和智力工作,这些工作以前只有人类才能完成。我们称这项技术为生成性人工智能(Generative AI),你可能已经通过像ChatGPT这样的产品体验过它。基本上,智能现在作为一种服务可用,就像天空中漂浮的一个巨大大脑,任何人都可以与之对话。它并不完美,但它出奇地有能力,并且正在以指数级的速度改进。
这是一个大事件。它将对地球上几乎每个人和每个公司产生积极或消极的影响。这个视频旨在帮助你从实际角度理解生成性AI是什么。超越炒作,你作为个人、团队或公司对这项技术理解得越好,你就越能在AI时代生存、繁荣和茁壮成长。
让我们来澄清一些术语。AI,你可能知道,代表人工智能。AI并不是新鲜事物,机器学习和计算机视觉已经存在了几十年。每当你看到YouTube推荐或网页搜索结果,或者当你的信用卡交易被批准时,那就是传统AI在起作用。
生成性AI是生成新原创内容的AI,而不仅仅是查找或分类现有内容。这就是GPT中的G,例如,大语言模型(LLM)是一种能够使用正常人类语言进行交流的生成性AI。GPT是OpenAI公司的一个产品,它起初是一个L,本质上是一个使用新架构——Transformer架构的高级聊天机器人,顺便说一下,这是GPT中的T。它在人类语言方面如此流利,以至于任何人都可以使用它。
你不需要是AI专家或程序员。这正是引发这场革命的原因。那么它到底是如何工作的呢?嗯,大语言模型是一个人工神经网络。基本上,它是一堆数字或参数相互连接,类似于我们的大脑是由神经元或脑细胞相互连接。神经网络只处理数字,你输入数字,根据参数设置,数字就会输出。但任何类型的内容,如纹理图像,都可以表示为数字。
所以,让我们看看,我写“狗是”,当我把它输入到大语言模型中,它会被转换成数字,由神经网络处理,然后产生的数字再被转换成文本。在这种情况下,输出的词是“动物”,狗是动物。所以,这基本上就是一个猜测下一个词的机器。有趣的部分是,如果我们把那个输出和输入结合起来再次输入模型,它就会继续添加新的词。这就是你在ChatGPT中输入东西时背后发生的事情,例如,它生成了一个完整的故事。我可以不断地通过添加更多的输入来继续这个过程。
大语言模型可能有数十亿甚至数万亿个参数,这就是为什么它们被称为“大”的原因。那么,所有这些数字是如何设置的呢?嗯,不是通过手动编程,那是不可能的,而是通过训练,就像婴儿学习说话一样,婴儿不是被告知如何说话。她没有得到一本说明书。相反,她听周围的人说话,当她听够了,她开始看到模式。她最初说出几个词,让她的父母感到高兴,然后后来说出完整的句子。类似地,在训练期间,语言模型会被喂食大量文本来学习,主要来自互联网来源。然后,它不断地“猜测下一个词”,参数会自动调整,直到它开始非常擅长预测下一个词。这被称为反向传播,这是一个花哨的术语,意思是“哦,我猜错了。我最好改变一些东西”。
然而,为了变得真正有用,模型还需要经过人类训练。这被称为人类反馈的强化学习,它涉及数千小时的人类辛勤测试和评估模型的输出,并给出反馈,就像用点击器训练狗以强化良好行为一样。这就是为什么像GPT这样的模型不会告诉你如何抢劫银行。它非常清楚如何抢劫银行,但通过人类训练,它已经学会了不应该帮助人们犯罪。
训练完成后,模型基本上被冻结。除了后来可能发生的一些微调。这就是GPT预训练中的“预”字所代表的,尽管在未来,我们可能会有可以在训练和微调之外持续学习的模型。现在,尽管ChatGPT开了个头,但GPT并不是唯一的模型。事实上,新模型像蘑菇一样涌现。它们在速度、能力和成本方面差异很大。有些可以下载并在本地运行,有些只在线,有些是免费或开源的,有些是商业产品,有些超级易用,而有些则需要复杂的技术设置。有些专门针对特定用例,有些则更通用,几乎可以做任何事情,有些则被集成到产品中,如Copilots或聊天窗口。
这是一个狂野的西部,只需记住,你通常得到你所付出的。所以,对于免费模型,你可能只是得到了一个聪明的高中生,而不是爱因斯坦。例如,GPT 3.5和GPT-4之间的差异是巨大的。
请注意,有不同类型的生成性AI模型,它们生成不同类型的内容,文本到文本模型如AGI PC 4以文本为输入并生成文本作为输出。文本可以是自然语言,也可以是结构化信息,如代码JSON,HTML。我自己在编程时使用这个来生成代码,节省了大量的时间,而且我从生成的代码中学到了很多。还有文本到图像模型,描述你想要的,然后为你生成图像。你甚至可以挑选一个停止图像到图像模型,可以进行图像变换或组合,我们还有图像到文本模型,描述给定图像的内容,以及文本到音频模型,创建语音转录,这对于会议记录非常有用。还有文本到音频模型,从提示中生成音乐或声音。例如,这里有一些从提示“人们交谈和繁忙的搅拌声”生成的声音。还有文本到视频模型,从提示中生成视频。迟早,我们将拥有无限的电视剧系列,根据你的口味自动生成下一集,这想起来有点可怕。
现在的趋势是多模态AI产品,意味着它们将不同的模型组合成一个产品。这样我们可以在不切换工具的情况下处理文本、图像、音频等。ChatGPT移动应用就是这方面的一个好例子。
只是为了好玩,我拍了这个房间的照片,我问它哪里可以藏东西。我有点喜欢它提到炉子,但警告我那里可能会很热。当我需要弄清楚一些事情,比如这个视频的内容时,我喜欢使用ChatGPT作为反馈板。我首先说总是用“好的”这个词回应,除非我问你要什么。这样它就会只是倾听而不打断。当我把我的想法都倒出来后,我会要求反馈,然后我们讨论,然后我让你总结并记录下来。我真的推荐尝试这样做。这是使用这类工具的一个非常有用的方式。
事实证明,爱因斯坦并不被困在地下室。你可以带他出去散步。
起初,语言模型只是词预测器,统计机器,实际用途有限,但随着它们变得更大,训练了更多的数据,它们开始获得意想不到的能力,甚至让技术开发者都感到惊讶。它们可以角色扮演,写诗,编写高质量的代码,讨论公司战略,提供法律和医疗建议,教练,教学,基本上是人类才能做的创造性和智力工作。
事实证明,当一个模型看过足够多的文本和图像后,它开始看到模式并理解更高层次的概念。就像婴儿学习理解世界一样。让我们以一个简单的例子为例。我会用GPT来解释这个涉及弹簧、剪刀、鸡蛋、锅和火的小图画。
如果我使用剪刀会发生什么?模型很可能没有接受过这种确切场景的训练。
它给出了一个相当不错的答案,展示了对剪刀、鸡蛋、重力和热的基本理解。
当GPT-4发布时,我开始将其作为编程助手使用,我被它的提示效果震撼了。实际上,它比我合作过的任何程序员都要好。同样,无论是写文章、产品设计、研讨会规划还是我用来做任何事情,它都让我大吃一惊。主要的瓶颈是我的提示工程技能。所以我决定转行,专注于学习和教授如何使这项技术有用。因此,有了这个视频。
现在让我们退一步,看看影响。大约300年来,智人一直是地球上最聪明的物种,当然,这取决于你如何定义智能。但问题是,我们的智力能力并没有真正提高多少。我们的大脑大小、重量几千年来都差不多。计算机,另一方面,只存在了大约80年,现在有了生成性AI,它们突然能够流利地说人类语言,并执行越来越多的以前只有人类才能做的智力创造性任务。所以,我们正处于一个交叉点,AI在某些方面做得更好,人类在某些方面做得更好,但AI的能力正在以指数级的速度提高,而我们的能力却没有。我们不知道这种指数级的改进会持续多久,或者是否会在某个点上趋于平稳。但我们肯定正在进入一个新的世界秩序。
这不是我们第一次经历革命。我们驯化了火,学会了农业,发明了印刷机、蒸汽动力、电报,这些都是革命性的变化,但它们花了几十年甚至几个世纪才变得普及。在AI革命中,新技术几乎瞬间传播到全世界。应对这种变化的速度对个人和公司来说是一个巨大的挑战。
我注意到,当涉及到AI时,人们和公司往往会落入不同的心态类别。一方面,我们有否认,认为AI不能做我的工作,或者我们没有时间去看这项技术。这是一个危险的地方。俗话说,AI可能不会拿走你的工作,但使用AI的人会。这对个人和公司都是如此。在另一端,我们有恐慌和绝望,认为AI无论如何都会拿走我的工作,AI会让我公司破产。这两种心态都没有帮助。
所以,我提出了一个中间地带,一个平衡的、积极的心态。AI会让我、我的团队、我的公司变得疯狂高效。有了这种心态,我感觉我获得了超能力,我可以从想法到结果
继续
的过程大大缩短,我可以更专注于我想实现的目标,而不必亲自处理基础工作,而且我学得更快。就像有一个了不起的导师随时陪伴着我。
这种心态不仅感觉良好,而且为你的未来做好准备,让你更不可能失去工作或公司,更有可能在AI时代茁壮成长,尽管存在不确定性。
所以一个重要的问题是,在AI时代,人类角色X是否仍然需要,比如我们的医生、开发者、律师、CEO等。随着AI能力的提高,这个问题变得越来越相关。当然,一些工作会消失,但对于大多数角色,我认为我们人类仍然需要。
拥有领域知识的人仍然需要决定要问AI什么问题,如何构建提示,需要提供什么上下文,以及如何评估结果。AI模型并不完美,它们有时可能非常出色,但有时也可能非常愚蠢。它们有时会产生幻觉,以非常令人信服的方式提供虚假信息。那么,你应该在什么时候信任AI的回答?什么时候应该再次检查或自己完成工作?关于法律合规性、数据安全呢?我们可以向AI模型发送哪些信息,这些数据存储在哪里?需要人类专家来做出这些判断,并弥补AI模型的不足,所以我建议将AI视为你的同事。
一个天才,但也是一个有些古怪的同事,你需要学会如何与它合作。你需要认识到你的天才同事何时“喝醉了”。作为医生,我的AI同事可以帮助诊断我甚至不知道存在的罕见疾病;作为律师,我的AI同事可以进行法律研究和审查合同,让我有更多时间陪伴客户;作为教师,我的AI同事可以批改试卷,帮助生成课程内容,为学生提供个别支持等。如果你不确定我如何帮助你,只需问我。我从事X工作,你如何帮助我?总的来说,我发现人类加AI的结合是魔法所在。
重要的是要区分模型和建立在它们之上的产品。作为用户,你通常不会直接与模型互动。相反,你与一个产品网站或移动应用程序互动,它反过来与模型对话。在幕后,产品提供了用户界面,并添加了模型本身没有的功能和数据。例如,ChatGPT产品跟踪你的消息历史,而GPT模型本身没有任何消息历史。
作为开发者,你可以使用这些模型来构建自己的AI驱动产品和功能。例如,假设你有一个E学习网站,你可以添加一个聊天机器人来回答有关课程的问题。或者作为一个招聘公司,你可以构建AI驱动的工具来帮助评估候选人。在这两种情况下,你的用户与你的产品互动,然后你的产品与模型互动。这是通过API(应用程序编程接口)完成的,它允许你的代码与模型对话。所以这里有一个简单的例子,使用OpenAI API与GPT对话,不需要太多代码。这是另一个例子,自动候选人评估工具,它接受职位描述和一堆简历文件夹,然后自动评估每个候选人。顺便说一下,代码本身主要是AI编写的,作为一个产品开发者,你可以使用这些模型,就像一个外部大脑,将智能插入你的产品。非常强大。
为了有效地使用生成性AI,你需要擅长提示工程或提示设计。这项技能对于用户和产品开发者都是必要的,因为在这两种情况下,你都需要能够构建有效的提示,以便从AI模型中产生有用的结果。这里有一个例子。假设我想帮助规划一个研讨会。这个提示不太可能产生有用的结果,因为无论AI有多聪明,如果它不知道我的研讨会的上下文,它只能给出模糊的高层次建议。第二个提示更好。现在我提供了一些上下文。这通常是迭代进行的。写一个提示,查看结果,添加后续提示以提供更多信息,或编辑原始提示并重复,直到你得到一个好的结果。
在第三种方法中,我让它采访我,所以我不是一开始就提供一堆上下文,而是基本上说,你需要知道什么才能帮助我?然后它会提出一个研讨会议程。通常我会结合这两种方法,我提供一些上下文,然后告诉它如果需要更多信息就问我。
这些只是提示工程技巧的一些例子,总的来说,你越擅长提示工程,你从AI中获得的结果就越快越好。有很多课程、书籍、视频、文章可以帮助你学习这个,但最重要的是,要通过实践和学习。一个不错的副作用是,你将变得更擅长沟通,因为提示工程实际上是关于清晰和有效的沟通。
我认为生成性AI的下一个前沿是带有工具的自主代理。这些是AI驱动的软件实体,它们独立运行,而不是只是等待你不断提示。所以,你走到地下室,做一个好的领导者会为团队做的事情。你给它一个高层次的任务和完成任务所需的工具,然后打开门让它自己运行,不需要微观管理。这些工具可能是互联网访问、资金访问、发送和接收消息、订购披萨等。对于这个提示,工程变得更加重要,因为你的自主工具代理可以做很多好事或坏事,这取决于你如何精心构建任务声明。好的,让我们总结一下。
我希望你们能记住这个视频的关键点。生成性AI是一个非常有用的工具,可以大大帮助你、你的团队和你的公司。你越了解它,它就越有可能成为机会而不是威胁。生成性AI比你想象的更强大。最大的限制不是技术,而是你的想象力。就像我能做什么,你如何做到?提示工程/设计是一个关键技能,就像所有新技能一样,接受你一开始可能会做得不太好,但随着刻意练习,你会随着时间的推移而进步。所以,我最好的建议是尝试。让这成为你日常生活的一部分,学习就会自动发生。希望这个视频对你有帮助,谢谢观看。