原文链接:https://mp.weixin.qq.com/s/4Mcs9aXuZthgIV5W2imOag
当你能向别人解释清楚人工智能时,你就真正理解了人工智能。
本文解释了您需要了解的有关人工智能的一切。
什么是AI人工智能
人工智能(AI) 是一个不断发展的概念,指的是机器执行曾经需要人类智能完成的任务的能力。人工智能自20 世纪50 年代以来就已出现,其定义经过数十年的研究和技术进步而不断演变。
如今,人工智能已广泛应用于自动驾驶汽车、笔记本电脑、聊天机器人(例如ChatGPT)和图像生成器等许多领域。那么,它到底是什么?它是如何工作的?
“人工智能”一词源于这样一种想法:如果智能是生物有机体固有的,那么它在其他领域的存在表明它是人工的。计算机科学家艾伦·图灵是最早探索机器是否可以像人类一样使用信息和逻辑做出决策的人之一。他提出了图灵测试,通过比较机器和人类的能力来测试人们能否区分机器的智能是否是人工智能(例如,令人信服的Deepfakes 就是人工智能通过图灵测试的一个例子)。
基本计算系统之所以能够发挥作用,是因为程序员为特定任务对其进行了编码。然而,人工智能依赖于计算机能够存储信息(包括过去的命令),类似于人脑通过存储技能和记忆来学习的方式。这种能力使人工智能系统能够适应新环境并学习新技能来完成未明确编程执行的任务。
一些专家将智力定义为适应、解决问题、计划、即兴发挥和学习新事物的能力。虽然这些系统还不能完全取代人类智能或社会互动,但今天的人工智能系统已经表现出人类智能的一些特征,包括学习、解决问题、模式识别、感知,甚至有限的创造力和社会意识。
当然,人工智能尚未复制的人类智能的一个重要组成部分是情境理解。例如,谷歌的人工智能系统缺乏现实世界的逻辑,无法识别人类的微妙之处,如讽刺和幽默,这一点从它给出的问题中可以明显看出,例如“在披萨酱中添加胶水来制作奶酪棒”或“使用汽油”。这可以从意大利面做辣的建议中看出。虽然这些建议风险较低,但在错误的情况下,缺乏语义理解的人工智能系统可能会产生严重后果。
如何使用人工智能
人工智能具有广泛的潜在应用,已深入渗透到我们的日常生活中。在消费领域,新版本的谷歌搜索、可穿戴设备甚至吸尘器都在展示人工智能的可能性。壁炉架上那些内置Alexa或谷歌语音助手的智能音箱就是人工智能应用的生动例子。
ChatGPT、微软的Copilot 和Claude 等流行的人工智能聊天机器人不仅可以回答问题或执行解释概念、撰写电子邮件或项目大纲等任务,甚至可以创作创意故事。然而,由于人工智能模型无法准确区分事实和虚构,这些聊天机器人有时会产生误导性信息或编造故事。因此,在使用时,尤其是当引文质量不确定时,用独立研究来验证其陈述非常重要。
在消费产品中,人工智能的核心功能是提供个性化服务,无论是定向广告还是基于生物识别的安全系统。例如,当您使用Face ID 解锁手机时,手机可以区分您的脸部和其他人的脸部,因为它会查阅数十亿其他人的脸部数据并匹配特定的数据点来识别您的脸部。特征。
从更大的角度来看,营销和内容团队可以使用人工智能来简化生产流程,而开发人员可以使用它来编写和执行代码。此外,人工智能极大地提高了医学研究的速度和效率。
什么是机器学习
机器学习(ML)是指通过大量数据训练算法以识别模式以辅助预测和决策的过程。这种对模式的自动搜索使系统能够执行未明确编程的任务,这是人工智能(AI) 与计算机科学其他领域之间的核心区别。尽管许多人将人工智能与这种能力联系在一起,但机器学习实际上是人工智能的一个子集。
当数据结构或组织正确时,系统可以更轻松地检测异常情况,例如当信用卡交易来自异常地点时。
机器学习应用的例子有很多,包括搜索引擎、图像和语音识别以及欺诈检测。以面容ID 为例。当用户将照片上传到Facebook 时,社交网络的图像识别技术会分析图像、识别人脸,并提出建议来标记识别出的朋友。随着时间的推移,随着更多图像数据的积累,系统将继续完善这项技能并变得更加准确。
机器学习如何工作
机器学习通常分为两大类:监督学习和无监督学习。
监督学习
这种用于训练人工智能系统的常用技术依赖于带注释的数据或由人类标记和分类的数据。然后,机器学习系统会输入这些数据来学习其中的模式。
假设您想要训练一个机器学习模型来识别和区分圆形和正方形的图像。为此,您需要构建一个包含大量圆形图像(例如行星、轮子等圆形物体的照片)和方形图像(例如桌子、白板等)的数据集。接下来,您将为每个图像添加标签以指示其形状。
然后,该算法将分析这组标记图像,并学习如何区分不同的形状及其特征:例如,圆形没有角,而正方形有四个等长的边。经过训练,系统可以识别新图像中的形状。
无监督学习
相比之下,无监督学习允许算法自行查找未标记数据中的模式,通过识别它们之间的相似性来对它们进行分类。
这些算法没有预先设定具体的数据选择标准;他们只是根据数据之间的相似性对数据进行分组。例如,根据客户的购物行为对客户进行细分,可以开展更加个性化的营销活动。是不是像淘宝给你推荐产品一样?
强化学习
在强化学习中,系统使用输入数据进行训练以最大化奖励,并进行试验和调整直到达到最佳性能。
以训练系统玩视频游戏为例。当分数高时,系统给予正向奖励;当分数低时,会受到负奖励的惩罚。系统通过不断分析游戏并调整其行动策略,仅从收到的奖励中学习和改进。最终,它能够在没有人工干预的情况下独立玩游戏并取得高分。
强化学习不仅在游戏中具有应用,而且在科学研究中也有应用,特别是在教导自主机器人在现实环境中表现最佳方面。例如,机器人学习如何在无法访问数据的情况下导航新环境,例如绕过意想不到的障碍,是更先进的机器学习技术在人工智能中的典型应用。
人工智能类型
人工智能可分为三个小类:狭义人工智能、通用人工智能和超级人工智能。
什么是狭义人工智能?
狭义人工智能(ANI)是指无需明确设计即可构建或训练以执行特定任务或解决特定问题的智能系统。这种类型的人工智能对于Siri、Alexa 和Google Assistant 等语音助手至关重要。
ANI 有时被称为弱人工智能,因为它不具备完整的通用智能能力。但这并没有削弱其实际效果。除了语音助手之外,图像识别系统、响应简单客户服务请求的自动化技术以及在线标记不当内容的工具都是ANI 实际应用的示例。
ChatGPT 也是ANI 的典型应用,它被编程来执行特定任务:根据提供的提示生成文本响应。
什么是通用人工智能?
通用人工智能(AGI) 或强人工智能仍然是一个理论概念,因为它设想机器能够根据积累的经验理解并自主执行各种不同的任务。这种类型的智能更接近人类智能的水平,因为AGI系统能够像人类一样进行推理和思考。
与人类类似,AGI 能够理解任何智力任务,进行抽象思考,从经验中学习,并利用这些知识来解决新问题。我们所说的实际上是一个具有常识的系统或机器,这是任何现有的人工智能技术都还没有实现的。
虽然开发意识系统可能仍然是一个遥远的目标,但它是人工智能研究的最终目标。 OpenAI 暗示即将推出的GPT-5 将使我们离AGI 更近一步。
什么是超级人工智能?
超级人工智能(ASI)是超越人类智能、在所有功能上超越人类的机器智能。这样的制度不仅可能对人类社会产生深远的影响,甚至可能带来毁灭性的后果。虽然这个概念听起来像是科幻小说中的东西,但它确实有科学依据。
能够自我学习和不断自我改进的智能系统仍然是一个理论假设。然而,如果这样的系统能够以道德和负责任的方式应用,则有望在医学和技术等许多领域带来前所未有的进步和成就。
人工智能最新例子
人工智能领域的重大进步包括但不限于GPT 3.5、GPT-4以及逼真的人工智能头像和深度造假技术。然而,该领域的革命性成就还不止于此。
以下是一些最显着的进展:
ChatGPT(和GPT 系列)
ChatGPT 是一个人工智能聊天机器人,可以生成和翻译自然语言并回答问题。在ChatGPT 之前,OpenAI 就已经通过GPT 1、2、3 的发布引发了人工智能领域的巨大变革。GPT,即Generative Pre-training Transformer,2020 年GPT-3 推出时,成为第一大语言当时的模型有1750 亿个参数。随后,GPT-3.5提供了对ChatGPT免费版本的支持。最大的版本GPT-4 拥有一万亿个参数,可以通过ChatGPT、ChatGPT Plus 和Microsoft Copilot 的免费版本进行访问。
自动驾驶汽车
自动驾驶汽车的安全性是潜在用户最关心的问题,但随着人工智能的突破,该技术正在不断进步。这些车辆使用机器学习算法,结合传感器和摄像头的数据来感知周围环境并确定最佳行动方案。特斯拉的电动汽车因其自动驾驶功能而广为人知,但谷歌母公司Alphabet 旗下的Waymo 也在加利福尼亚州旧金山和亚利桑那州凤凰城提供无人驾驶出租车或Uber Eats 优食送餐等自动驾驶服务。 Cruise是另一项机器人出租车服务,奥迪、通用汽车和福特等汽车公司也在积极开发自动驾驶汽车技术。
机器人技术
波士顿动力公司在人工智能和机器人领域的成就尤为突出。虽然我们距离创造终结者级别的人工智能技术还有很长的路要走,但波士顿动力公司的液压人形机器人在使用人工智能导航和应对不同地形的能力方面已经令人印象深刻。
深度思维
DeepMind是谷歌旗下子公司,是人工智能领域的先驱,专注于通用人工智能(AGI)的研究。尽管AGI尚未实现,但DeepMind在2016年因创造了AlphaGo这一击败了世界上最好的围棋选手的AI系统而受到关注。此后,DeepMind 推出了AlphaFold,这是一个能够预测蛋白质复杂3D 形状的系统。该公司还开发了可以像顶级医生一样有效地诊断眼部疾病的程序。
什么是大型语言模型
人工智能的一个重要应用领域体现在大语言模型(LLM)。这些模型采用无监督机器学习技术,通过海量文本数据进行训练,深入理解人类语言的运行机制。为了降低成本,科技公司通常会从互联网上免费抓取这些文本数据,包括文章、书籍、网站和论坛内容等。
在训练过程中,LLM 处理数十亿个单词和短语来学习它们之间的模式和关系,使模型能够根据用户提示生成类似人类的响应。
然而,需要明确的是,这些模型主要是复制常见的语法模式和单词配对,尽管这个过程发生在复杂的层面上,但它们的思维方式与人类非常不同,因为它们不具备理解事实、逻辑或能力的能力。常识。
OpenAI 最近发布的GPT-4 在Chatbot Arena 排行榜上表现出色。该公司的GPT-4 Turbo被认为是目前最先进的LLM之一,最大的LLM GPT-4据说拥有1.78万亿个参数。 ChatGPT可以基于GPT-3.5和GPT-4运行。另外,虽然谷歌开发的LLM——Gemini的参数数量尚未公开,但估计可能高达175万亿个。
什么是神经网络
机器学习的成功在很大程度上依赖于神经网络。这些数学模型的结构和功能受到人脑神经元相互连接和传输信号方式的启发。
想象一下一群机器人一起工作来解决一个复杂的难题。每个机器人都有特定的能力,例如识别拼图中不同的形状或颜色。神经网络就像一群机器人,将它们的能力结合在一起来解决难题。
神经网络有能力调整内部参数来改变输出。在训练过程中,神经网络会接触大量数据,并学习如何在给定特定输入的情况下产生预期输出。
这些网络由多个互连的算法层组成,这些算法层在层之间传递数据。通过调整数据在各层之间传递时的权重,我们可以训练神经网络来执行特定任务。在训练过程中,这些权重不断更新,直到神经网络的输出与期望结果紧密匹配。
一旦神经网络达到这种状态,它就“学会”了如何执行特定任务。这些任务的范围从识别图像中的水果类型到根据传感器数据预测电梯何时发生故障。
什么是深度学习
深度学习作为机器学习的一个重要分支,专注于训练三层或多层的人工神经网络来执行不同的任务。这些神经网络被扩展成深而巨大的网络结构,并用大量数据进行精心训练。
深度学习模型通常包含至少三层,有时多达数百层。在训练过程中,可以灵活采用监督学习、无监督学习或两者的结合。
深度学习技术因其卓越的能力,被广泛应用于自然语言处理(NLP)、语音识别、图像识别等领域,以捕获数据中的复杂模式,从而推动人工智能的进一步发展。
对话式人工智能
对话式人工智能是指经过编程可与用户进行自然对话的系统。该系统经过训练可以监听用户输入(对话内容)并做出相应响应(输出)。这种智能对话的实现主要依靠自然语言处理(NLP)技术来保证系统能够自然地理解并响应用户的语言。
对话式人工智能的例子很普遍,包括Gemini 等聊天机器人、配备Amazon Alexa 等语音助手的智能扬声器以及Siri 等iPhone 虚拟助手。
有哪些 AI 服务可用
消费者和企业都可以利用丰富的人工智能服务,不仅加快任务处理速度,还为日常生活和工作带来便利。 —— 您家中可能已经有一些人工智能设备。
以下是向公众提供的人工智能的一些常见示例,包括免费和付费服务:
语音助手:
例如,Echo 设备上的Amazon Alexa、iPhone 上的Apple Siri 和Pixel 设备上的Google Assistant 使用自然语言处理技术来理解和响应您的问题或指令。
聊天机器人:
ChatGPT、Copilot 和Perplexity 等人工智能聊天机器人作为虚拟助手,可以与人互动,进行类似人类的对话,甚至在某些情况下表现出同理心和关心。
语言翻译:
Google Translate、Microsoft Translator、Amazon Translate 和ChatGPT 等服务利用机器学习技术为用户提供文本翻译服务。
生产力工具:
Microsoft Copilot for Microsoft 365 就是一个显着的例子,其中LLM 作为AI 生产力工具嵌入到Word、PowerPoint、Outlook、Excel、Teams 等应用程序中,并可以自动执行任务。例如,只需输入“请通过电子邮件向团队更新项目状态”,Copilot 将自动收集相关信息并生成符合您需求的电子邮件文本。
图像和视频识别:
不同的程序使用人工智能来识别图像和视频中的内容,例如面部、文本和物体。 Clarifai使用机器学习技术来组织非结构化数据,而亚马逊的Rekognition AWS服务允许用户上传图像以获取相关信息。
软件开发:
ChatGPT 等人工智能工具一年多来一直在帮助开发人员编写和调试代码。此外,OpenAI Codex 的AI 配对程序员GitHub Copilot 也是一个例子,它通过自动即时完成注释和代码,帮助程序员更快、更轻松地编写代码。
企业人工智能工具:
OpenAI 和Amazon 等许多公司正在致力于为企业创建AI 工具,例如OpenAI 的GPT-4 API 和Amazon Bedrock(一套面向开发人员的基于云的AI 工具)。
谁在引领人工智能
随着生成式人工智能的兴起,许多公司在该领域展开激烈竞争,其中既有老牌科技巨头,也有新兴初创企业。虽然个别公司发展迅速,很难建立固定的行业领导者,但以下是一些主要参与者。
开放人工智能:
OpenAI 将其强大的生成式AI 工具(例如ChatGPT 和AI 图像生成器Dall-E 3)免费提供后,对AI 领域产生了巨大影响。
人择:
Anthropic 构建了Claude,这是一个强大的人工智能系统,被认为是OpenAI 的主要竞争对手。该公司专注于人工智能研究中的安全和道德问题。
Alphabet(谷歌的母公司):
Alphabet通过旗下DeepMind、Waymo和谷歌等公司涉足不同领域的人工智能系统。尽管谷歌在AI聊天机器人领域起步艰难,但其工具Google Bard经历了两次技术迭代(从LaMDA到PaLM 2,再到Gemini),目前的性能已经有了很大的提升。与此同时,DeepMind继续追求AGI(通用人工智能),开发Document AI的机器学习模型,优化YouTube观看体验,并推出AlphaFold等创新产品。虽然Alphabet 在人工智能方面的努力可能不会经常成为头条新闻,但其在深度学习和人工智能方面的进步无疑将对人类的未来产生深远的影响。
微软:
除了推出Microsoft Copilot 之外,微软还在Azure 上为开发者提供了一系列AI 工具,包括机器学习、数据分析、对话式AI 平台以及计算机视觉、语音和语言的定制API。此外,微软还对OpenAI进行了巨额投资,并在Copilot(以前称为Bing chat)和Dall-E 3的高级版本中使用了GPT-4技术,以支持Microsoft Designer的图像生成功能。
苹果:
苹果近期也加入了这场竞争,推出了AI升级的iPad系列,预计将在WWDC上发布更多新产品。
其他公司:
在人工智能领域取得重大进展的企业还包括百度、阿里巴巴、Cruise、联想、特斯拉等。
人工智能改变世界
人工智能应用的速度和规模将深刻影响我们的工作、购物和消费媒体的方式,以及隐私、健康等方面。与历史上的许多变革一样,人工智能的好处、挑战和潜在风险也是复杂的。
技术的不断进步正在重塑工作的性质。人工智能正在通过自动化某些任务、创造新职位、同时淘汰一些传统角色来改变各行业的日常工作流程。例如,在创意领域,生成式人工智能显着降低了营销和视频内容制作的成本、时间和劳动力需求。
人工智能在医疗保健系统和医学研究中发挥着越来越重要的作用。它有助于提高护理的可扩展性和可及性,使医生和放射科医生能够用更少的资源诊断癌症,发现与疾病相关的基因序列,并识别产生更有效药物的分子,有可能挽救无数生命。
然而,这项技术也带来了新的挑战,即如何保护我们的数据,甚至我们的思想的隐私。人工智能使面部识别和监控变得司空见惯,促使许多专家呼吁彻底禁止此类技术。在加剧隐私和安全问题的同时,人工智能也正在推动网络安全软件的重大进步。
随着模型(及其背后的公司)的力量不断增强,用户要求模型的创建方式及其成本更加透明。该公司从互联网上抓取图像和文本来训练模型的做法引发了一场关于创意材料许可的持续法律辩论。
神经网络能够在未经许可的情况下真实地复制某人的声音或肖像,这使得深度造假和错误信息成为当前的焦点,尤其是在即将到来的选举之际。
随着人工智能使大规模自动化变得轻而易举,研究人员和技术人员对其在武器制造和战争中的潜在应用表示担忧。
人会失业吗
人工智能系统在不久的将来取代大量现代劳动力的可能性是可信的。
虽然人工智能不会完全取代所有工作,但可以肯定的是,它将深刻改变工作的性质。关键在于自动化将如何快速、显着地重塑工作场所。
然而
,人工智能无法独立运作。虽然许多涉及常规、重复性数据的工作可能会实现自动化,但其他领域的工作者可以利用生成式人工智能等工具来提高生产力和效率。
关于人工智能系统将以多快的速度超越人类的能力,专家们的看法存在广泛差异。
版权声明:本文转载于网络,版权归作者所有,如果侵权,请联系本站编辑删除