当前位置:首页>手游攻略> 谷歌 CEO 最新访谈:AI 要打持久战,量子计算突破令人兴奋

谷歌 CEO 最新访谈:AI 要打持久战,量子计算突破令人兴奋

谷歌 CEO 桑达尔・皮查伊(Sundar Pichai)本周度过了他几年来最美好的一周。因为谷歌取得了一系列大大小小的胜利,从诺贝尔奖颁奖典礼,到突破性的新 AI 模型 Gemini 2 0,再到量

更新时间:2024-12-25 10:52:49

  • 文章详情

谷歌 CEO 桑达尔・皮查伊(Sundar Pichai)本周度过了他几年来最美好的一周。因为谷歌取得了一系列大大小小的胜利,从诺贝尔奖颁奖典礼,到突破性的新 AI 模型 Gemini 2.0,再到量子计算的突破。

美国新锐媒体 Semafor 科技编辑里德・阿尔伯戈蒂(Reed Albergotti)在山景城采访了皮查伊。今年是皮查伊担任谷歌 CEO 的第十个年头,无论是在压力之下,还是被胜利所围绕,他总是能保持平稳。

自 2022 年 11 月 ChatGPT 发布以来,谷歌的发展一直很坎坷,至少从外部来看是这样。传统观点认为,谷歌不知何故错过了 ChatGPT 时刻,感到恐慌。但皮查伊表示,他从未怀疑过公司的长期计划,选择坚持到底,打持久战。

皮查伊还表示,当唐纳德・特朗普(Donald Trump)明年入主白宫时,他将积极参与美国新**的 AI“曼哈顿计划”。

以下为采访内容摘要:

  问:对谷歌而言,这是一个十分疯狂的一周,所有的产品公告,量子计算突破,诺贝尔奖,还有新 AI 模型 Gemini 2.0。这都是你们计划好的吗,还是因为 AI 的疯狂所导致的?

  皮查伊:2015 年,我让公司朝着 AI 优先的方向发展。作为其中的一部分,我们表示,将从*的研究开始,对 AI 进行深入、全栈的研究,建立基础设施。然后为我们开发人员构建模型,并将其放入我们的产品中。这种深度投资贯穿了我们作为一家公司、谷歌和 Alphabet 所做的一切。这是基础,采取深度技术创新方法,全栈方法。然后在当前的生成式 AI 时代,有时你会投资来提前做好事情。对我来说,这就是从头开始建立谷歌 DeepMind,启动 Gemini,并将其构建为原生多模式和长上下文,现在进入 2.0 版本。

所以,要打好基础,调整团队,建立公司。我想你已经看到了所有这些裨益已经开始提供给消费者了。我预计我们的速度会更快,因为总是有固定的成本。我们必须大规模地准备我们的 TPU,以构建我们想要构建的模型,建设我们的数据中心,组建合适的团队。创新管道感觉非常非常强大。其中一些是长期赌注,需要时间来完成。在我看来,量子计算就像 AI 在 2010 年左右的样子。很少有人知道这件事,但你正在有条不紊地处理它。这是一样的。至于 Waymo,我们已经走过了 15 的历史,这是一个激动人心的时刻,所以这可能是所有这些子的结合。诺贝尔奖不是计划好的,但当它发生时我说了这句话:我觉得看着 Demis Hassabis 和 John Jumper(荣获 2024 年诺贝尔化学奖),他们的团队,以及在 AlphaFold 上的工作,我很荣幸从头到尾都能看到诺贝尔奖的作品。所以这是锦上添花。

  问:一两年前,人们的说法是,谷歌被 ChatGPT 打得措手不及。而本周是一个很好的时机,看看你在公司方面取得了多大的进步,以及人们对谷歌的看法。你现在感觉不一样了吗?

  皮查伊:这是一个激动人心的时刻。在内部,我明显感觉到我们正在取得的进步。当你在研究 AI 模型时,你会看到所有这些损失曲线(loss curve),以及模型的能力。有各种基准做证。我们拥有*的人才,可以获得最先进的资源。谷歌 DeepMind 和谷歌研究(Google Research)的结合,是当前生成式 AI 领域引用最多的。我们会对这场革命正在发生的许多突破负责。看到这种势头,我们肯定非常满意。但我们计划做得更多,这才刚刚开始。

 问:你上周在《纽约时报》DealBook 会议上说,AI 进展越来越难,低垂的果实已经摘下来了。这到底是什么意思?被摘下的低垂的水果是什么?那真正困难的是什么?

  皮查伊:为了明确我的答案,我在那里说了。事实上,我对未来的进展感到非常兴奋。我的意思是,我认为在这个领域,你可以投入计算,并取得初步进展。但是,这不仅仅是一个扩大规模的问题,而是实现突破。因此,让我们的模型使用多达 200 万个令牌作为输入长度,这就是长上下文。这是一个突破的例子。使用 Gemini 2.0,我们有一个多模式实时 API,所以现在它可以进行本地图像和音频输出。它支持流式传输,让用户实时看到模型的输出,而不是等到整个响应生成完毕。这些都是突破。当我们进入下一个阶段时,你需要更具洞察力的突破。我认为,这项工作的质量将相当高。我想说的是,我认为这将有助于区分真正的精英团队。不仅仅是我们,还有其他几个团队,这会让 2025 年更令人兴奋。

 问:我明白了,是人们理解错了。外界的理解是,你们的发展已经进入了平稳期,甚至是停滞期。但你的意思是,在谷歌,当事情变得艰难时,反而会大放异彩?

 皮查伊:没错。Waymo 也是一样。许多人都在努力解决这个问题,但后来变得更难了。当它变得更难时,能够克服它,达到下一个水平,这很重要。

 问:人们倾向于将过去两年的发展视为曲线。如果这样看,确实像我们正在达到一个平稳期。如果你缩小视野,看看那条曲线,我想你看到的路上会有一些停滞。你认为它会从这里走向何方?这是同一条轨迹吗?

 皮查伊:我仍然清楚地记得 2010 年左右,我刚刚意识到这个模型几乎无法识别图像,并对此感到兴奋。在过去的十年里,进步是无情的。现在,它无疑将更广泛的公众扩展到了这个领域,所以它是主流。但当我展望 2025 年时,我肯定认为我们现在已经有了足够多的功能模型,我们可以在其上构建许多用例。

这一进展将是非常真实的。有了 Gemini 2.0,我们正在为它更具代理性奠定基础。虽然它仍在研究范围内,但我们将它交给值得信赖的测试人员,比如 Project Mariner,从一开始就在 Chrome 上工作。看到一个模型能够使用浏览器是非常不可思议的,但我们必须突破一些障碍,因为我们在这些领域必须安全、可靠地做到这一点。俗话说,“最后的 20% 需要 80% 的努力。”在这种情况下,最后 10% 可能需要 90% 的努力。但这就是为什么我们要有基准。我们正在取得进展。我们正在把它交给值得信赖的测试人员。这样我们就可以负责任地进行测试,获得反馈,然后将其提供给更多的人,等等。但想想 AI 可以开始影响世界上的所有工作流程。我们实际上可能会看到比我们所看到的更大的进步。两者同时为真。

 问:说到长期策略,从一开始就与 Gemini 进行多模式合作似乎牺牲了一些其他能力(也许是在语言和编码方面),是这样吗?

  皮查伊:当我们推出 Gemini 1.2 时,我们真的希望它从一开始就是多模式的。我认为我们的模型在多模态方面几乎是最先进的,但我们还没有展示出模型的能力。没有本地图像输出或音频输出。在 2.0 版本中,我们正在解锁这些功能,但与此同时,我们在所有编码或推理等方面都变得最先进。在 SWE 基准下,我们的模型现在是最先进的。我们还有其他尚未发布的实验模型,这些模型显示了更多的功能。我们肯定在推动前沿,但我们会负责任地做到这一点,这就是为什么你会看到其中一些处于可信任的测试模式,其中一些仅作为开发人员的实验 API,但我们将努力工作,获得反馈,然后将其提升到一个新的水平。

  问:DeepMind 的人说了这一点,并提出理论,认为多模型方法是通往 AGI 的道路,因为你需要有这个世界模型,也许你需要有一个具体的 AI,才能真正推理和理解。随着你的进步,你发现这是真的吗?你认为这是正确的方法吗?

  皮查伊:作为人类,我们与世界的体验是令人难以置信的多模式的,所以它总是有意义的。这就是为什么我们使用 Google Lens 进行搜索。如果你能把手机指向你正在看的东西并问问题,你就不应该总是打字。Lens 每月为我们带来数十亿次查询,这是我们增长最快的用例之一。我一直很清楚,这就是未来的发展方向。Demis 和他的团队,一直有着强烈的愿景。作为这一切的一部分,我们推出的一件事是,你可以用它来帮助游戏。如果你是一名新玩家,它会关注你在做什么,并与你交谈以提供反馈。我认为这是它的基础。从长远来看,当你看到机器人技术之类的东西时,这将是非常重要的,尤其是对于 Waymo。Waymo 就是看你周围的世界并做出决定。我们正在使用这些原生多模式模型进行的工作将与 Waymo 相交,并随着时间的推移使 Waymo 变得更好。

  问:当你把这些多模式产品交到数十亿人手中,看看 Astra,当它广泛可用时,它真的成为一个很好的训练数据来源吗?这对谷歌来说是一个优势吗?

  皮查伊:在我们所做的一切中,没有什么比真实世界的反馈更好的了。人们在搜索中使用 Google Lens,人们在使用 Astra。我认为良性循环对我们的产品来说变得非常重要。我认为这一切都让我们的产品变得更好。例如,如果你看看 Waymo,我们模拟了很多,然后我们在现实世界中开车。但现在我们在现实世界中,部署在城市中,每周提供 17.5 万次出行服务,约 100 万英里。我认为这是你创造性地改进产品的最佳方式。

 问:明年有 10 座城市,这很快。你认为这会成为真正的收入来源吗?标准是什么?按每英里收费吗?

  皮查伊:我们现在的衡量标准是确保我们正在构建一个通用的 Waymo 驾驶程序。我们可以采取的情况越多,规模就越大,使其在城市环境、高速公路和所有天气条件下都能以很高的标准安全工作。然后在各种场景中交付它(在我们的汽车中,与合作伙伴合作,就像他们与 Uber 或其他参与者的合作一样),让它扩大规模,拥有良好的用户体验是我们在努力解决这个问题时所考虑的。

  问:有一件事我没想到会发生,那就是数据中心的名字,比如 Colossus、Rainier。你在堪萨斯城有一个价值数十亿美元的数据中心。你是打算建立一个这样的大型集群,还是已经建立了?会有名字吗?

  皮查伊:从现在开始,我们应该让 Gemini 接管我们的命名。我们一直在推动数据中心的最新技术,我认为我们有一些世界上最强大的集群。我感到自豪的是,世界上大部分地区都在采用液体冷却。我们在数据中心广泛部署液体冷却已经有一段时间了。我们将成为首批客户之一,不仅是 TPU,还将与英伟达合作,在我们的数据中心获得 GB200。我们已经有一个部分由地热驱动的数据中心。我们的顶级数据中心,其中许多在能源使用方面都是 90% 无碳的。所以我们处于领先地位,我们正在扩大规模。我所看到的一切,我们所制定基准的一切,我认为我们也处于前沿。

 问:但你不会像其他人那样谈论它。亚马逊宣布要部署数十万个他们的 Trainium2 芯片。你在 TPU 上训练了 Gemini 2.0,为什么不出去吹嘘一下呢?

  皮查伊:我记得在 2017 年或 2018 年的谷歌 IO 上,我谈到了建立 AI 优先的数据中心,并展示了我们的 TPU 部件。也许我们已经做了一段时间了。我们为我们所做的事情感到自豪,但我会接受你的建议,并确保我们更多地讨论它。

  问:也许这是商业秘密;也许如果你处于领先地位,你就不必谈论它。你能把这些被认为是世界上最大的集群中的一些进行比较吗?

  皮查伊:需要明确的是,有几家公司在做这件事。重要的是,为了生成用于预培训的尖端模型,你需要这些大型集群,理想情况下是同时定位的。我们在这方面绝对处于领先地位。我认为我们有一些最大的计算集群可供谷歌 DeepMind 和我们的云客户使用。我们将在那里做得更多。

  问:即将上任的特朗普**提出了 AI 的“曼哈顿计划”。你对这将是什么样子以及 Alphabet 将在其中扮演什么角色有什么见解吗?

  皮查伊:现在还为时过早。过渡团队正在那里进行,但总统非常明确地表示,他希望投资于技术领导力和关键技术。在我看来,多年来我们一直这样做,但我们想提供帮助。你看到了我们关于量子计算或 AI 的公告,我们宣布了与合作伙伴一起建造小型模块化核反应堆的团队。其中一些是大型的实体基础设施项目。我认为我们有机会作为一个国家共同努力,实施这些雄心勃勃的大型项目,并回到那个阶段。世界上没有人对看到 SpaceX 助推器以这种方式返回并着陆不感兴趣。我认为设定一个高标准,追求这些大型的实体基础设施项目,并把它做得又好又快。税率的进步是我们非常兴奋的事情,我们很乐意尽我们所能发挥作用。

  问:你和新的 AI 沙皇谈过了吗?

  皮查伊:还没有,但我期待着与 David Sacks 会面。很明显,会有一些人走进来,他们是这些领域的技术专家。我认为这将非常非常有帮助。我们期待着参与其中。

  问:所以还没有具体细节,你不知道那会是什么样子?

  皮查伊:是的。除了早期迹象表明他们肯定有兴趣推动大规模创新。我们期待着这些对话。

  问:你们的量子 AI 团队在纠错方面取得了重大突破。你预料到了吗?你的反应是什么?

  皮查伊:令人兴奋的事情之一是我们的量子团队,与 Hartmut Neven 和团队一起,他们一直有一个非常严格的框架,他们在这一明确的里程碑中定义了进展。每次我们有一个里程碑,我都觉得,这些都是雄心勃勃的项目。这无疑是最积极的惊喜之一。这绝对是一个更深层次的突破,在量子计算机中扩展时解决了纠错问题。这无疑是该领域最严峻的挑战之一。我对此非常满意。但对我们来说,这些都是我们专注于开发实用量子计算机的里程碑,我们可以将其应用于新的新颖应用案例。这就是目标。这与我们的 Waymo 或 AI 旅程相似,都需要时间。但我认为,如果你下定决心,进步是不可避免的。

  问:你说量子就像 2010 年的 AI。这意味着它很快就会开始产生真正的影响。实现大规模量子计算机对 Alphabet 意味着什么?

  皮查伊:对于你之前的问题,经典计算或超级计算机正变得越来越强大。但我认为,对于某些类型的用例,量子最终将发挥强大的作用。它将成为我们武器库中的重要工具。未来,量子和 AI 的交叉对我们来说非常令人兴奋。我们与 GenCast 一起发布了最先进的天气预报模型。但在未来,当我们可以使用量子计算时,你不应该低估我们在更深入、更好的尺度上预测这些事情的能力。这些都具有深远的实际意义。有些事情,比如 AlphaFold 所做的,你还能做些什么来理解自然,模拟自然,所有这些都有实际应用。然后,无论是通过 AI 还是量子,我们都在更深入地了解我们所生活的宇宙的性质和结构。我认为这给了我们最好的机会,因为宇宙从根本上是量子的。因此,取得进展也有更深层次的影响。它不仅会改变世界,而且也有可能为很多其他项目提供支持。我的目标是,在五年的时间框架内,我们正在商业化地应用量子来解决一些用例,然后从那里开始,你可以进一步发展。

  问:你提到明年 AI 搜索将是一件更大的事情。AI Overview(AI 概述)对于我的许多搜索已经变得非常有用。你能更详细地说明一下吗?

  皮查伊:我们对 AI Overviews 搜索的发展感到非常兴奋。我一直在使用 Gemini 2.0 flash 的 AI 概述,我已经看到了它的改进。这是我们将向更多人推广的东西。但我们也会用它做更多的事情。我们的 AI 模型将帮助我们进行搜索,为更复杂、更深入的查询构建体验,在这些查询中,你必须对其进行分解,帮助用户迭代,并获得更深入的答案。2025 年,我们肯定会迅速创新,搜索将做 2024 年无法做到的事情。这就是我为团队设定的目标:2025 年搜索的一类问题比 2024 年明显改善,我认为我们会实现这一目标。这很令人兴奋,因为这意味着你正在推动知识和信息的前沿。我期待着所有这些都能交到用户手中。

  问:AI 安全是很多人提出的另一个问题。Demis 说,也许一年前,随着竞争的升温,最大的风险之一是你开始从安全工作中拿走资源(弱化安全),因为你需要尽可能多的资源来赢得这场比赛。是这样吗,或者你能具体谈谈有多少人在从事安全工作,或者有多少计算资源吗?有办法衡量这一点吗?

  皮查伊:我们一直认为,这是一个推动创新的领域,但帮助你推动进步的是从一开始就纳入安全。我认为,能够长期思考和长期投资的优势之一是,我们正在对这些模型的基础安全性进行尽可能多的投资。这就是为什么,例如,构建它的合成、开源方面,这些都是我们推动安全边界的方式。随着我们使这些模型更具代理性,我们都在投资安全框架。但我认为安全和创新是齐头并进的。正是这一点帮助我们在 Waymo 取得了更大的进步。因为从第一天起,我们就将安全深深地融入了我们的创新和发展实践中,它们是相辅相成的。同样,在 AI 领域,我们有比以前更多的人从事 AI 安全工作,包括访问更多的计算。这是我们始终要坚持的事情。

  问:关于反垄断的一个问题很有趣。当我在 Chrome 上演示 Mariner 时,这就是美国**想要迫使谷歌分拆的地方。如果你看看**的任命,看起来这种情况不会消失。我只想问,没有 Chrome,谷歌会是什么样子?

  皮查伊:这是一个重要的过程,我们将建设性地参与其中。我确实认为法官承认我们一直在创新,我们打造了最好的产品。我认为一些补救措施的范围很广。我们计划提出强有力的理由。你刚刚看到了创新的出现。所有这些都有利于消费者,归根结底,这必须是基础。这就是我们的法律所依据的。只要我们继续坚持这种方法,为我们的用户带来有益的东西,我认为我们最终会做得很好。

  问:你之前谈到了地热。我只是想知道在这方面是否有什么让你兴奋的事情,什么类型的能量会推动这一点?这会带来新的可再生能源创新吗?

  皮查伊:我们对太阳能的潜力知之甚少。有更多的机会扩大太阳能。从物理学和工程学的角度来看,我们有很多选择。核能已经得到证实,有些国家已经证明了这一点,而且它今天仍然有效。我认为有更安全的选择正在不断研究中。地球内部也有如此多的能量。我们只生活在地球表面,地球内部也有大量的能量,我们几乎没有利用。我一直觉得,如果你下定决心,我们应该处理能源过剩的问题。能源应该是一种催化剂,而不是一种约束。阻碍我们前进的只有我们的想象力和结果。

  问:我在看一张地热潜在地点的地图,它很大,覆盖了整个美国西部。你们有一个(用地热为数据中心供电),但它仍然很小,还不是千兆瓦,而是兆瓦。你们必须要深入挖掘吗?

  皮查伊:对能源的需求如此之大,我认为我们能够满足它。但我们需要更多的研发资金。我们需要更适当的许可才能真正开展这些工作。我认为这是新**真正有机会的领域。他们已经表示,他们致力于实现这一目标。这是我们都可以取得很大进步的事情。

tiktok18+破解版

游戏下载/96MB

查看
查看
tiktok18+破解版是一款看短视频的娱乐工具。在这里每个人都可以拍出属于自己的创意影片,跟着音乐的节奏,你可以尽情拍摄多种影片内容,个人才艺、生活纪录、表演、舞蹈等等。感兴趣的玩家快来体验tikt
红桃视频app下载

游戏下载/36.41MB

查看
查看
红桃视频是一款集视频播放、短视频、直播等多功能于一体的移动应用程序。它提供了丰富的影视资源,包括电影、电视剧、动漫和综艺等,支持多种清晰度选择,以适应不同网络环境下的观看体验。此外,红桃视频还具有智能
酷我音乐,最好用的音乐播放器之一。这里有丰富的音乐资源,一键免费试听,还可以把喜欢的音乐分享给好友、微博等。酷,我还内置了收音机功能,可以听各种节目。感兴趣的朋友可以尽快体验!特别说明酷我音乐ios破
ehviewer绿色版

游戏下载/9.99 MB

查看
查看
ehviewer绿色版是一款资源丰富的图片漫画社区软件,是e站的手机客户端。读者可以通过游客的形式访问漫画、美图、COS图片等内容,在实现注册之后还能进入里站,观看更多有趣作品。用户可轻松浏览和下载各
应用介绍 御书屋自由阅读小说全文免费版是一款很受欢迎的在线小说文章阅读app,这里的各类小说资源非常丰富,古装言情、修仙飞升、龙王赘婿、诡异复苏等众多类型应有尽有,其
80sapp是一款超级不错的影视类播放应用,在80sapp中,感受电影艺术的魅力,发现电影的精彩,推荐最热最火港剧以及其他影视剧,还可以将你喜欢的视频下载缓存到手机本地中,随时随地都能在线0流量观看。
热门手游攻略 更多>>
最新手游攻略 更多>>