百度AI背后,藏着一群女性科学家

时间:2024-09-26 阅读:5 评论:0 作者:admin

编辑 | 查瑾

运营 | 萤火虫

刀刃

吴华其实比“科技大亨”的形象要轻松一些。

她是百度技术委员会主席,也是百度人工智能背后的科学家。她讲话轻快,每句话结尾都带有上扬的语调,非常有感染力。这份对人工智能的热情能通过她的声音迅速传达给观众。

1月10日,在年度Create百度AI开发者大会上,吴华向观众展示了百度人工智能最有创造力的一面,这也是AIGC(利用AI技术自动生成内容的生产方式)的成果:她和她的团队在百度打造了一套“创意”体系。

▲吴华在Create大会上发表演讲。图/受访者提供

这是百度的文心模式,更是一群拥有非凡能力的天才创作者——有“天才编剧”文心ERNIE 3.0 Zeus、“艺术家和插画家”文心ERNIE-ViLG 2.0,还有“剪辑师和动画师”的视频内容生成和剪辑技术。在这个系统中,创作者只需要输入一个话题,它就能瞬间结合上下文,写出几百篇不同流派、不同风格的作品,甚至可以完成一个剧本,拍一部电影。

它还能根据一句话、一个描述,生成写实、意境、国风、二维等不同风格的精美绘画,还能生成现实世界中不存在的创意形象,比如穿上西装的孙悟空、街头吃烤串的熊猫……让人们天马行空的想象得以精准的形象化。

“如果掌握了这种内容创作能力,你几乎可以完成一部电影的很多重要任务,成为一个‘天才创作者’。再加上自己设计的虚拟演员,你就可以成为一个真正‘独立’的制片人,成为真正‘独立导演’。”但在这个技术的背后,人工智能的每一次创作,都需要像吴华这样的百度科学家和她带领的团队,一点一点地设计算法、实现算法,模仿人类的创作。

吴华是人工智能领域最早的探索者之一,1998年她第一次接触计算机科学,当时她报考中科院自动化研究所博士学位,因为她觉得自己抽象思维能力好,而且计算机行业正蓬勃发展,于是做出了这个决定。

那也是一个里程碑式的时代,千禧年即将来临,人工智能蓬勃发展。就在吴华报考的前一年,IBM 研发的国际象棋计算机“深蓝”战胜了卫冕世界冠军,成为首个在国际象棋比赛中获胜的系统。那时的吴华对人工智能还不太了解。作为中科院选拔考试第一名,她的命运似乎充满了意外。后来的博士生导师邀请她:“成绩这么好,来学模式识别吧。”

从今天的角度来看,中国科学院自动化研究所模式识别实验室是中国人工智能实验室,吴华在这里研究自然语言处理,以及语音识别、计算机视觉和机器人技术,为那个开创性的时代人工智能算法奠定了坚实的基础。

如今,算法、算力、数据已经成为人工智能的三大支柱,吴华一直站在这个学科的最前线。在她和同事们的研究下,人工智能在中国不断开拓、攀升、崛起、迅速爆发,并最终成为互联网公司前进的利刃。但在最初,吴华面临的困难是常人难以想象的。

在人工智能领域,机器翻译是最典型的应用。起初,机器无法理解语义和上下文,翻译出来的结果令人啼笑皆非。比如,当你在翻译器中输入“你多大了”,它经常被翻译成“你怎么了?”如果你输入“掉进水里小心”,你可能会得到“掉进水里小心”这样的搞笑结果。

事实上,在一些景区还是能看到这样的翻译结果。要解决这个问题,就需要让机器更“智能”,能够自动识别不同的语义和场景,提高准确率。作为国内最早涉足深度学习和自然语言处理的研究者之一,吴华在2010年2月就承担了百度翻译的创建任务。

当时吴华的团队就几个人,工作量很大,加班是常态。但大家都像打了鸡血一样,产品顺利上线。但给吴华留下最深印象的不是工作的艰辛,而是另一个巨大的难题。

2014年,新兴的神经网络翻译(深度学习技术)能够克服统计机器翻译将句子分成不同片段进行翻译的不足,充分利用上下文信息进行编码和解码,从而产生更流畅的译文。但当时学术界尚未充分证明其相对于统计机器翻译的优越性。

吴华看到了深度学习的潜力,决定将神经网络翻译融入到产品中,验证其可行性。这在当时看来是一个非常大胆的决定。除了效果没有得到验证之外,还有一个问题:新的深度学习技术对算力的消耗太大。吴华每天都要面对来自自己的疑问:“这个模型怎么做出来的?这么巨大的算力问题你如何解决?即使模型做出来,应用到手机等设备上,你如何把这个模型做得更小?”这些都是她要翻越的大山。

最终,吴华和团队逐一破解了代码,并同时在云端和手机上部署,“这在当时是里程碑式的进步。”2015年5月,百度率先发布在线神经网络机器翻译系统。一年多后,2016年9月,谷歌发布了具备深度学习能力的翻译器。

百度翻译曾获多项大奖,包括国家科技进步二等奖、北京市科技进步一等奖等,《纽约时报》等媒体也称赞这项工作“具有开创性”。

▲百度创造大会在百度席让元宇宙呈现。图片/受访者提供

神经网络机器翻译成功之后,其背后的技术原理在人工智能领域得到了广泛的应用。吴华及其团队开创的技术绝不会只用在某一个应用上。对于百度来说,翻译亦是如此,这只是布局人工智能的一步。

吴华具有良好的技术敏锐度,带领团队在大模型、语义理解、对话、问答等技术上取得多项世界领先的成果,服务于百度几乎所有产品线。

如果把AI比作房子,吴华和百度的工作就是不断地、持续地打地基,地基打得越深越扎实,房子才能建得越高越漂亮。深度学习和自然语言处理技术,随着进一步的完善,将进入大模型的深水区。她要带领百度的AI走向语义理解和创造齐头并进的新阶段。在这个阶段,在她看来,“预测技术和应用的趋势”尤为重要。“都是面向用户的应用,需要解决不同用户的需求,但技术的底层逻辑是一样的。”吴华说。

吴华享受着把不可能变成可能的快乐时光,享受着团队对技术的向心力。在这里,大家对技术的迷恋是纯粹的。吴华珍惜技术带给自己的丰富充实的人生体验,也意识到自己入行25年以来,整个行业跑得越来越快。“在百度翻译推出神经网络翻译方法之前,行业已经很多年没有出现过重大的技术改进。”但现在,后来者越来越多,大家都在拼命奔跑。“领先半年,难度是巨大的。”

百度生活服务信息_百度服务信息生活app_百度生活服务app下载

没有更好的办法。“无非是找到正确的方向,拼命往前跑。做梦也要想想方法,醒来也许灵感就会来。”她最关心的永远是“自己是否站在了技术的前沿”、“技术是否真正服务于用户和客户”。

每天早上七点,吴华都会准时踏入百度科技园,在空荡荡的办公室里,她会独自花三个小时思考技术难题。临近十点,同事们的工位才渐渐坐满,她和同事们带着自己的想法,展开一轮又一轮的技术讨论,一步步拓展人工智能的边界。

灯塔

2022年AIGC的迅速火爆,进一步点燃了大众对于人工智能的热情。除了人工智能的进步,量子计算等前沿技术也越来越被大众所熟悉。本次Create大会,百度再次展现了在量子领域的布局,以及推动中国量子产业化的信心。

在北京东南角,亦庄百度量子实验室里,一台百度量子计算机“千石”昼夜嗡嗡作响。进入这间实验室前,必须穿上防尘服和鞋套,戴上降噪耳机。人们需要耳机才能更清晰地交流。百度量子计算研究院年轻的高级研究员陈程博士在这里工作了一年半。某种程度上,这些噪音成了让她安心的“陪伴”。

这声音是制冷设备发出的。白色的圆柱管被包裹了好几层,为底部的小芯片提供零下273.14摄氏度的极低温度,这是超导量子芯片最喜欢的温度。“这颗小芯片就是量子计算机的心脏。”陈诚说,“温度越低,计算速度越快。这里是宇宙中最冷的地方,超导效应就是在这里产生的。”

▲陈诚在介绍超导量子计算机“千石”。图/受访者提供

量子计算机的计算速度快得惊人。如果要分解一个300位的数字,即使是世界顶级的传统计算机也要花上十万年以上才能计算出来。但在这里,只需要1秒钟就能搞定——这就是量子计算机的威力。

百度为打造这样一台量子计算机,投入了巨额的资金和精力,团队由从全球顶尖高校和科研院所招募的精英组成。陈诚是北京大学物理学博士,在北大读博士期间,她专注于超导实验研究。在实验室里,陈诚通过显微镜观察微观尺度上原子的排列及其相互连接,不禁惊叹大自然的神奇与神秘。同时,她也对超导材料的实际应用产生了好奇,想知道量子技术会给我们的生活带来哪些改变和影响。

她想将自己的研究成果在产业中落地,但还有些早。量子的产业化还有一定的困难和挑战,需要脚踏实地、一步一个脚印地前行。但陈澄心里明白,它就像一座灯塔,一定是未来发展的方向。

在此之前,传统计算已经占据了70多年的主导地位,人们开始迎来数字化时代的爆发。大家在互联网上交换信息、完成交易、积累数据,维持信息时代衣食住行的运转。偶尔的“宕机”开始成为时代的征兆,传统计算机不堪重负。陈诚觉得,或许量子计算即将迎来发展的一个关键转折点。

我们现在使用的手机、电脑、平板等底层芯片,都是由半导体晶体管组成的电路。按逻辑,这种由半导体晶体管组成的电路会逐渐接近它的极限。如果没有新的技术替代,到2040年,电脑的能耗可能就会超过发电总量——这太可怕了。

但量子计算不同,它是一种全新的计算范式,带来的不是计算能力的倍数提升,而是指数级的提升,可以加速经典应用场景,极大丰富量子产业化的应用场景,比如将为人工智能、金融科技、新能源、医药化工等诸多重要领域带来革命性推动力。

陈诚想将自己的前瞻性研究落地到这个产业上,但量子研究的产业化平台并不多。当得知百度要建量子实验室时,这与陈诚想进一步了解超导量子计算产业的初衷不谋而合。而这几乎代表着对最先进算力的探索。

量子实验室建设期间,陈诚每天奔波于海淀、亦庄之间,亲眼见证百度超导量子计算机“千石”硬件平台的建设。起初只是概念,之后是层层“金钟罩”加固,直到今年8月,大白罩也盖上。陈诚永远不会忘记实验室启用的那一天。她和团队的努力,正在一步步实现。

2022年8月25日,搭载量子芯片、连接软件和应用的“千石”正式发布。同时发布的还有全球首个全平台量子软硬件一体化解决方案“量子熙”,可为企业提供一站式产业量子升级服务。陈诚介绍,“量子易服”App可以在任何地方便捷使用,连接远在亦庄的百度量子计算机。每一位量子爱好者都可以在手机上接入“量子作曲家”模块,选择在量子模拟器或真实的量子计算机上“运行”自己的量子电路,亲身体验量子计算的魅力,成为世界上速度最快的“人”之一。

与以往的量子计算机不同的是,千石是一台“应用、软件、硬件”一体化、高度集成的工业级超导量子计算机,这意味着千石不再是一台“裸机”,而是可以“开箱即用”。

“千石”的出现,让量子计算走出实验室,走进产业化,变得触手可及,也标志着我国在量子计算产业化方面进入了世界第一梯队。

在这样的实验室里,陈诚正在将自己的想法变成现实。她从小就是一个动手能力很强的孩子,脑子里总是有各种稀奇古怪的问题,她想要探索物质世界的本质。虽然在传统观念里,走这条路的女性很少,但她觉得“只要按照自己的兴趣爱好,选择自己喜欢或者擅长的领域,无论性别,都能实现自身的价值。女性同样可以通过自己的知识和技术,用细腻敏锐的视角,在前沿科学领域乃至社会各个领域贡献自己的力量。”

量子计算不再遥不可及。如果把陈诚和百度量子的工作比作一盏率先点亮的灯,它将吸引千万个志同道合的伙伴,共同为中国量子计算产业化和量子计算生态圈努力,努力实现“人人都能用上量子计算”的美好愿景。

▲图/视觉中国

微观世界

对技术的信仰与追求也从百度延伸到了更广阔的领域。百度长期以来重视技术人才的发现与培养,并通过设立奖学金加速国内人工智能人才体系的建设。在2022年度百度奖学金的评选中,来自清华大学、上海交通大学、中国科学技术大学、麻省理工学院等国内外顶尖高校的10名学生脱颖而​​出,他们的研究领域涵盖了智慧医疗、自然语言处理、计算机视觉等诸多领域。而今年百度奖学金的获得者洪亦宁,也是人工智能领域的一位女性新军。

百度生活服务app下载_百度服务信息生活app_百度生活服务信息

技术路上的好奇与探索,往往源自一个浪漫的想法。小时候,洪伊宁有五十多个芭比娃娃,每个娃娃长相不同,衣服也各式各样。她喜欢给它们换衣服,穿上、脱下、再穿上——娃娃是她童年最好的玩伴。

那时,洪逸宁总是幻想着,在平行宇宙中,这些芭比娃娃会有自己的性格、爱好、喜欢的食物,还能和她说话、一起玩耍,但现在,它们还不够聪明,读不懂她的想法,听不懂她弹钢琴,暂时没法和她交流。

长大后,她发现自己跟人说话时会突然走神,开始“翻译”脑海中那些天马行空的幻想。她突然有了一个想法,在脑海里创造这个“小宇宙”,创造一个AI形象,陪伴她日夜。她想着,随着时间流逝,习惯了她,它会越来越理解她,成为她最好的玩伴。

这个想象太大胆了。她曾在两部美剧里看到过女黑客,轻轻点击手指就能进入另一个世界,“好酷啊!”高考报名表上,她填的是上海交通大学工程实验班。本科毕业后,她前往加州大学洛杉矶分校攻读计算机硕士学位,一年后成功转入博士学位。

她每天都在电脑前度过,一遍又一遍地想象着她那个3D的物理世界。在那个世界里,她创造的AI“小人”看到画中的海浪就能想象出大海,看到一盘食物就能想象出味道。所有这些都是通过打开AI角色的五感和大脑,用眼睛看、用鼻子闻、用大脑推理判断,从而做出最合乎逻辑的反应来完成的。

在计算机领域,这也是二维图像超越模式识别,能在三维空间进行常识推理和反应的重要命题。在这个领域,IBM美国研究院首席科学家甘闯、计算机视觉专家朱松春教授、吴英年等都在孜孜不倦地探索,一寸一寸地前行,他们也是洪以宁的引路人。

但这条路的起点并不顺利。真正学了计算机专业后,洪亦宁发现,自己很难对那些复杂的编程不感兴趣。那些难懂的代码,并不像美剧里的黑客那么容易上手。“我怎么努力也学不会,就死记硬背,但根本没用。”整天泡在琴房弹钢琴成了洪亦宁的日常,一到半夜就弹。直到大二,她才闯进智能物联网专家王新兵教授的实验室,参与数据可视化的工作。洪亦宁突然发现,“计算机也可以这么美好。”

这项工作是找到某一领域内许多作者的论文,找出不同论文之间的联系,然后将这些论文以地图的形式可视化。当他第一次修改代码并运行它时,洪一宁惊呼道:“我画的地图就像是星空,有很多星星,那些教授和作者散布在其中。我越建代码,地图就越漂亮。”

之后的日子里,她变得更加积极主动,负责运营学院的一个学术公众号,通过这个公众号把某一领域最前沿的学术资讯传递给读者。每一篇文章,她都要读上千篇论文,“至少要读两三周,太烦人了。”这个古灵精怪的女孩对实验室的同事说,“如果能用AI帮我们读这些论文就好了。”

就这样,几个朋友花了半年时间开发出了一个自动阅读论文的模型。这个模型可以快速阅读论文,获取论文中用到的要点和主要研究方法。后来,她只花了一天时间写了一篇公众号文章,这个模型在同学中流传,成为大家快速阅读论文的“工具”。那是她第一次觉得自己的创作能给身边的人带来如此实用的便利。

洪亦宁发表了一篇关于这一模式研究方法的论文,不久之后,她就收到了夏威夷学术会议的邀请。在夏威夷,有人来看她的论文展板,和她交流学术思想,这让她很开心。最重要的是,会上滔滔不绝的教授们“都在做我看不懂的工作”。在洪亦宁眼里,“他们闪闪发光”。“我想,他们也是从本科生一步步成长到今天这个样子,我也要像他们那样成长。”临近毕业,洪亦宁决定:“我要出国读博士,我要去看看。”

▲洪一宁在2022国际人工智能峰会NeurIPS上介绍其论文。图/受访者提供

在UCLA,洪亦宁距离打造理想中的AI“小人”越来越近。她进一步分解这个“小人”的小宇宙,就像一个婴儿,每天感知图案、语言、声音,慢慢长大,认识3D世界,与人交流合作,观察体验不同物体的用途,慢慢积累知识、常识和记忆,积累成一个不同于别人的内部模型。等它再长大一点,就会开始学习用这些内部模型进行推理。

目前,人工智能技术发展迅速,已经能够识别物体并进行描述,但尚未完全形成常识和记忆,很难解释所见,难以与三维现实世界互动,更难以进行推理。洪亦宁希望人工智能也能拥有这些功能,这样它才能尽情地探索世界。

但在实施上,洪逸宁常常感到“痛苦”。她看到一本心理学书的封面上画着一个水桶,就想:“如果这个水桶没办法倒水怎么办?”于是,可以设计一个AI修理工,进入房间进行修理。当AI修理工进屋拿起水桶时,要主动选择手的位置,用多大的力气把水桶提起,水流会让水桶的轴线旋转多少角度,修理工如何控制,甚至水桶倾斜到什么角度才会洒出来……这些都是洪逸宁要考虑的问题。这涉及到物理、数学,甚至心理学。每一层技能的叠加,难度都上升一个台阶,她要一遍又一遍地改参数,模拟试错。最难受的时候,她一夜没睡,“感觉整个世界都塌了”。

她甚至会在凌晨两点的时候在知乎上搜索“什么样的人适合读博士”,搜索到最后她会想“不继续读下去会后悔”,于是又会回去继续读下去。这种焦虑每年都会出现两三次。

直到最近,这项研究终于有了新的进展。这个AI修理工不仅能提水桶,还能推断物体的距离和大小。这一学术成果近日发表在《CVPR2022》上。在现实生活中,这项技术可以应用在很多场景中,比如作为人类的AI助手,陪伴并帮助他们做出判断,或者为盲人提供AI指引,帮助他们规划和识别最佳路径,并带他们去那里。“心里那块大石头终于落地了”,随着石头落地,洪一宁梦想中的AI“小人”也成型了。

吴华、陈程、洪一宁三人处在不同的人生和科研阶段,但她们都对技术有着同样的执着和信仰,得到了百度最广泛的支持。她们的事业与百度对技术的探索深深交织在一起,百度对技术的探索精神也通过她们不断传播,成为一种信仰和方向。在百度浩瀚的技术海洋中,这些女性独有的细腻、敏感的力量,也将拓展科技的边界。

如今,在茫茫的技术探索之海,“她的力量”熠熠生辉。而这束光芒,也照耀着每一位穿梭在百度办公园区的女性。

在今年的百度创造大会上,吴华、陈程等技术大咖也分享了百度在人工智能、量子计算等领域的进展和思考。这是一场技术的盛宴,更是有志之人的聚会。而未来也将有更多技术信仰者加入百度,共同探索浩瀚的技术海洋。

▲百度创造大会。图片/受访者提供

每个人互动

你知道百度AI背后的故事吗?

本文由《人物》原创

侵权必究

本文链接: http://01280.cn/2024/09/3795/ 转载请注明出处!