真·硬核! Build 2020: 自研超算挑战全球 Top5Windows 应用全面统一史上最大语言模型将开源

发布时间:2024-09-23 来源:知识园地

  更重要的是,作为本次大会最为重磅的环节,本次 Build 大会的 Keynote 开场,充分展示了这家巨头对未来科技发展的新趋势的洞察和判断,并且也能够让人更加清晰地看到微软在 Azure 云计算、Windows 生态、超级计算、AI 等领域的未来发展思路。

  北京时间 5 月 19 日晚间 11 点,本次 Build 大会正式开始。

  在二十分钟的暖场环节之后,大会首先迎来的是微软 CEO Satya Nadella 的演讲。

  他首先谈到了世界各地的开发者如何在新冠肺炎疫情中通过开发工作助力人们的生活,并再次强调了微软的整体战略。

  最后,Satya Nadella 还通过两个互动性案例展示了在新冠肺炎疫情下人们远程合作处理问题、甚至是远程合奏音乐的可能性。

  随后环节中,微软开始了 Build 大会最为核心的产品更新发布过程,详细的细节内容介绍如下。

  2019 年 7 月 22 日,微软宣布与 OpenAI 合作构建新的 Azure AI 超级计算技术。如今,这一合作迎来了新的里程碑——AI 超级计算机。

  在 Build 2020 大会上,微软宣布了堪比世界 Top 5 的 AI 超级计算机,它用于训练超大型人工智能模型。微软官方表示,该计算机是与 OpenAI 联合构建的,专为训练 OpenAI 的 AI 模型而设计。这将使下一代超大型 AI 模型和训练这一模型所需的架构成为可供其他机构和研发人员开发的平台——当然,这只是第一步。

  这个超级计算机是单个系统,它拥有超过 285000 个 CPU 内核、10000 个 GPU 和 400Gbps 的网络连接。微软表示,与世界 TOP500 超级计算机相比,它居于 Top 5 之列。

  在 Azure 中,这个超级计算机还受益于现代云架构的所有功能,包括快速部署、可持续的数据中心和对 Azure 服务的访问。

  随着我们慢慢的变多地了解到我们所需和组成超级计算机所有组件的不同限制,我们得知,一旦有人能设计出梦想中的系统,微软就能把它构造出来。OpenAI 的目标不仅在于追求研究上的突破,也在于设计和开发其他人能够正常的使用的强大 AI 技术。与微软合作开发的超级计算机旨在加速这一周期。我们正真看到,更大型的系统是训练更强大模型的重要组成部分。

  微软还发布了一个新版本 DeepSpeed,即一个 PyTorch 的开源深度学习库,它减少了大型分布式模型训练所需的计算能力。 与三个月前发布的版本相比,此次的效率要高得多,现在人类能在同样的架构上训练比此前大 15 倍以上、快 10 倍以上的模型。

  此外,微软宣布已经增加了对 ONNX Runtime 分布式培训的支持。ONNX Runtime 是一个开源库,旨在使模型在硬件和操作系统之间移植。

  2020 年 3 月,Windows 10 实现了一个重要的里程碑:其活跃用户超过 10 亿。根据微软官方数据,人们每月花在 Windows 10 上的时间超过 4 万亿分钟,用于工作、学习和连接——同比增长 75%。

  此前,微软一直在 Windows 平台上推动 Win32 程序 API 和 UWP API 的融合,但二者之间一直存在障碍。而Project Reunion将统一对现有 Win32 和 UWP 的访问,并通过 NuGet 等工具使它们在与脱离操作系统的情况下可用。

  也就是说,这将为新应用程序提供一个通用平台。另外,它将帮助 Windows 开发者更新现有的应用程序并使之具有最新的功能,无论它们是 C++、包括 WPF、Windows 和 UWP)或 React Native( Facebook 于 2015 年 4 月开源的跨平台移动应用开发框架)。

  不仅如此,在分离现有的 API 并添加新的 API 时,微软也在根据自身的需求进行 Polyfill(一个解决兼容问题的开发方案) 操作,因此 API 在支持的 Windows 版本中实现向下兼容。

  WinUI 3 Preview 1 是用于 Windows 的现代化本地 UI 框架。WinUI 应用程序能拥有适应和缩放设备的现代 UI,不管是否新建项目,或逐步升级现有的应用程序(包括 C++、WPF 和 Windows),都将能拥有这个 UI。

  值得一提的是,微软还正式面向企业用户发布了 Windows Terminal 1.0。

  Edge 浏览器的更新是微软 Build 大会的常备节目,今年也不例外。在本次 Build 2020 大会上,Edge 浏览器的更新不仅面向开发者和普通用户群体,也选择从公司客户群体的角度切入。

  数据保护增强,通过“自动切换配置文件”功能,Edge 浏览器对个人和公司数据来进行分离,工作账户需要凭证登陆,不会与个人账户混淆。

  Bing 搜索将全面变化,当用户使用工作凭证登录到 Bing 时,图片、购物和新闻等内容将出现在其他熟悉的页面旁边。

  总体来看,今年 Edge 浏览器面向普通用户的更新不多,这也是因它本身在功能上已经很成熟;但在面向开发者和企业用户方面,Edge 浏览器依然大有可为。

  2019 年 11 月,微软发布了 Azure Synapse Analytics,建立起企业数据仓库和大数据分析。不过,操作数据与分析系统并无分开,这使得在事务性与分析性的处理需求不够明晰。由此,在 Build 2020上,微软发布了一个新工具Azure Synapse Link 的公开预览。

  这是 HTAP (Hybrid Transaction and Analytical Process,混合事务和分析处理,一种新型的应用程序框架,以打破 OLTP 和 OLAP 之间的隔阂,既能应用于事务型数据库场景,亦能应用于分析型数据库场景)的一个基于云端的实现。

  Azure Synapse Link 能够消除 Azure 操作数据库服务和 Azure Synapse Analytics 之间的障碍,通过一次单击,用户就能够从存储在其操作数据库中的实时交易数据中获得见解,而无需管理数据移动或对其操作系统造成负担。

  Azure Synapse Link 的基础是微软的云体系结构。客户只需单击他们最喜欢的 Azure 数据库服务中的一个按钮,就能够正常的使用 Azure Synapse Analytics 建立到数据的直接链接。然后,操作数据自动且连续地以优化的柱状结构提供给 Azure Synapse Analytics,类似于覆盖索引。

  Microsoft Teams 发布于2016 年 11 月,它是微软推出的 Office 系列应用 ,是一款基于聊天的智能团队协作工具,集会议、电话、聊天和文档共享、协作于一体。伴随着今年疫情导致的远程办公趋势,Microsoft Teams 也火了起来。

  在本次 Build 大会上,MicrosoftTeams 在生产力和自动化方面都有了新的升级。不仅如此,在会议、通知、远程调度方面,通过与其它应用程序的集成,Teams 也焕发出新的一面,亮点如下:

  生产力:用户能使用可定制模板快速创建团队,每个模板都带有预先定义的通道、应用程序和指南。另外,基于 Power Virtual Agents 应用程序,用户能更简易地在团队中创建和管理聊天机器人。

  自动化:主要体现在 Power 平台与 Teams 的集成和扩展上。通过 Power平台,用户都能够快速添加自定义应用程序和自动化工作流程到 Teams。另外,Power BI的用户能简单快捷地将报告共享至 Teams。

  会议:通过新应用程序 “Booking”,组织者能够合理的安排、管理、执行多个会议议程。

  通知:微软 Teams 引入了新的网络设备接口(Network Device Interface,NDI)支持和 Skype TX 互操作性,为公共或私人定制的大规模广播提供了一套产品选项。

  远程调度:这大多数表现于 Shifts 工具上,其新增的 Power Automation Actions 使研发人员能够从 Shifts 中获取信息,与其他应用程序创建定制工作流或大量执行操作,以此来帮助优化流程、节省时间。

  实际上,本次大会的媒体资料,正是通过 Microsoft Teams 工具提前发放的;可以想见的是,在远程办公越来越成为行业趋势的情况下,Microsoft Teams 势必会慢慢的受欢迎。

  为了帮助团队更好地进行协同创造,微软在去年的Build 大会上推出了 Fluid Framework(中文可称之为:流体框架)。这是一个基于网页的新型平台,提供了组件化的文档模型以共享互动体验。

  不仅如此,微软对Fluid Framework 的协作形式进行了升级,旨在打破应用程序之间的障碍,实现无缝协作,此次更新大多数表现在 Outlook 和中。值得一提的是,这也是Fluid Framework第一次在Microsoft 365 中集成。

  从 Outlook 层面来看,表格、图表和任务列表可以插入到网页版Outlook 中,由此,用户的销售数据、项目任务和研究报告可以实时更新。

  在 中,用户都能够创建并管理 Fluid Framework工作区,包括文档活动提要、推荐列表等,或是在 Office.com 上进行搜索。

  目前,Fluid Framework的关键基础设施已开源,基于 Web 的Fluid Framework可以使应用程序进行协作,包括执行低延迟同步的数据结构和连接端点的中继服务。

  在 Build 2020 大会上,微软宣布了一些机器学习相关工具,能够在一定程度上帮助研发人员理解、保护和控制整个机器学习生命周期中的模型。这些工具能够最终靠 Azure Machine Learning 访问,也可以在 GitHub 上的开放源码中获得。

  在隐私方面,微软发布了一个用于区分隐私的工具包——Whitnoise。Azure Machine Learning 还内置了控件,使研发人员能够跟踪和自动化构建、培训和部署模型的整一个完整的过程。 这种被许多人称为机器学习和操作(MLOp)的功能提供了审计跟踪,以帮助组织满足法规和合规要求。

  在 Build 开发者大会上,微软宣布将很快开始开源微软图灵模型,以及在 Azure 机器学习中训练它们的方法。因此研发人员能够访问微软来提高其产品之间语言理解的一系列语言模型。

  目前,用于自然语言生成(NLG)的微软图灵模型是世界上最大的公开可用的语言 AI 模型,具有 170 亿个参数。这类新模型的学习与监督学习模型不同,它是采用“自我监督”学习。

  在“自我监督”学习中,这一人工智能模型能够最终靠查看网络上数十亿页的公开文档——条目、出版的书籍、指导手册、历史课、人力资源指南——来学习语言。在类似于疯狂口诀的大型游戏中,单词或句子被移除,该模型必须基于上下文来预测缺失的部分。

  它也可精准识别语言、语法、知识、概念和语境的细微差别,无论是总结冗长的演讲,还是在数千个法律文件中查找相关段落,都可以胜任。

  由于这个模型已经重复过几十亿次上述游戏了,因此非常善于感知单词之间的相互联系,对语法、概念、语境和其他语言构成要素有着丰富的理解。它还允许相同的模型在许多不同的语言任务中传递培训经验,从文档理解到回答问题、再到创建会话机器人。

  同时,这一人工智能模型只需要接受大量数据和超级计算资源的一次训练,然后针对不一样任务对较小的数据集和资源进行微调。

  微软表示,它也在探索其他的大规模 AI 模型,这些模型可在文本、图像和视频中以一般化的方式学习。例如,这能够在一定程度上帮助在 Office 中自动为图像添加字幕以方便访问,或者通过了解图像和视频中的内容来改进人们使用 Bing 搜索引擎的方式。

  通过开发这种用于训练大型人工智能模型的前沿架构,我们正在让 Azure 变得更好。我们正在建设更好的计算机、更好的分布式系统、更好的网络、更好的数据中心。这一些都会推动整个 Azure 的性能、成本和灵活性变得更好。

  在 Build 2020 大会上,微软宣布了其首个针对特定行业的云服务——Microsoft Cloud for Healthcare(微软云医疗服务),目前已公开预览,并将在未来 6 个月免费试用。

  基于此,护理团队可以轻松创建针对患者就医过程的增强分析;患者在看病时也能轻松实现在线预约、提醒、账单支付等多种医疗任务,并且还可以通过 IoT持续监测患者,升级护理。

  另外,在 Microsoft 365 和 Microsoft Teams 的功能构建中也包括了医疗服务,比如“Booking”应用程序,使医疗保健提供商能够在团队中安排、管理和进行“Microsoft 机密提供商到患者”的虚拟访问。

  的确,对微软来说,Build 大会越来越变成了一个面向开发者和行业用户的会议;而与普通用户群体关联更为密切的 Windows 10 和 Office 365,慢慢的变成了 Microsoft 365 的一个组成部分。

  不得不承认,Windows 10 还不够完善,它在本次 Build 大会上还有应用生态层面的更新;但 Windows 10 已经变成了整个微软开发生态的一个躯壳,或者是一个容器,承载着微软在 AI 和 Azure 云计算方面的用户端口。

  正如 Satya Nadella 所言,如今的微软已处在 Intelligent Cloud & Intelligent Edge 的时代,也正处于全球各类企业面向数字化转型的时代。在这样的新时代,微软越来越依赖众多开发者的参与,从而在开源上着力甚多;而从产品上来说,以 Azure 和 Microsoft 365 等产品为载体,微软将众多前沿技术融入其中,从而赋能开发者。

  总体来看,微软越来越深入地走向它正在践行的新任务,即帮助全球各种各样的公司进行数字化转型;当然,在这样的一个过程中,微软也正在实现自身面向未来的另一次转型。

上一篇:写代码提效神器!JetBrains AI Assistant国内版发布基于通义大模型

下一篇:26条措施!工信部:逐步提升移动网络应用服务能力

米乐官方-米乐官方下载-米乐平台下载地址   备案号: 晋ICP备20004420号-1      网站地图