/从 Hot Wheels 到处理内容:品牌如何使用 Microsoft AI 提高生产力和想象力

从 Hot Wheels 到处理内容:品牌如何使用 Microsoft AI 提高生产力和想象力

当玩具公司 Mattel 的设计师最近被要求设计一款新的 Hot Wheels 模型车时,他们从 DALL∙E 2 中寻找灵感,DALL∙E 2 是 OpenAI 开发的人工智能系统,可以根据人们用直白的语言描述的内容创建自定义图像和艺术.

使用该工具,设计师可以输入诸如“经典汽车的比例模型”之类的提示,DALL∙E 2 将生成一辆玩具老爷车的图像,可能是银色和白色轮胎。

下一步,设计师可以擦掉汽车的顶部,然后输入“让它成为敞篷车”,DALL∙E 2 就会将汽车的形象更新为敞篷车。设计师可以不断调整设计,让 DALL∙E 2 尝试粉红色或蓝色,以及软顶等等。

该公司今天在面向开发人员和 IT 专业人士的Microsoft Ignite会议上宣布:DALL∙E 2 将受邀加入微软的 Azure OpenAI 服务,允许选定的 Azure AI 客户使用文本或图像生成自定义图像。

微软表示,通过Azure OpenAI 服务提供 DALL∙E 2可为客户提供 Mattel 云 AI 基础设施,该基础设施将文本到图像生成的尖端创新与 Azure 提供的合规性、负责任的 AI 护栏和认证相结合。

Mattel 的设计师能够生成数十张图像,每次迭代都会激发和完善想法,这些想法可以帮助设计出新的 Hot Wheels 模型车的最终充实渲染图。

“这就是说,’哦,我没想到这个!’”位于加利福尼亚州埃尔塞贡多的 Mattel Future Lab 的产品设计总监 Carrie Buse 说。她将人工智能技术视为帮助设计师产生更多创意的工具。“最终,质量是最重要的,”她指出。“但有时数量可以帮助你找到质量。”

微软还将 DALL∙E 2 集成到其消费者应用程序和服务中。在新发布的Microsoft Designer应用程序开始中,它很快将集成到 Microsoft Bing 的 Image Creator里。

DALL∙E 2 在 Microsoft 产品和服务中的推出反映了该公司在 AI 研究方面的投资如何将 AI 融入其构建、生产和交付的所有产品中,以帮助每个人提高生产力和创新。

在过去的 18 个月里,我们看到了这种技术转变,从证明你可以用 AI 做事到将其映射到对最终用户有用的实际场景和流程。

微软 AI 平台公司副总裁 Eric Boyd 表示,这种趋势是 AI 能力非线性突破的结果,通过将更多计算引入更多数据以训练更丰富、更强大的模型。

“模型的力量已经跨越了这个质量门槛,现在它们在更多应用中很有用,”他说。“我们看到的另一个趋势是,所有产品开发人员都在思考和理解他们可以在产品中使用 AI 的方式,以提高易用性,并说,‘哦,如果我可以让我的产品更好地工作,我使用人工智能。’”

DALL∙E 2 在托管在 Azure 中的超级计算机上进行了训练,该超级计算机是 Microsoft 专门为 OpenAI 构建的。同一台 Azure 超级计算机还用于训练 OpenAI 的 GPT-3 自然语言模型和 Codex,该模型为GitHub Copilot 提供支持,以及在Azure OpenAI 服务上运行的 Microsoft Power Apps 中的某些功能。Azure 还使这些 AI 工具能够快速生成图像、文本或代码建议,供人们查看和考虑使用。

DALL∙E 2 的加入建立在 Microsoft 和 OpenAI 的持续合作伙伴关系的基础上,并扩展了 Azure OpenAI 服务中用例的广度,Azure OpenAI 服务是目前处于预览状态的 Azure 认知服务系列中的最新产品,它提供安全性、可靠性、合规性、数据隐私和Microsoft Azure 中内置的其他企业级功能。

微软开发并通过Azure 认知服务提供的其他人工智能技术,如语言翻译、语音转录、光学字符识别和文档摘要,正在Microsoft Teams、Microsoft Power Platform和Microsoft 365等产品和服务中出现。

“在过去的 18 个月里,我们见证了技术的转变,从证明你可以用 AI 做事到将其映射到对最终用户有用的实际场景和流程,”微软公司副总裁 Charles Lamanna 说。业务应用程序和平台。“这是这些非常大的语言模型的产品化。”


“每当我收到老板的电子邮件时,都会向我的手机发送一条短信”

Lamanna 说,这些人工智能功能旨在消除繁琐的工作,让员工能够专注于更高价值的任务,例如让销售人员无需做笔记即可与客户进行对话。这些新工具还可以使目前占用人们工作日数小时的流程自动化,例如编写销售电话摘要并将其添加到客户数据库中。

“我们现在可以注入 AI 来倾听我们的谈话,并通过创建记录、捕捉行动项目、做会议总结、识别常用短语或分析‘我是一个好的倾听者吗?’来帮助人们提高工作效率,”Lamanna 说。. “这需要最先进的人工智能和这些数字协作工具的进步。”

Lamanna 专注于创建工具,使任何拥有计算设备的人都可以使用 Microsoft Power Platform 创建自己的 AI 驱动的应用程序。例如,他的团队正在Power Automate 中推出一项功能,该功能具有 AI 驱动的副驾驶功能,允许人们使用自然语言来构建连接 Microsoft 云中运行的各种服务的工作流程。

“使用普通语言的用户可以说,’嘿,每当我收到老板的电子邮件时,向我的手机发送一条短信并在我的 Outlook 中添加一个待办事项,’”Lamanna 解释道。“他们可以这么说,它会自动生成。”

他说,这种将句子转化为工作流程的能力极大地扩大了可以创建 AI 驱动的软件解决方案的人数。他补充说,拥有更多技术知识的人可以使用 Power Platform 中提供的低代码工具和图形界面(例如 AI Builder 中的智能文档处理技术)进一步定制和完善他们的应用程序。

律师可以使用这项技术构建一个定制的应用程序,每当将新合同上传到公司的 SharePoint 网站时就会触发该应用程序。这个应用程序可以提取关键信息,例如谁起草了合同、涉及的各方和行业部门,然后将包含这些详细信息的合同摘要通过电子邮件发送给公司中负责该部门的律师或客户。

“这有点神奇,”Lamanna 说,将这种类型的 AI 自动化工作流程与当今通常完成此类任务的方式进行了对比。“您检查 SharePoint 网站,打开一个新文件,然后浏览并尝试对其进行总结,看看是否需要对它做任何事情。人工智能正在让人们摆脱这种单调乏味的生活,让计算机去做对他们最有利的事情。”

内容人工智能

过去几年的数字化转型增加了世界各地人们制作的内容的洪流。例如,Microsoft 客户现在每天向 Microsoft 365 添加大约 16 亿条内容。想想营销演示文稿、合同、发票和工作订单,以及 Teams 会议的视频录制和文字记录。

“他们创建文档,在 Teams 中进行协作,并将它们存储在 SharePoint 支持的体验中,”Microsoft 协作应用程序和平台总裁 Jeff Teper 说。“我们想要做的是将人工智能技术与这些内容相结合,这样客户就可以进行更多结构化的活动,比如合同批准、发票管理和监管备案。”

这就是 Microsoft 创建Microsoft Syntex的原因,这是一种适用于 Microsoft 365 的新内容 AI 产品,它利用 Azure 认知服务和其他 AI 技术来改变内容的创建、处理和发现方式。它读取、标记和索引内容——无论是数字内容还是纸质内容——使其在特定应用程序中可搜索和可用,或作为可重复使用的知识。它还可以通过安全和保留设置来管理内容生命周期。

例如,TaylorMade Golf Company 求助于 Microsoft Syntex 的综合文档管理系统来组织和保护电子邮件、附件和其他用于知识产权和专利申请的文档。当时,公司律师手动管理这些内容,花费数小时归档和移动文件以便稍后共享和处理。

使用 Microsoft Syntex,这些文档会以一种更安全的方式自动分类、标记和过滤,并使它们更容易通过搜索找到,而无需翻阅传统的文件和文件夹系统。泰勒梅还在探索使用 Microsoft Syntex 为应付账款和财务团队自动处理订单、收据和其他交易文件的方法。

Teper 指出,其他客户正在使用 Microsoft Syntex 进行合同管理和组装。虽然每份合同都可能有独特的元素,但它们都是由围绕财务条款、变更控制、时间表等的共同条款构成的。人们不必每次都从头开始编写那些通用的子句,而是可以使用 Syntex 从各种文档中组装它们,然后进行更改。

“他们需要人工智能和机器学习来发现,‘嘿,这一段与我们的标准条款有很大不同。这可能需要一些额外的监督,’”他说。

“如果你试图阅读一份 100 页的合同并寻找发生重大变化的内容,那么与 AI 相比,这需要大量工作,”他补充道。“然后是围绕这些合同的工作流程:谁批准它们?它们存放在哪里?你以后怎么找到他们?其中很大一部分是元数据。”

DALL∙E 2 变得个性化

DALL∙E 2 在 Azure OpenAI 服务中的可用性引发了德国最大的私营跨媒体公司 RTL Deutschland 对如何根据客户兴趣生成个性化图像的一系列探索。例如,在 RTL 的数据、研究和人工智能能力中心,数据科学家正在测试各种策略,以通过生成图像来增强用户体验。

RTL Deutschland 的流媒体服务 RTL+ 正在扩展,以提供对数百万视频、音乐专辑、播客、有声读物和电子杂志的点播访问。RTL 数据团队数据产品和技术高级副总裁 Marc Egger 表示,该平台严重依赖图像来吸引人们的注意力。

“即使你有完美的推荐,你仍然不知道用户是否会点击它,因为用户正在使用视觉线索来决定他或她是否有兴趣消费某些东西。所以艺术品真的很重要,你必须为合适的人拥有合适的艺术品,”他说。

想象一部关于一名职业足球运动员被调到巴黎并爱上一名法国体育记者的浪漫喜剧电影。如果有足球比赛的图像,体育迷可能更倾向于观看电影。喜欢言情小说或旅行的人可能会对这对情侣在埃菲尔铁塔下接吻的画面更感兴趣。

Egger 说,将 DALL∙E 2 的强大功能与有关用户过去与何种内容进行交互的元数据相结合,有可能以前所未有的规模提供个性化图像。

“如果你有数百万用户和数百万资产,你就会遇到无法扩展的问题——劳动力不存在,”他说。“你永远不会有足够的平面设计师来创建你想要的所有个性化图像。因此,这是一项使能技术,可以做你原本做不到的事情。”

Egger 的团队也在考虑如何使用 Azure OpenAI 服务中的 DALL∙E 2 为目前缺乏图像的内容创建视觉效果,例如播客剧集和有声读物中的场景。例如,来自播客剧集的元数据可用于生成一个独特的图像来伴随它,而不是一遍又一遍地重复相同的通用播客图像。

德国最大的私营跨媒体公司 RTL Deutschland 正在探索如何在 Azure OpenAI 服务中使用 DALL∙E 2 来吸引浏览其流媒体服务 RTL+ 的人们。一个想法是使用 DALL∙E 2 生成独特的图像来说明各个播客剧集,而不是依赖相同的播客封面艺术。

沿着类似的思路,在手机上听有声读物的人通常会为每一章看相同的书籍封面艺术。DALL∙E 2 可用于生成独特的图像,以配合每一章中的每个场景。

Egger 补充说,通过 Azure OpenAI 服务使用 DALL∙E 2,可以在一个地方访问其他 Azure 服务和工具,这使他的团队能够高效、无缝地工作。“与所有其他软件即服务产品一样,我们可以肯定,如果我们需要 DALL∙E 创建的大量图像,我们并不担心将其在线。”

DALL∙E 2 的适当和负责任的使用

微软 Azure AI 首席团队项目经理 Sarah Bird 表示,没有任何一种 AI 技术像 DALL∙E 2 这样的系统一样令人兴奋,因为它可以从自然语言描述中生成图像。

“人们喜欢图像,对于像我这样完全没有视觉艺术感的人来说,我能够制作出比使用其他视觉工具更漂亮的东西,”她谈到 DALL∙E 2 时说道。它为人类提供了一种新工具,可以创造性地表达自己,并以引人入胜、有趣和引人入胜的方式进行交流。”

她的团队专注于开发工具和技术,引导人们以适当和负责任的方式使用Azure AI 中的 DALL∙E 2 等 AI 工具,并限制它们以可能造成伤害的方式使用。

为了帮助防止 DALL∙E 2 在 Azure OpenAI 服务中提供不适当的输出,OpenAI 从用于训练模型的数据集中删除了最露骨的性和暴力内容,并且 Azure AI 部署了过滤器以拒绝违反内容策略的提示。

此外,该团队还集成了一些技术,可以防止 DALL∙E 2 创建名人图像以及通常用来试图诱骗系统生成色情或暴力内容的对象。在输出方面,该团队添加了模型,可以删除 AI 生成的图像,这些图像似乎包含成人、血腥和其他类型的不当内容。

我们正在设计界面来帮助用户……使用这个工具来获得他们想要的表现形式。

DALL∙E 2 仍然面临许多人工智能系统遇到的挑战:系统的好坏取决于用于训练它的数据。如果没有提供对用户意图的洞察力的上下文的好处,对 DALL-E 2 的较少描述性提示可能会暴露出嵌入在训练数据(来自互联网的文本和图像)中的偏差。

这就是为什么 Bird 与 Microsoft 产品团队合作,教人们如何以帮助他们实现目标的方式使用 DALL∙E 2,例如使用更具描述性的提示来帮助 AI 系统更好地了解他们所追求的结果。

“我们正在设计界面,以帮助用户在其生成的内容中取得更大的成功,并分享当今的局限性,以便用户能够使用此工具获得他们想要的表示,而不是互联网上存在的任何平均表示, “ 她说。

“你如何预测未来?”

Buse 最近加入了 Mattel Future Lab,该实验室正在探索元宇宙和 NFT 或不可替代代币等想法,以扩大玩具业务的范围。她将 DALL∙E 2 作为一种工具来帮助她想象这些虚拟体验会是什么样子。

“在这里四处闲逛,思考虚拟世界中会出现什么很有趣——选择一个描述符——森林、美人鱼等等,”她说,并解释说 DALL∙E 2 正在帮助她的团队预测这个未来.“你如何预测未来?你不断地给自己提供更多的信息、更多的图像和想法,试图想象这将如何组合在一起。”

微软 Azure 平台公司副总裁 Boyd 表示,DALL∙E 2 和支撑它的大型语言模型系列正在为客户释放这种创造力。人工智能系统是想象力的燃料,使用户能够想出新的有趣的想法,并将它们生动地呈现在他们的演示文稿和文档中。

“我认为最令人兴奋的是,我们只是触及了这些大型语言模型的皮毛,”他说。

 
 
    
    大作社是大作旗下综合设计资讯社区,多重视角共同探索全球设计文化,关注我们,每天有你好看。

本文来自微信公众号“大作社”(ID:MasterOpenEye)。大作社经授权转载,该文观点仅代表作者本人,大作社平台仅提供信息存储空间服务。