微软宣布推出用于Bing图像搜索的Turing Bletchley v3视觉语言模型

文章列表

微软正式宣布了其 Turing Bletchley 多语言视觉语言基础模型的第三个版本。现在它已被推广到微软的许多产品中，包括用于改进图像搜索的Bing 。

微软早在 2021 年 11 月就推出了 Turing Bletchley 模型的第一个版本。今天在 Bing 官方博客上发布的一篇文章中，微软表示，它于 2022 年秋季开始测试该模型的第三个版本，然后将其添加到 Bing 和其他产品中。

该模型使用文本和图像输入来查找人们在微软必应搜索引擎上寻找的内容。目标是让模型尽可能接近，以便描述“狗吃冰淇淋”等的文本尽可能接近搜索结果中狗吃冰淇淋的图像。

Turing Bletchley v3 建立这些联系的部分方式与模型密切相关。微软表示：

给定图像和描述该图像的标题，标题中的一些单词被屏蔽。然后训练神经网络来预测以图像和文本为条件的隐藏单词。该任务也可以翻转以掩盖像素而不是单词。这种类型的掩码训练与基于变压器的大型模型一起产生了强大的预训练模型，可以针对各种下游任务进行微调。

除了用于 Bing 中的图像搜索之外。新的 Turing Bletchley v3 模型正在其 Xbox 游戏服务上用于内容审核。例如，它可以帮助该团队识别 Xbox 玩家上传到其个人资料中的图像和视频，这些图像和视频将被视为不适当且违反公司在 Xbox 平台上的社区标准。

DeepSeek全套部署资料免费下载