


【谷歌上线AI新平台:集音频处理、图像修复于一身】
谷歌最新推出 Gemini 1.5 Pro 公共预览版,是一款能够帮助用户处理音频内容的人工智能应用平台。这款产品可以分析音频文件,总结财报电话会议录音或视频等内容,并且已经超越了自家更大的模型 ——Gemini Ultra。此外,辅助 Gemini 生成图像的文生图模型 Imagen 2 也将加入图片修复和扩充功能。
除了 Gemini 1.5 Pro,谷歌还对文生图模型 Imagen 进行了更新。他们为 Imagen 模型的所有图片提供了数字水印功能“SynthID”。这种技术可以在图像中添加一个用户不可见的防伪标识,但可以通过检测工具来确认其来源。
值得一提的是,Imagen 的许多新功能已经出现在其他文生图模型中。例如稳定性 AI 的稳定扩散和 Getty 公司的 Generative AI by iStock 上都拥有类似的功能。更不用说最近发布的三星 Galaxy 手机也具备类似特性。
谷歌表示,他们还在公开预览中尝试将 AI 响应与谷歌搜索结果结合,以便利用最新情报进行解答。这些新产品和技术将进一步推动人工智能在各个领域的应用和普及。
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”