当前位置:

【每日AI快讯】5月20日 周一

什么软件好
2024-05-20 10:14:08
 143人浏览

05月20日  周一

💡 谷歌Gemini 1.5技术报告:轻松证明奥数题,Flash版比GPT-4 Turbo快5倍

谷歌2月推出的多模态大模型Gemini1.5,经优化性能提升,本周发布了技术报告。报告介绍了两个新型号:功能更强大的Gemini1.5Pro和轻量级Gemini1.5Flash,后者在效率上有显著优势。Gemini1.5在处理长上下文和跨模态内容上表现卓越,尤其在视频和音频理解任务上超越了前代。谷歌表示,Gemini1.5的数学增强版本在竞赛级数学问题上表现出色,并在实际应用中能显著节省专业人士的时间

来源:机器之心


💡 人物照片+文字 = 定制化视频,腾讯光子开源ID-Animator

腾讯光子近期推出的ID-Animator,是一种创新的文本驱动人物视频生成框架,能够根据参考图片生成一致性的角色定制化视频。该框架包括人脸适配器模块和视频生成主干网络,通过轻量级的适配器模块,实现了人物一致性的视频生成。此外,ID-Animator还提出了面向ID的视频数据集重构流程、随机人脸参考的训练方法,有效提升了生成视频的身份保持能力。与IP-Adapter等模型相比,ID-Animator展现了更强大的指令跟随能力和ID保真度,可应用于多种风格和模型的视频生成

来源:机器之心


💡 OpenAI又迎人事动荡!“超级对齐”团队已被解散

OpenAI的“超级对齐”团队,负责研究人工智能生存危险,已经全部辞职或被其他小组吸收。这个团队原本是为了解决超智能“AI对齐”问题而成立,即确保AI系统的目标与人类价值观和利益一致。然而,由于公司内部动荡,包括团队两名研究人员被解雇、负责人伊利亚·苏茨克沃和Jan Leike离职,以及其他成员的离开,这个团队已经解散。OpenAI表示,将把超级对齐团队的工作更深入地整合到其研究工作中,以帮助公司实现其安全目标。

来源:科创板日报


💡 OpenAI宫斗大戏第二幕 核心安全团队解散 负责人自爆离职内幕

OpenAI的超级对齐团队,负责研究人工智能的安全性和对齐问题,已经解散。团队负责人Jan Leike和Ilya Sutskever相继离职,Leike公开指责公司不够关注AI安全,而更注重产品开发和商业化。OpenAI表示将把超级对齐团队的工作整合到其他研究中,但这一决定引发了外界对公司在AI安全和商业化之间如何平衡的质疑。此外,有消息称OpenAI的离职员工在离职时被要求签署非贬低条款的协议,这引发了关于公司透明度和言论自由的讨论。OpenAI的CEO阿尔特曼承诺将发布更多相关信息,以解释公司未来的方向和策略。

来源:财联社


💡 Meta 首发「变色龙」挑战 GPT-4o,34B 参数引领多模态革命!10 万亿 token 训练刷新 SOTA

Meta团队最近发布了一个名为「混合模态基座模型」Chameleon的新模型,这是一个340亿参数的模型,使用了10万亿token进行训练。Chameleon采用了统一的Transformer架构,能够处理文本、图像和代码的混合模态,并实现了在单一神经网络中无缝处理这些模态。Chameleon的性能在纯文本任务中与Gemini-Pro相当,在视觉问答和图像标注基准上刷新了SOTA,性能接近GPT-4V。Chameleon采用了「早期融合」的方法,将所有模态的信息映射到同一个向量空间中,让Transformer可以无缝处理文本和图像。为了优化稳定性,Chameleon引入了QK归一化、在注意力层和前馈层之后引入dropout等训练技巧。在实验评估中,Chameleon的性能全面超过了Llama 2,在某些任务上接近Mistral-7B/8x7B。此外,Chameleon-34B在人工评估中表现远超Gemini Pro和GPT-4V。

来源:IT之家


💡 月之暗面 Kimi 智能助手加入“给 Kimi 加油”付费选项:可获得高峰期优先使用权益

Kimi智能助手最近上线了“给 Kimi 加油”的付费选项,用户可以选择不同的付费档位来支持Kimi,享受高峰期优先使用权益。这个服务可以在电脑网页端支付,提供了六种不同的付费档位,包括送Kimi一朵花、给Kimi加鸡腿、请Kimi喝咖啡、给Kimi充充电、请Kimi吃顿饭和和Kimi一起登月。这些档位的价格和时长不同,用户可以根据自己的需求选择合适的档位。

来源:IT之家


标签:
评论 0
登录后即可发布评论
提交