当前位置:

【每日AI快讯】8月7日 周三

什么软件好
2024-08-07 09:43:22
 104人浏览

8月7日  周三

💡 国产端侧模型又出力作!面壁“小钢炮”MiniCPM-V 2.6模型重磅上新

今日面壁推出的“小钢炮”MiniCPM-V 2.6 模型以 8B 参数取得出色成绩,端侧多模态能力超越 GPT-4V 等,在单图、多图、视频理解等方面表现卓越,具备端侧实时视频理解、多图联合理解等多项功能,采用统一高清视觉架构,幻觉水平低且推理能力强,多图 ICL 首次上“端”,该系列下载量超百万,是面壁“大模型科学化”路线实践成果。

来源:智东西


💡 零一万物Yi API Function Call 功能上线

Yi API 新增 Function Call 功能,其模型 Yi-Large-FC 经训练具备良好能力,能判断调用外部工具,兼容 OpenAI 接口。Function Call 在实时性、专用任务处理、自动化工作流程和增强模型能力等场景很重要。Yi-Large-FC 在 Berkeley Function-Calling Leaderboard 总榜排名世界第六,Exec 摘要得分世界第二,优于众多海外知名模型。Yi 系列大模型性能出色、价格有竞争力,已被众多企业选用,如知料科技、MetaGPT 等。零一万物持续推出工具,Yi-Large-FC 已在其开放平台上线。

来源:零一万物


💡 OpenAI API引入结构化输出功能,助力开发者智能连接外部工具

OpenAI 在 API 中推出了新的结构化输出功能,这为开发者提供了一种更可靠的方法,将 GPT 的能力与外部工具和 API 连接起来。这一功能允许开发者向 gpt-4-0613 和 gpt-3.5-turbo-0613 描述函数,并让模型智能地选择输出一个包含调用这些函数参数的 JSON 对象。 这一功能使得模型能够更准确地与外部工具和 API 进行交互,为开发者提供了更大的灵活性和控制力。通过这种新的结构化输出功能,OpenAI 进一步扩展了其语言模型的应用范围,使其能够更好地适应各种开发需求。

来源:第一财经


💡 通义App推出角色扮演功能,可一键替换视频人物

通义 App 推出角色扮演功能,可一键替换视频人物,上传视频选择 3D 角色即可实现创意效果。年初通义实验室推出的 Motionshop 模型加速产品化,已上线通义 App 供用户免费使用,首批上线四个角色模板,9 月将开放自定义角色。Motionshop 利用多种技术,其高效的路径追踪方案解决了传统渲染方法的问题。此前通义已形成完整人物视频生成模型产品矩阵,如“全民舞王”“全民唱演”“全民云运动”等应用。未来 Motionshop 有望应用于多个场景。

来源:量子位


💡 严防“胡说八道”,苹果 Apple Intelligence 智能回复功能加入“反幻觉”指令

近日网友在 macOS 15.1 测试版中发现苹果为 Apple Intelligence 的智能回复功能设置的内部指令,以 JSON 文件形式存在,规定工作流程,强调“不要编造事实,不要产生幻觉”。智能回复是苹果邮件应用功能,背后是自研智能技术,但面临“幻觉”问题。为防止此情况,苹果设置严格指令,要求仅提取邮件明确问题并提供回复选项,虽如此,业内认为完全消除“幻觉”问题仍有挑战,因生成式 AI 模型本质上不理解文本内容,无法准确判断信息真伪。

来源:IT之家


💡 Meta 构建分布式 RoCEv2 网络:探索串联数万片 GPU,训练千亿参数级 AI 模型

为满足大规模分布式 AI 训练的网络需求,构建了基于 RoCEv2 协议的大规模 AI 网络。RoCEv2 是一种节点通信传输方式,Meta 已成功扩展该网络,从原型发展到部署众多可容纳数千个 GPU 的集群,支持多种生产型分布式 GPU 训练工作。Meta 为分布式 AI 训练建立专用后端网络,训练集群依赖前端和后端两个独立网络,前端用于数据摄取等任务,后端用于训练,后端结构以无阻塞架构连接所有 RDMA 网卡,提供高带宽、低延迟和无损传输。为应对 LLM 模型训练对 GPU 规模的需求,Meta 设计了聚合训练交换机层,并优化路由、拥塞控制等以提升网络性能。

来源:IT之家

标签:
评论 0
登录后即可发布评论
提交