8月5日周一

💡 从现在起，GitHub上超1亿开发者可直接访问全球顶级大模型，构建AI应用

GitHub 推出“GitHub Models”功能，提供多种流行大模型的 Playground，未来将添加更多模型。开发者可免费试用、导入合适模型到项目中，降低部署门槛，提供“一条龙”服务，包括编码、生产部署和与 Azure 的集成，还保障隐私安全，但个人用户有访问次数等限制。GitHub CEO 称此为又一次转型，希望引入更多合作伙伴，有开发者展示了其便捷性，这或给类似平台如 Hugging Face 带来挑战。

来源：机器之心

💡 阿里「轨迹可控版Sora」，告别「抽卡」，让视频生成更符合物理规律

此前视频扩散模型采用 U-Net 架构存在限制，Sora 采用 DiT 架构有所突破，但基于 Transformer 的扩散模型在生成可控动作视频方面有待探索。阿里研究者提出 Tora，这是首个面向轨迹的 DiT 架构，能集成多种条件生成视频，设计与 DiT 可扩展性契合，实验证明其表现出色。Tora 采用 OpenSora 作为基础模型，包含轨迹提取器、时空 DiT 和运动引导融合器。在实验中，Tora 与流行方法比较，对帧数变化稳健，运动控制能力卓越，轨迹误差渐进增加，视觉质量更好，保真度更高。更多细节可参阅原论文。

来源：机器之心

💡 中文多模态大模型 SuperCLUE-V 基准 8 月榜单发布，腾讯混元居首

据腾讯科技报道，中文多模态大模型 SuperCLUE-V 基准 8 月榜单发布，腾讯混元大模型在国内大模型中位居首位，得分为 71.95 分。8 月榜单涵盖 12 个国内外代表性多模态理解大模型，腾讯混元大模型总榜位居第二，仅次于 GPT-4o。SuperCLUE 评价称国内大模型在基础能力方面与海外模型有差距，尤其在细粒度视觉认知任务上，本次测评包括 4 个开源模型和 8 个闭源模型。

来源：IT之家

💡 全球首例，AI “牙医”上岗：15 分钟搞定牙冠准备，耗时是人类牙医的 1/8

牙科行业迎来重大突破，波士顿公司 Perceptive 制造的 AI 控制自动机器人完成全球首例牙科手术，速度约为人类牙医的八倍。该机器人使用手持式三维容积扫描仪，通过光学相干断层扫描（OCT）建立高分辨率口腔三维模型，能自动检测空腔，准确率约 90%，避免 X 射线辐射。首例手术为牙冠准备牙齿，人类牙医通常需 1 - 2 小时且分两次就诊，AI 机器人不到 15 分钟即可完成。

来源：IT之家

💡 消息称谷歌豪掷 25 亿美元收购 AI 独角兽 Character.AI

据彭博社报道，当地时间周五，AI 独角兽公司 Character.AI 的创始人诺姆・沙泽尔和丹尼尔・德・弗雷塔斯及研究团队部分成员加入谷歌。谷歌以 25 亿美元收购该公司，现有投资者以该价格买断公司股票，高于此前 10 亿美元估值，但低于去年讨论的 50 亿美元。Character.AI 将与谷歌达成非独家授权协议并继续存在，其大部分团队将留任。该公司能让用户制作定制聊天机器人，已制作数百万个，马斯克的 xAI 曾考虑收购但被马斯克否认。两位创始人曾在谷歌工作，沙泽尔曾撰写生成式 AI 开创性论文。

来源：IT之家

💡 AI 大语言模型价格战将启？谷歌本月下调 Gemini 1.5 Flash 费用：降幅最高 78.6%

谷歌宣布将于 8 月 12 日起调整 Gemini 1.5 Flash 模型的价格，每百万输入 tokens 成本为 0.075 美元，每百万输出 tokens 成本为 0.3 美元。这使得其使用成本比 OpenAI 的 GPT - 4o mini 便宜近 50%，输入费用降低 78.6%，输出费用降低 71%。但在性能方面，Gemini 1.5 Flash 仍落后于 GPT - 4o mini ，在除 MathVista 之外的顶级人工智能基准测试中，GPT - 4o mini 均更优。

来源：IT之家

当前位置：
资讯中心 /快讯/文章详情/

【每日AI快讯】8月5日周一

8月5日周一

💡 从现在起，GitHub上超1亿开发者可直接访问全球顶级大模型，构建AI应用

💡 阿里「轨迹可控版Sora」，告别「抽卡」，让视频生成更符合物理规律

💡 中文多模态大模型 SuperCLUE-V 基准 8 月榜单发布，腾讯混元居首

💡 全球首例，AI “牙医”上岗：15 分钟搞定牙冠准备，耗时是人类牙医的 1/8

💡 消息称谷歌豪掷 25 亿美元收购 AI 独角兽 Character.AI

💡 AI 大语言模型价格战将启？谷歌本月下调 Gemini 1.5 Flash 费用：降幅最高 78.6%

当前位置： 资讯中心 /快讯/文章详情/

【每日AI快讯】8月5日 周一

8月5日 周一

💡 从现在起，GitHub上超1亿开发者可直接访问全球顶级大模型，构建AI应用

💡 阿里「轨迹可控版Sora」，告别「抽卡」，让视频生成更符合物理规律

💡 中文多模态大模型 SuperCLUE-V 基准 8 月榜单发布，腾讯混元居首

💡 全球首例，AI “牙医”上岗：15 分钟搞定牙冠准备，耗时是人类牙医的 1/8

💡 消息称谷歌豪掷 25 亿美元收购 AI 独角兽 Character.AI

💡 AI 大语言模型价格战将启？谷歌本月下调 Gemini 1.5 Flash 费用：降幅最高 78.6%

当前位置：
资讯中心 /快讯/文章详情/

【每日AI快讯】8月5日周一

8月5日周一