当前位置:

【每日AI快讯】8月5日 周一

什么软件好
2024-08-05 09:53:45
 68人浏览

8月5日  周一

💡 从现在起,GitHub上超1亿开发者可直接访问全球顶级大模型,构建AI应用

GitHub 推出“GitHub Models”功能,提供多种流行大模型的 Playground,未来将添加更多模型。开发者可免费试用、导入合适模型到项目中,降低部署门槛,提供“一条龙”服务,包括编码、生产部署和与 Azure 的集成,还保障隐私安全,但个人用户有访问次数等限制。GitHub CEO 称此为又一次转型,希望引入更多合作伙伴,有开发者展示了其便捷性,这或给类似平台如 Hugging Face 带来挑战。

来源:机器之心


💡 阿里「轨迹可控版Sora」,告别「抽卡」,让视频生成更符合物理规律

此前视频扩散模型采用 U-Net 架构存在限制,Sora 采用 DiT 架构有所突破,但基于 Transformer 的扩散模型在生成可控动作视频方面有待探索。阿里研究者提出 Tora,这是首个面向轨迹的 DiT 架构,能集成多种条件生成视频,设计与 DiT 可扩展性契合,实验证明其表现出色。Tora 采用 OpenSora 作为基础模型,包含轨迹提取器、时空 DiT 和运动引导融合器。在实验中,Tora 与流行方法比较,对帧数变化稳健,运动控制能力卓越,轨迹误差渐进增加,视觉质量更好,保真度更高。更多细节可参阅原论文。

来源:机器之心


💡 中文多模态大模型 SuperCLUE-V 基准 8 月榜单发布,腾讯混元居首

据腾讯科技报道,中文多模态大模型 SuperCLUE-V 基准 8 月榜单发布,腾讯混元大模型在国内大模型中位居首位,得分为 71.95 分。8 月榜单涵盖 12 个国内外代表性多模态理解大模型,腾讯混元大模型总榜位居第二,仅次于 GPT-4o。SuperCLUE 评价称国内大模型在基础能力方面与海外模型有差距,尤其在细粒度视觉认知任务上,本次测评包括 4 个开源模型和 8 个闭源模型。

来源:IT之家


💡 全球首例,AI “牙医”上岗:15 分钟搞定牙冠准备,耗时是人类牙医的 1/8

牙科行业迎来重大突破,波士顿公司 Perceptive 制造的 AI 控制自动机器人完成全球首例牙科手术,速度约为人类牙医的八倍。该机器人使用手持式三维容积扫描仪,通过光学相干断层扫描(OCT)建立高分辨率口腔三维模型,能自动检测空腔,准确率约 90%,避免 X 射线辐射。首例手术为牙冠准备牙齿,人类牙医通常需 1 - 2 小时且分两次就诊,AI 机器人不到 15 分钟即可完成。

来源:IT之家


💡 消息称谷歌豪掷 25 亿美元收购 AI 独角兽 Character.AI

据彭博社报道,当地时间周五,AI 独角兽公司 Character.AI 的创始人诺姆・沙泽尔和丹尼尔・德・弗雷塔斯及研究团队部分成员加入谷歌。谷歌以 25 亿美元收购该公司,现有投资者以该价格买断公司股票,高于此前 10 亿美元估值,但低于去年讨论的 50 亿美元。Character.AI 将与谷歌达成非独家授权协议并继续存在,其大部分团队将留任。该公司能让用户制作定制聊天机器人,已制作数百万个,马斯克的 xAI 曾考虑收购但被马斯克否认。两位创始人曾在谷歌工作,沙泽尔曾撰写生成式 AI 开创性论文。

来源:IT之家


💡 AI 大语言模型价格战将启?谷歌本月下调 Gemini 1.5 Flash 费用:降幅最高 78.6%

谷歌宣布将于 8 月 12 日起调整 Gemini 1.5 Flash 模型的价格,每百万输入 tokens 成本为 0.075 美元,每百万输出 tokens 成本为 0.3 美元。这使得其使用成本比 OpenAI 的 GPT - 4o mini 便宜近 50%,输入费用降低 78.6%,输出费用降低 71%。但在性能方面,Gemini 1.5 Flash 仍落后于 GPT - 4o mini ,在除 MathVista 之外的顶级人工智能基准测试中,GPT - 4o mini 均更优。

来源:IT之家

标签:
评论 0
登录后即可发布评论
提交