当前位置:

【每日AI快讯】7月5日 周五

什么软件好
2024-07-05 10:11:25
 143人浏览

7月5日  周五

💡 首个开源、原生多模态生成大模型:一键生成 「煎鸡蛋」图文菜谱

上海交通大学刘鹏飞副教授回国创建生成式人工智能研究实验室(GAIR),汇聚顶尖高校人才,专注大模型基础研究、对齐系统和社会影响。Anole 模型由该团队推出,是全球首个完全开源、自回归、原生的多模态大模型,能实现交错图文生成,无需稳定扩散技术。它基于 Meta 开源的 Chameleon 优势,新增复杂任务,通过创新微调实现出色图像生成和理解能力,具备图文交错生成和文本生成图像等能力。Anole 采用快速高效的微调手段、少量微调数据等特性,GAIR 团队对其完全开源,提供资源,开启了重要研究方向,为多模态 AI 发展提供基础。

来源:机器之心


💡 全新TextGrad框架:用GPT-4o作引擎,自动优化端到端任务

Mert Yuksekgonul、Federico Bianchi、Joseph Boen、刘晟、黄治等人来自斯坦福大学,他们在相关领域有深入研究。近日,来自斯坦福大学的研究者推出TextGrad框架,用于高效协调和优化由大语言模型等组件构成的AI系统,自动优化端到端任务性能。TextGrad将LLM应用视为计算图,以自然语言实现梯度传递,具有普适性和兼容性,能用于提示工程、优化模型输出,还在药物探索、肿瘤放疗治疗计划等方面有应用,其意义不仅在于优化性能,还展示了AI自我认知和修正的可能性。相关网站、论文、代码可获取。

来源:机器之心


💡 AI伴写、PC本地大模型、超导量子计算 |直击2024 WAIC

2024 世界人工智能大会在上海开幕,主题为“以共商促共享,以善治促善智”。众多科创板公司亮相,金山办公展示了无需提示词的 WPS AI 伴写功能,展台体验区火爆,该功能尚处灰度测试阶段,将在主题论坛中首次对外发布。星环科技推出人工智能基础平台产品 TKH 及问答大模型无涯·问知,首次部署独立 AI PC 体验区,并与英特尔合作推动与终端厂商适配。海天瑞声认为未来人工智能产业对数据重视度会更高,今年 WAIC 上算法层客户对上游数据领域的关注度明显增加。国盾量子展出千比特超导量子计算测控系统等,中控技术展示了通用控制系统等一系列 AI 技术,萤石网络带来 RK3 家庭助理机器人。

来源:科创板日报


💡 AI热潮推动电力需求!华尔街巨头已意识到:美国电网岌岌可危

电动汽车、加密货币和人工智能带来超高电力需求,使本就脆弱的美国电网面临巨大压力。美国银行数据显示,美国电网由众多机组和长输电线路组成,设备使用年限长,电力需求增长但供应紧张,新增项目少,风能和太阳能难以弥补供需差距。亚马逊已为 AI 收购核电站,甲骨文将投资扩大数据中心容量。电力需求激增致公用事业类股复苏,高盛力推,推荐了四大公用事业股,认为涨势将持续。

来源:财联社


💡 腾讯混元 DiT 文生图大模型开源 6G 小显存版本,一同开源打标模型

腾讯混元文生图大模型(混元 DiT)今日开源小显存版本,仅需 6G 显存即可运行,对个人电脑本地部署的开发者友好,还宣布接入 Kohya 训练界面并升级至 1.2 版本,同时混元文生图打标模型“混元 Captioner”也正式对外开源,支持中英文双语,针对文生图场景优化,可帮助生成数据集,解决了业界通用模型的一些问题。

来源:IT之家


💡 一张照片创造 1 分钟人物视频,商汤发布首个“可控”人物视频生成大模型 Vimi

商汤科技在世界人工智能大会上发布首个“可控”人物视频生成大模型 Vimi,通过一张任意风格的照片就能生成和目标动作一致的人物类视频,支持多种驱动方式,能精准控制人物表情和半身肢体动作,自动生成相符的头发、服饰及背景变化,可稳定生成 1 分钟单镜头视频,将面向 C 端用户开放,用户上传高清人物图片可生成数字分身和写真视频,生成的视频人物动作完整统一,方便创作者进行剪辑和再创作。

来源:IT之家

标签:
评论 0
登录后即可发布评论
提交