7月5日周五

💡 首个开源、原生多模态生成大模型：一键生成「煎鸡蛋」图文菜谱

上海交通大学刘鹏飞副教授回国创建生成式人工智能研究实验室（GAIR），汇聚顶尖高校人才，专注大模型基础研究、对齐系统和社会影响。Anole 模型由该团队推出，是全球首个完全开源、自回归、原生的多模态大模型，能实现交错图文生成，无需稳定扩散技术。它基于 Meta 开源的 Chameleon 优势，新增复杂任务，通过创新微调实现出色图像生成和理解能力，具备图文交错生成和文本生成图像等能力。Anole 采用快速高效的微调手段、少量微调数据等特性，GAIR 团队对其完全开源，提供资源，开启了重要研究方向，为多模态 AI 发展提供基础。

来源：机器之心

💡 全新TextGrad框架：用GPT-4o作引擎，自动优化端到端任务

Mert Yuksekgonul、Federico Bianchi、Joseph Boen、刘晟、黄治等人来自斯坦福大学，他们在相关领域有深入研究。近日，来自斯坦福大学的研究者推出TextGrad框架，用于高效协调和优化由大语言模型等组件构成的AI系统，自动优化端到端任务性能。TextGrad将LLM应用视为计算图，以自然语言实现梯度传递，具有普适性和兼容性，能用于提示工程、优化模型输出，还在药物探索、肿瘤放疗治疗计划等方面有应用，其意义不仅在于优化性能，还展示了AI自我认知和修正的可能性。相关网站、论文、代码可获取。

来源：机器之心

💡 AI伴写、PC本地大模型、超导量子计算 |直击2024 WAIC

2024 世界人工智能大会在上海开幕，主题为“以共商促共享，以善治促善智”。众多科创板公司亮相，金山办公展示了无需提示词的 WPS AI 伴写功能，展台体验区火爆，该功能尚处灰度测试阶段，将在主题论坛中首次对外发布。星环科技推出人工智能基础平台产品 TKH 及问答大模型无涯·问知，首次部署独立 AI PC 体验区，并与英特尔合作推动与终端厂商适配。海天瑞声认为未来人工智能产业对数据重视度会更高，今年 WAIC 上算法层客户对上游数据领域的关注度明显增加。国盾量子展出千比特超导量子计算测控系统等，中控技术展示了通用控制系统等一系列 AI 技术，萤石网络带来 RK3 家庭助理机器人。

来源：科创板日报

💡 AI热潮推动电力需求！华尔街巨头已意识到：美国电网岌岌可危

电动汽车、加密货币和人工智能带来超高电力需求，使本就脆弱的美国电网面临巨大压力。美国银行数据显示，美国电网由众多机组和长输电线路组成，设备使用年限长，电力需求增长但供应紧张，新增项目少，风能和太阳能难以弥补供需差距。亚马逊已为 AI 收购核电站，甲骨文将投资扩大数据中心容量。电力需求激增致公用事业类股复苏，高盛力推，推荐了四大公用事业股，认为涨势将持续。

来源：财联社

💡 腾讯混元 DiT 文生图大模型开源 6G 小显存版本，一同开源打标模型

腾讯混元文生图大模型（混元 DiT）今日开源小显存版本，仅需 6G 显存即可运行，对个人电脑本地部署的开发者友好，还宣布接入 Kohya 训练界面并升级至 1.2 版本，同时混元文生图打标模型“混元 Captioner”也正式对外开源，支持中英文双语，针对文生图场景优化，可帮助生成数据集，解决了业界通用模型的一些问题。

来源：IT之家

💡 一张照片创造 1 分钟人物视频，商汤发布首个“可控”人物视频生成大模型 Vimi

商汤科技在世界人工智能大会上发布首个“可控”人物视频生成大模型 Vimi，通过一张任意风格的照片就能生成和目标动作一致的人物类视频，支持多种驱动方式，能精准控制人物表情和半身肢体动作，自动生成相符的头发、服饰及背景变化，可稳定生成 1 分钟单镜头视频，将面向 C 端用户开放，用户上传高清人物图片可生成数字分身和写真视频，生成的视频人物动作完整统一，方便创作者进行剪辑和再创作。

来源：IT之家

当前位置：
资讯中心 /快讯/文章详情/

【每日AI快讯】7月5日周五

7月5日周五

💡 首个开源、原生多模态生成大模型：一键生成「煎鸡蛋」图文菜谱

💡 全新TextGrad框架：用GPT-4o作引擎，自动优化端到端任务

💡 AI伴写、PC本地大模型、超导量子计算 |直击2024 WAIC

💡 AI热潮推动电力需求！华尔街巨头已意识到：美国电网岌岌可危

💡 腾讯混元 DiT 文生图大模型开源 6G 小显存版本，一同开源打标模型

💡 一张照片创造 1 分钟人物视频，商汤发布首个“可控”人物视频生成大模型 Vimi

当前位置： 资讯中心 /快讯/文章详情/

【每日AI快讯】7月5日 周五

7月5日 周五

💡 首个开源、原生多模态生成大模型：一键生成 「煎鸡蛋」图文菜谱

💡 全新TextGrad框架：用GPT-4o作引擎，自动优化端到端任务

💡 AI伴写、PC本地大模型、超导量子计算 |直击2024 WAIC

💡 AI热潮推动电力需求！华尔街巨头已意识到：美国电网岌岌可危

💡 腾讯混元 DiT 文生图大模型开源 6G 小显存版本，一同开源打标模型

💡 一张照片创造 1 分钟人物视频，商汤发布首个“可控”人物视频生成大模型 Vimi

当前位置：
资讯中心 /快讯/文章详情/

【每日AI快讯】7月5日周五

7月5日周五

💡 首个开源、原生多模态生成大模型：一键生成「煎鸡蛋」图文菜谱