DeepSeek深夜发布多模态大模型 图像性能跑分力压OpenAI竞品

数据青年小编3个月前 (01-28)热点新闻87

  来源:财联社

  就在华尔街周一紧张评估“DeepSeek风暴”之际,这家中国公司再度甩出新品:在图像生成基准测试中超越OpenAI“文生图”模型DALL-E 3的多模态大模型Janus-Pro,同样也是开源的。

  除夕凌晨钟声敲响前不久,DeepSeek工程师们在“抱抱脸”平台上传了Janus Pro 7B和1.5B模型。这俩模型是对去年10月发布的Janus模型的升级。

  15亿和70亿的参数量,意味着这两个模型具备在消费级电脑上本地运行的潜力。与R1一样,Janus Pro采用MIT许可证,在商用方面没有限制。

  据DeepSeek介绍,Janus-Pro是一个新颖的自回归框架,统一了多模态理解和生成。通过将视觉编码分离为“理解”和“生成”两条路径,同时仍采用单一的Transformer架构进行处理,解决了以往方法的局限性。这种分离不仅缓解了视觉编码器在理解和生成中的角色冲突,还提升了框架的灵活性。

  从报告给出的“跑分”数据来看,在部分文生图基准测试中,Janus-Pro 70亿参数模型表现好于OpenAI的DALL-E 3、Stability AI的Stable Diffusion 3-Meduim等。

  虽然DALL-E 3是OpenAI在2023年发布的一款“老模型”,同时Janus Pro目前只能分析和生成规格较小的图像(384 x 384)。DeepSeek在如此紧凑的模型尺寸中依然展现了令人印象深刻的性能。

  技术报告显示,在视觉生成方面,Janus-Pro通过添加7200万张高质量合成图像,使得在统一预训练阶段真实数据与合成数据的比例达到1:1,实现“更具视觉吸引力和稳定性的图像输出”。在多模态理解的训练数据方面,新模型参考了DeepSeek VL2并增加了大约9000万个样本。

  作为一个多模态模型,Janus-Pro不仅可以“文生图”,同样也能对图片进行描述,识别地标景点(例如杭州的西湖),识别图像中的文字,并能对图片中的知识(例如下图中的“猫和老鼠”蛋糕)进行介绍。

  公司也在报告中,给出了更多图像生成的案例。

“DeepSeek深夜发布多模态大模型 图像性能跑分力压OpenAI竞品” 的相关文章

2024年A股ESG信披率近42%,碳排放数据披露率仅为两成

登录新浪财经APP 搜索【信披】查看更多考评等级   每经记者 黄宗彦    每经编辑 董兴生       2024年,中国ESG领域迎来了政策密集出台与实践加速推进的“大年”。这一年,政策层面动作频频,三大证券交易所、财政部、中国上市公司...

今晚华尔街多空大战:比热辣非农更可怕的 将是滚烫CPI?

  财联社1月15日讯(编辑 潇湘)相较于热辣的非农,华尔街眼下更不想看到的,或许当属滚烫的CPI。而随着上周五的非农已经给美国市场带来了一次不小的“惊吓”,所有人或许都正盯着今晚,美国市场是否会马不停蹄在CPI之夜掀起更为猛烈的惊涛骇浪…...

利空英伟达?国产DeepSeek大模型震动全球AI圈,周末疯狂刷屏,量化私募巨头成功跨界AI!

专题:DeepSeek为何能震动全球AI圈 转自:金融界 周末疯狂刷屏,来自国内量化私募巨头幻方量化的DeepSeek大模型的震动全球AI圈! 近日,DeepSeek公司宣布正式发布最新人工智能模型DeepSeek-R1,并同步开源模型权重...

午盘:纳指下跌近600点 英伟达重挫14.9%

  北京时间28日凌晨,美股周一午盘涨跌不一,科技股大幅下跌,纳指下跌500点。英伟达等AI概念股普遍走低。DeepSeek的低成本高性能AI模型使市场对AI芯片开支产生质疑,并担心科技股股泡沫可能破裂。多家大型科技公司将在本周公布财报。...

DeepSeek下载量登顶全球第一!印度人最爱

  来源:华尔街见闻    上线18天内,DeepSeek的累计下载量已突破1600万次,在覆盖的140个市场中持续保持领先地位。其中,印度用户以15.6%的占比成为DeepSeek最大用户来源。   DeepSeek盘踞下载榜榜首,来自印...

创业板人工智能创历史新高!“159363”暴涨超5%领跑同类!算力硬件大幅反攻,光模块龙头涨超8%

  2月7日,人工智能概念继续上攻,CPO等AI硬件大幅反攻,创业板人工智能指数上涨5%创历史新高!成份股悉数飘红,AI产业三件套“硬件+软件+应用”概念股纷纷上扬。算力硬件方面,新易盛、中际旭创纷纷上涨8%;数据软件方面,首都在线涨停,网...