DeepSeek 再次来袭:其新开源 AI 模型能否击败 DALL-E 3?

2025年01月29日 12:03:14 加密货币 互联网
DeepSeek 再次来袭:其新开源 AI 模型能否击败 DALL-E 3?

DeepSeek,这家最近颠覆了行业对行业发展成本假设的中国AI实验室,发布了一系列新的开源多模态AI模型,据称在关键基准测试中优于OpenAI的DALL-E 3。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

被称为Janus Pro的模型,参数从10亿(极小)到70亿(接近SD 3.5L的规模)不等,可立即在机器学习和数据科学中心Huggingface上下载。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

最大版本Janus Pro 7B不仅击败了OpenAI的DALL-E 3,还击败了其他领先模型如PixArt-Alpha、Emu3-Gen和SDXL,在行业基准GenEval和DPG-Bench上表现出色,这是根据DeepSeek AI分享的信息。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

该模型的发布恰逢DeepSeek凭借其R1语言模型引发关注,该模型在仅耗资500万美元的情况下就匹配了GPT-4的能力,引发了关于AI行业当前状况的激烈辩论。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

这家中国初创公司的产品还引发了行业范围内的担忧,担心它可能颠覆现有企业,并打击主要芯片制造商Nvidia的增长轨迹,Nvidia在周一遭遇了有史以来最大单日市值损失。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

DeepSeek的Janus Pro模型使用了该公司所谓的"新型自回归框架",将视觉编码分解为单独的通道,同时保持单一的统一变换架构。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

这种设计使模型能够分析图像并以768x768分辨率生成图像。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

DeepSeek在其发布文档中声称:"Janus Pro超越了以前的统一模型,并与专项模型的性能相匹配或超越。Janus Pro的简单性、高灵活性和有效性使其成为下一代统一多模态模型的强有力候选。"udn币学堂 - 比特币圈新手入门基础知识教程科普平台

与DeepSeek R1不同,该公司没有发布该模型的完整白皮书,但发布了其技术文档,并免费提供了该模型供立即下载——继续其开源发布的做法,这与美国科技巨头的封闭专有方法形成鲜明对比。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

那么,我们的评论是什么?这个模型非常通用。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

但是,不要期望它能取代你最喜欢的任何专业模型。它可以生成文本、分析图像和生成照片,但与只擅长其中一项的模型相比,它最多只能与之持平。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

请注意,目前没有直接使用传统UI运行它的方法——Comfy、A1111、Focus和Draw Things目前都与之不兼容。这意味着在本地运行该模型有些不太实用,需要通过终端中的文本命令进行。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

不过,一些Hugginface用户已经创建了可以尝试该模型的空间。DeepSeek的官方空间目前不可用,所以我们建议使用NeuroSenko的免费空间来尝试Janus 7b。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

请注意您的操作,因为有些标题可能会让人误解。例如,AP123运营的空间声称运行的是Janus Pro 7b,但实际上运行的是Janus Pro 1.5b——这可能会让您浪费大量时间测试模型并得到糟糕的结果。相信我们,我们就是这样经历的。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

该模型擅长视觉理解,可以准确描述照片中的元素。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

它显示了良好的空间感和不同物体之间的关系。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

它也比LlaVa(最流行的开源视觉模型)更准确,能够提供更准确的场景描述,并根据视觉提示与用户互动。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

但是,它仍然不如GPT Vision,特别是在需要逻辑或超越照片显示的简单分析的任务中。例如,我们让模型分析这张照片并解释其含义。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

模型回答说,"这张图像似乎是一幅幽默的卡通画,描绘了一个女人正在舔一个男孩附着的长长的红色舌头的场景。"udn币学堂 - 比特币圈新手入门基础知识教程科普平台

它总结说,"整体来看,这幅图像的氛围似乎是轻松愉快的,可能暗示了一种女人正在进行恶作剧或戏弄行为的场景。"udn币学堂 - 比特币圈新手入门基础知识教程科普平台

在需要超越简单描述的推理的情况下,该模型大多数时候都会失败。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

相比之下,ChatGPT例如真正理解了图像背后的含义:"这个隐喻暗示母亲的态度、言语或价值观直接影响着孩子的行为,尤其是在欺负或歧视等负面方面,"它得出了准确的结论。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

图像生成看起来很强大和相对准确,但需要仔细的提示才能获得好的结果。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

DeepSeek声称Janus Pro击败了SD 1.5、SDXL和Pixart Alpha,但需要强调这必须是与基础非微调模型进行的比较。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

换句话说,公平的比较是在当前可用的最差版本之间,因为可以说,没有人会在有数百个微调版本可以与即使是最先进的模型如Flux或Stable Diffusion 3.5相媲美时,还使用基础SD 1.5来生成艺术。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

所以,生成的质量并不令人印象深刻,但似乎比SD1.5或SDXL刚推出时的输出要好。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

例如,这里是Janus和SDXL为提示"一只可爱可爱的棕眼小狐狸,背景是迷人的秋叶,不朽的,毛茸茸的,闪亮的鬃毛,花瓣,仙女,高度详细,逼真,电影感,自然色彩"生成的图像的对比。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

Janus在理解核心概念方面胜过SDXL:它能生成一只小狐狸,而不是SDXL生成的成年狐狸。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

它也更好地理解了逼真的风格,其他元素(毛茸茸的、电影感)也都存在。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

但是,SDXL生成的图像更清晰,尽管没有完全遵循提示。整体质量更好,眼睛更逼真,细节也更容易看出。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

其他生成中也呈现了这种模式:理解提示不错,但执行较差,生成的图像模糊不清,与当前最先进的图像生成器相比显得过时。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

但是,需要注意的是,Janus是一个多模态LLM,能够生成文本对话、分析图像和生成图像。而Flux、SDXL和其他模型都不是为这些任务而构建的。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

所以,Janus在核心上更加通用,只是在任何一个特定任务上都不如专门的模型出色。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

作为开源项目,Janus作为生成式AI爱好者中的领导者的未来,将取决于一系列旨在改善这些方面的更新。udn币学堂 - 比特币圈新手入门基础知识教程科普平台

由Josh Quittner和Sebastian Sinclair编辑udn币学堂 - 比特币圈新手入门基础知识教程科普平台

欧易

欧易OKX交易所

全球三大交易所之一,注册领取价值6,0000元数字货币盲盒

APP下载    官网注册
最新区块链知识
Ice Open Network将于明天上线ION主网

Ice Open Network将于明天上线ION主网

PANews 1月28日消息,据Ice Open Network官方消息,ION主网将于明天正式上线,并计划推出一站式应用,集成多资产钱包、抗审查社交网络和端到端加密消息服务。ION的核心功能包括:ION

2025年01月29日 0阅读
特朗普上任首周签署三项加密货币和 AI 相关行政命令

特朗普上任首周签署三项加密货币和 AI 相关行政命令

火星财经消息,据 Cointelegraph 报道,特朗普总统上任第一周签署了三项与加密货币和人工智能相关的行政命令:消除美国在人工智能领域占据领导地位的障碍;加强美国在数字金融技术

2025年01月29日 0阅读
Crypto 交易所 2024 年度报告:Top10 交易所年交易量同比增长近一倍

Crypto 交易所 2024 年度报告:Top10 交易所年交易量同比增长近一倍

作者:TI Research文章来源:TechFlow深潮2024 年可谓是跌宕起伏。在过去的一年中,年初 BTC 现货 ETF 获批带来的希望之火并没有如想象中熊熊燃烧,市场在短暂走高之后又快速回调。

2025年01月29日 0阅读
2025年将是DeFAI的黄金年,你需要知道的五大蓝筹代币

2025年将是DeFAI的黄金年,你需要知道的五大蓝筹代币

编者按:DeFAI 正在快速发展,吸引了大量投资者关注。通过选择 DeFAI 蓝筹代币,如 ANON、MODE、Griffain、Virtuals 和 Cod3x,投资者可以获得广泛的市场曝光,抓住其增长潜力。与传

2025年01月29日 0阅读
亚利桑那州参议院委员会批准战略比特币储备法案

亚利桑那州参议院委员会批准战略比特币储备法案

Odaily星球日报讯 美国亚利桑那州立法者提出了一项法案,允许公共资金投资比特币和其他数字资产,该州参议院财政委员会于 1 月 27 日以 5 比 2 的投票结果批准了该法案。由 Wen

2025年01月29日 0阅读
特朗普浮亏2000万?他要么不通过这种方式赚钱,要么是傻

特朗普浮亏2000万?他要么不通过这种方式赚钱,要么是傻

既然帮助特朗普管理资金的团队一定是世界上最聪明,也是最有资源和消息最灵通的人,但特朗普目前全部的投资标的都出于亏损状态,很多人还通过特朗普大总统也被套麻了来嘲讽和安慰

2025年01月29日 0阅读
特朗普加密项目 WLFI 今日累计买入价值 188 万美元 MOVE

特朗普加密项目 WLFI 今日累计买入价值 188 万美元 MOVE

Foresight News 消息,据 Arkham 监测,特朗普加密项目 WLFI 过去 30 分钟内通过四笔交易,今日累计买入价值 188 万美元 MOVE。

2025年01月29日 0阅读
特朗普加密项目WLFI持仓浮亏超2000万美元,以太坊持仓浮亏达1376万美元

特朗普加密项目WLFI持仓浮亏超2000万美元,以太坊持仓浮亏达1376万美元

火星财经消息,1 月 29 日,据 EmberCN 监测,目前特朗普加密项目 WLFI 总共花费了 2.87 亿美元配置购买了 8 种代币,现在全部处于浮亏状态,总体浮亏达 2065 万美元 (-7%)。 · 亏损

2025年01月29日 0阅读
The Daily Degen- 2025 年 1 月 27 日

The Daily Degen- 2025 年 1 月 27 日

周一快乐,朋友们!今天早上真是相当精彩!让我们开始吧!一如既往,统计数据/警报等在顶部,推文/新闻/链接/视频等在底部...所有推文都是超链接,只需点击即可在Twitter上查看!市

2025年01月28日 0阅读
DeepSeek 恐慌消退,比特币反弹

DeepSeek 恐慌消退,比特币反弹

加密货币市场周一晚间反弹,比特币一度超过102,000美元,此前受到人工智能公司DeepSeek突破性公告引发的周末波动。比特币目前徘徊在102,000美元以上,但仍比1月20日创下的历史

2025年01月28日 0阅读
猜你感兴趣
CHZ币今日实时价格行情(CHZ币最新消息)

CHZ币今日实时价格行情(CHZ币最新消息)

CHZ币今日实时价格行情(CHZ币最新消息)CHZ币是一种基于区块链技术的加密数字货币,也是一种用于体育和娱乐行业的通用通证。CHZ币的发行旨在为体育粉丝提供更好的参与和互动体验

2024年07月24日 209阅读
QNT币发行总量是多少?

QNT币发行总量是多少?

QNT币发行总量是多少?QNT币是一种加密货币,属于Quant Network项目的代币。Quant Network是一个专注于实现区块链互操作性的项目,提供了一种全新的网络协议——Overledger。Over

2024年07月24日 118阅读
PECland (PECL )币今日实时价格行情最新消息2024年04月07日

PECland (PECL )币今日实时价格行情最新消息2024年04月07日

截止至2024年04月07日,PECland (PECL )今日实时最新价格是0.00006431美元,约等于人民币0.000465元。PECland (PECL )24H最高价$0.00006499美元,24H最低价$0.00006381美元,24H成

2024年07月24日 184阅读
如何区别比特币交易所的

如何区别比特币交易所的

如何区别比特币交易所?随着比特币市场的不断发展,越来越多的交易所涌现,让投资者无从选择。如何在众多的比特币交易所中区别它们之间的不同,选择一个合适的交易所成为了投资者们

2024年07月24日 399阅读
BTC突破63500美元

BTC突破63500美元

报道,行情显示,BTC突破63500美元,现报63506.16美元,日内跌幅达到1.16%,行情波动较大,请做好风险控制。

2024年07月24日 0阅读
以太坊节点有多少个

以太坊节点有多少个

以太坊节点有多少个?以太坊是目前最流行的智能合约平台之一,它的分布式网络由许多节点组成。节点是以太坊网络中的计算机或服务器,它们运行以太坊协议并与其他节点通信。那么,以

2024年07月24日 163阅读