星空体育平台官网入口-APP下载(2024好运滚滚)🌈系统类型:🐲星空体育平台官网入口最新版-星空体育平台官网入口下载/手机app🌻天天大惊喜礼包🌻,💥领不完的红包雨💥!APP,现在下载,新人送新人礼包。《星空体育平台官网入口》是一款专为儿童量身打造的数学英语学习与训练应用程序。它旨在通过简单易懂的游戏方式,激发孩子学习数学的兴趣,提高孩子的数学能力,并帮助他们建立自信心。嘟嘟数学覆盖了从幼儿园到小学各年级的英语数学知识点,并根据教育部最新数学课程标准进行设计。嘟嘟数学安卓版的界面简洁明了,色彩明快,操作简单易学。小孩子可以加入数学互动游戏,也可以进行基本算术,几何、比例、代数等方面的数学学习,让孩子更有乐趣的学习数学!
⒉₀²₄🌻心想事成🌻星空体育平台官网入口APP下载【首存送彩金🌻💰】🔥支持:64/128bit🔥系统类型:星空体育平台官网入口官方网站-App下载(2024全站)最新版本IOS/安卓通用版V.1.7.7.8支持winall/win7/win10/win11🎁🌻安全平台🌻【下载次数684146】APP,现在下载,新用户还送新人礼包是一款手机音频小说软件,它为用户提供便捷的听书服务,各种各样的小说书籍在这里为你免费提供,用户可以自由的搜索、选择自己喜欢的小说进行收听,给你带来最畅快的听书乐趣。同时,该应用还提供了智能推荐和个性化订阅功能,帮助用户发现更多优质的小说资源和最新的更新内容。
⚡️🌻⚡️①通过浏览器下载
打开“星空体育平台官网入口”手机浏览器(例如百度浏览器)。在搜索框中输入您想要下载的应用的全名,点击下载链接【mobile.xzczwl.cn】网址,下载完成后点击“允许安装”。
⚡️🌻⚡️②使用自带的软件商店
打开“星空体育平台官网入口”的手机自带的“软件商店”(也叫应用商店)。在推荐中选择您想要下载的软件,或者使用搜索功能找到您需要的应用。点击“安装”即可开始下载和安装。
⚡️🌻⚡️③使用下载资源
有时您可以从“星空体育平台官网入口”其他人那里获取已经下载好的应用资源。使用类似百度网盘的工具下载资源。下载完成后,进行安全扫描以确保没有携带不安全病毒,然后点击安装。
⚡️🌻💎第一步:🧸访问星空体育平台官网入口官方网站或可靠的软件下载平台:访问(http://mobile.xzczwl.cn/)确保您从官方网站或者其他可信的软件下载网站获取软件,这可以避免下载到恶意软件。
⚡️🌻💎第二步:🎈选择软件版本:根据您的操作系统(如 Windows、Mac、Linux)选择合适的软件版本。有时候还需要根据系统的位数(32位或64位)来选择星空体育平台官网入口。
⚡️🌻💎第三步:🛸 下载星空体育平台官网入口软件:点击下载链接或按钮开始下载。根据您的浏览器设置,可能会询问您保存位置。
⚡️🌻💎第四步:🛴检查并安装软件: 在安装前,您可以使用 杀毒软件对下载的文件进行扫描,确保星空体育平台官网入口软件安全无恶意代码。 双击下载的安装文件开始安装过程。根据提示完成安装步骤,这可能包括接受许可协议、选择安装位置、配置安装选项等。
⚡️🌻💎第五步:⛩启动软件:安装完成后,通常会在桌面或开始菜单创建软件快捷方式,点击即可启动使用星空体育平台官网入口软件。
⚡️🌻💎第六步:🦋更新和激活(如果需要): 第一次启动星空体育平台官网入口软件时,可能需要联网激活或注册。 检查是否有可用的软件更新,以确保使用的是最新版本,这有助于修复已知的错误和提高软件性能。
💎ωειcοmε💎 星空体育平台官网入口-APP下载(2024好运滚滚)🌈系统类型:🐲星空体育平台官网入口最新版-开元棋下载app正版下载/手机app🌻天天大惊喜礼包🌻,💥领不完的红包雨💥!APP,现在下载,新人送新人礼包。《星空体育平台官网入口》是一款便捷易用、稳定可靠的企业营销管理系统。
⚡️安全认证⚡️星空体育平台官网入口APP下载【龙年龘龘🌻💰】⚡️支持:64/128bit⚡️系统类型:星空体育平台官网入口(2024全站)最新版本IOS/安卓官方入口V8.9.99(安全平台)官方入口一款优秀的小说在线阅读软件,带您尽情享受阅读的乐趣。
🔥8分钟前🔥星空体育平台官网入口APP下载【龙年龘龘🌻💰】⚡️支持:64/128bit⚡️系统类型:星空体育平台官网入口(2024全站)最新版本IOS/安卓官方入口V6.5.43(安全平台)官方入口是一款功能强大、使用方便的手机清洁工具,提供清洁缓存垃圾、隐私信息、卸载残留物、智能管理软件等功能,使您的手机更安全、更方便使用。智能化扫描图片复制,快速清理手机的运行内存,CPU快速冷却,让手机使用更加流畅。
🌈🌈🌈首存就送🌻星空体育平台官网入口APP下载【龙年龘龘🌻💰】⚡️支持:64/128bit⚡️系统类型:星空体育平台官网入口(2024全站)最新版本IOS/安卓官方入口V1.7.33(安全平台)官方入口一款为用户朋友们制作的求职应用程序,很多大学生选择暑假找兼职来充实自己的暑假生活,但大多数企业不选择自由职业者,这个店长直接就业官方版可以帮助用户朋友,找兼职,店主在线发布招聘信息,非常方便快捷,需要找工作的小伙伴快来下载试试吧!
🔥3分钟前🔥星空体育平台官网入口APP下载【龙年龘龘🌻💰】⚡️支持:64/128bit⚡️系统类型:星空体育平台官网入口(2024全站)最新版本IOS/安卓官方入口V3.6.26(安全平台)官方入口一款官方正版的免费听书软件,您可以来这里享受听书的乐趣哦。
🔥10分钟前🔥星空体育平台官网入口APP下载【龙年龘龘🌻💰】⚡️支持:64/128bit⚡️系统类型:星空体育平台官网入口(2024全站)最新版本IOS/安卓官方入口V4.3.55(安全平台)官方入口是一款提供免费电子书阅读服务的应用软件。该应用拥有海量的中英文图书资源,包括小说、散文、诗歌、经济、管理、IT等多个分类,用户可以通过该应用免费阅读图书。书香仓库具有优秀的界面设计和用户体验,支持字体、背景、亮度等多种阅读设置,让用户能够自由地阅读电子书。
🔥欢迎来到🔥星空体育平台官网入口APP下载【龙年龘龘🌻💰】⚡️支持:64/128bit⚡️系统类型:星空体育平台官网入口(2024全站)最新版本IOS/安卓官方入口V3.6.89(安全平台)官方入口是一款完全免费的手机加速和空间清洁软件,支持内存加速、垃圾清洁、隐私粉碎、软件卸载等多种功能。这是第一个毫秒的加速技术,清洗效果超过同行的50%。
星空体育平台官网入口是一款非常好用的小说阅读软件,在这款软件里面为大家准备的小说是非常丰富的。
【央视“科晚”来了!比亚迪王传福、科大讯飞刘庆峰亮相发声!******
12月29日,中央广播电视总台首次推出“跨年科技秀”——《中国科技创新盛典》(总台“科晚”)。
作为科技企业的杰出代表,比亚迪股份有限公司董事长兼总裁王传福与科大讯飞董事长刘庆峰受邀出席此次“科晚”。他们的参与不仅彰显了科技企业在国家创新体系中的重要地位,也为晚会增添了更多光彩与深度。
2023年,我国首次成为世界第一大汽车出口国。2024年,我国新能源汽车年产量首次突破了1000万辆,同时也是全球首个新能源汽车年产达1000万辆的国家。
中国新能源汽车的高速发展,离不开核心技术的创新和突破。据统计,中国新能源汽车的专利公开量已经占全球的70%。越来越多的中国品牌依靠技术链产业链的优势,在全球竞争中掌握了新能源汽车领域的话语权。
中国新能源汽车产业代表王传福说:“几百年前,海上的丝绸之路,为大家带去了茶叶、丝绸、瓷器,促进了文明的交流和融合。几百年后的今天,沿着这条新航线再次出发,这一次我们带去的是更具有创新精神和科技含量的现代新能源的产品,我们正在开启中国新能源汽车的‘大航海时代’。”
人工智能产业代表刘庆峰则在央视“科晚”为我们分享了具体而生动的案例,诠释AI技术的应用场景。
其中,机器狗小汐现场表演“闻声识危险”。它可以迅速辨别比蚊子叫声还小的声音,从而辅助排查工厂管道泄漏等隐患。
AI+教育黑板,则能够自动变成了能旋转、能“解剖”的标准几何图形,让教学过程更直观生动。
刘庆峰说:“人类从来就没有停止过进化,科技的发展就是人类进化的一种全新的方式。我们的目标就是希望让人工智能赋能每个人,让每一个普通人都能够站在人工智能肩膀上成为更好的自己。”
综合自央视新闻
责编:叶舒筠
证券时报各平台所有原创内容,未经书面授权,任何单位及个人不得转载。我社保留追究相关行为主体法律责任的权利。
END
" Type="normal"@@-->
]article_adlist-->】【2024年零跑汽车累计新车交付近30万辆,2025年冲击50万辆目标******
北京商报讯(记者 刘晓梦)1月1日,零跑汽车发布的数据显示,2024年累计交付新车近30万辆,同比增长100%,超额完成年度销量目标。其中,2024年12月交付4.25万辆,同比增长128%。
零跑汽车方面表示,2025年将向50万辆新目标发起冲击。
】【刷屏的DeepSeek******
每经记者 郑雨航 每经编辑 高涵 兰素英
“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。
12月26日,深度求索官方微信公众号推文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。
公众号推文是这样描述的:DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
不过,广发证券发布的测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。
更重要的是,深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3,仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
消息一出,引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道:“DeepSeek-V3让在有限算力预算上进行模型预训练这件事变得容易。DeepSeek-V3看起来比Llama-3-405B更强,训练消耗的算力却仅为后者的1/11。”
然而,在使用过程中,《每日经济新闻》记者发现,DeepSeek-V3竟然声称自己是ChatGPT。一时间,“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。
对此,《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得改进。”
每经记者向深度求索公司发出采访请求,截至发稿,尚未收到回复。
针对DeepSeek-V3,独立评测网站Artificial Anlaysis就关键指标——包括质量、价格、性能(每秒生成的Token数以及首个Token生成时间)、上下文窗口等多方面——与其他人工智能模型进行对比,最终得出以下结论。
质量:DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。
价格:DeepSeek-V3比平均价格更便宜,每100万个Token的价格为0.48美元。其中,输入Token价格为每100万个Token 0.27美元,输出Token价格为每100万个Token1.10 美元。
速度:DeepSeek-V3比平均速度慢,其输出速度为每秒87.5个Token。
延迟:DeepSeek-V3与平均水平相比延迟更高,接收首个Token(即首字响应时间)需要1.14秒。
上下文窗口:DeepSeek-V3的上下文窗口比平均水平小,其上下文窗口为13万个Token。
最终Artificial Anlaysis得出结论:
“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型,并且击败了OpenAI的GPT-4o(8月),并接近Anthropic的Claude 3.5 Sonnet(10月)。
DeepSeek-V3的人工智能分析质量指数得分为80,领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B,DeepSeek现在是中国的AI领先者。”
12月29日广发证券计算机行业分析师发布研报称:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”
测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面,DeepSeek-V3并未展现出明显优于其他大模型之处。
除了能力,DeepSeek-V3最让业内惊讶的是它的低价格和低成本。
《每日经济新闻》记者注意到,亚马逊Claude 3.5 Sonnet模型的API价格为每百万输入tokens 3美元、输出15美元。也就是说,即便是不按照优惠价格,DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。
相对低廉的价格,得益于DeepSeek-V3的训练成本控制,深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型,花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
DeepSeek“AI界拼多多”也由此得名。
DeepSeek-V3通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。在大规模MoE模型的训练中,DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施,显著降低了训练成本,以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明,模型效果不仅依赖于算力投入,即使在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。
广发证券分析称,DeepSeek-V3算力成本降低的原因有两点。
第一,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。
第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。
科技媒体Maginative的创始人兼主编Chris McKay对此评论称,对于人工智能行业来说,DeepSeek-V3代表了一种潜在的范式转变,即大型语言模型的开发方式。这一成就表明,通过巧妙的工程和高效的训练方法,可能无需以前认为必需的庞大计算资源,就能实现人工智能的前沿能力。
他还表示,DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小,公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和价值主张。
不过,广发证券分析师认为,算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后,有望驱动相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中,推理过程涉及到对大量实时数据的快速处理和决策,仍然需要强大的算力支持。
在DeepSeek-V3刷屏之际,有一个bug也引发热议。
在试用DeepSeek-V3过程中,《每日经济新闻》记者在对话框中询问“你是什么模型”时,它给出了一个令人诧异的回答:“我是一个名为ChatGPT的AI语言模型,由OpenAl开发。”此外,它还补充说明,该模型是“基于GPT-4架构”。
国内外很多用户也都反映了这一现象。而且,12月27日,Sam Altman发了一个帖文,外媒指出,Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。
于是,有人就开始质疑:DeepSeek-V3是否是在ChatGPT的输出基础上训练的?为此,《每日经济新闻》向深度求索发出采访请求。截至发稿,尚未收到回复。
针对这种情况产生的原因,每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示,他对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得了改进。”
TechCrunch则猜测称,深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的,那么该模型可能已经记住了GPT-4的一些输出,现在正在逐字反刍它们。”
“显然,该模型(DeepSeek-V3)可能在某些时候看到了ChatGPT的原始反应,但目前尚不清楚从哪里看到的,”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出,“这也可能是个‘意外’。”他进一步解释称,根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响,因为它可能导致幻觉和误导性答案。
不过,DeepSeek-V3也并非是第一个错误识别自己的模型,谷歌的Gemini等有时也会声称是竞争模型。例如,Gemini在普通话提示下称自己是百度的文心一言聊天机器人。
造成这种情况的原因可能在于,AI公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计,到2026年,90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。
“互联网数据现在充斥着AI输出,”非营利组织AI Now Institute的首席AI科学家Khlaaf表示,基于此,如果DeepSeek部分使用了OpenAI模型进行提炼数据,也不足为奇。
】【绝区零紧急追捕任务应该怎么快速完成 任务完成指南******
绝区零紧急追捕任务应该如何快速完成?
1、地点:港口区域。
2、首先玩家需要根据坐标前往布林格的地点,开始后就会进入剧情对话。
3、然后需要将前方的怪物击败,进行两段战斗后根据指引前进就会发现箱子。
4、过完动画后就能开启了,接着继续追踪,到达后开启清怪。
5、之后完后下方的对话,结束后继续根据指引前进。
6、击败路途中的小怪,一大段剧情结束后再完成下方战斗即可。
绝区零新手怎么玩
一、战斗技巧
1. 怪物在发出黄色光芒时,按下空格键可以切换攻击方式并施展振刀技能,而当其发出红光时,则需快速闪避以触发极限闪避动作(需注意,红光状态下的振刀操作不可用)。
2. e技能为战斗技巧,即便没有高亮显示也可以进行释放,高亮状态下则能施展强化过的战技。
3. 针对像格莉丝这样的远程群攻角色,玩家需有意识地拉怪,通过普通攻击和精准的走位,将怪物聚集在一起。这种策略的精髓在于意识,具体操作则需在正式游戏中逐步掌握。
二、邦布改装
所有金色、紫色和蓝色格子大小均等,如上图所示。因此,最佳组合方案应为一格金色、一格紫色、再一格蓝色。这里提供三种搭配方案以供参考:
1. 传统流派选择金色暴击、紫色爆伤和蓝色攻击。
3. 还有一种方案是利用系统赠送的金色异常效率,搭配紫色穿透和蓝色攻击。据说第四个币可以换取此特殊金色属性。以上方案仅供参考,实际优劣需以正式服务器的数值情况为准。在前期升级过程中,建议使用蓝色材料进行邦布升级,因为改造部件的兑换需要用到紫色升级材料。
金色构件需要60份紫色素材的加持,而紫色构件则是由15份紫色材料合成的。蓝色攻击部件是赠送的部件。令人欣慰的是,紫色邦布升级材料并不难寻,通过不断挑战空洞的肉鸽玩法,如同在崩铁中体验模拟宇宙一般,你可以轻松地获得它。一局游戏大约持续在20~30分钟之间。如果你不使用体力罐子,完成正式服的所有主线和支线后,你的等级大概会被卡在28级左右。解锁新的空洞需要达到30级,而解锁新的主线则需要32级。当你挑战适合你等级的空洞时,一局游戏结束后你大约能获得10个紫色材料。
三、体力规划
1、关于材料获取的建议。推荐优先收集角色突破所需的材料,以及技能进阶所需的材料和武器突破素材。绝区零30级是一个重要的节点,虽然突破后的副本掉落有所变化,但紫色圣遗物副本的掉落数量从0至1提升到1至2,其他方面的变化并不显著。
2、关于圣遗物的获取策略。不建议过度追求紫色圣遗物,因为后期很可能需要替换。同时,圣遗物升级材料非常珍贵,因此建议保存体力资源,等待后期能够进行更高效的刷取时再使用。
四、前期驱动盘
1、如果你想挑战高难关卡、或是感到开荒困难,可以使用蓝色驱动盘升级材料,去对门录像店抽取紫色驱动盘。
2、但建议在30级突破之后再刷取圣遗物,因为届时可以指定驱动盘套装up。
3、紫色驱动盘做任务也会送一部分,可以蓝色紫色混搭,凑套装效果混一下,后期再换。
五、角色培养建议
四星可练:
1. 妮可:近战专家,绝对是必备之选。她擅长聚集小型怪物,为战斗带来便利。但请注意,她对于大型怪物的牵引效果并不显著。
2. 本(熊):此角色数值表现卓越,值得投入资源进行培养。若想选择11号角色,他将是你的不二之选。同时,他与深渊的双火共鸣搭配,效果显著。
3. 苍角:同样地,他拥有极高的数值,不仅具备群攻能力,还带有控制技能和微弱的聚怪效果。即使装备一般,他也能造成可观的伤害。与鲨鱼妹组队,将会有意想不到的战斗效果。
4. 安比:五星以下的角色中,没有比他更适合练习的了。目前暂不推荐更多角色,因为游戏中的变数较大。仅提供以上几位角色的练习思路。
后期队伍配置建议为:一人为击破手,一人为支援手,一人为主攻手;或一人负责异常状态,一人负责支援,一人为主攻手。击破手负责削韧,支援手负责辅助,主攻手则承担主要输出任务,而异常状态角色则类似于副攻手。
】【刷屏的DeepSeek******
每经记者 郑雨航 每经编辑 高涵 兰素英
“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。
12月26日,深度求索官方微信公众号推文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。
公众号推文是这样描述的:DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
不过,广发证券发布的测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。
更重要的是,深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3,仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
消息一出,引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道:“DeepSeek-V3让在有限算力预算上进行模型预训练这件事变得容易。DeepSeek-V3看起来比Llama-3-405B更强,训练消耗的算力却仅为后者的1/11。”
然而,在使用过程中,《每日经济新闻》记者发现,DeepSeek-V3竟然声称自己是ChatGPT。一时间,“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。
对此,《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得改进。”
每经记者向深度求索公司发出采访请求,截至发稿,尚未收到回复。
针对DeepSeek-V3,独立评测网站Artificial Anlaysis就关键指标——包括质量、价格、性能(每秒生成的Token数以及首个Token生成时间)、上下文窗口等多方面——与其他人工智能模型进行对比,最终得出以下结论。
质量:DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。
价格:DeepSeek-V3比平均价格更便宜,每100万个Token的价格为0.48美元。其中,输入Token价格为每100万个Token 0.27美元,输出Token价格为每100万个Token1.10 美元。
速度:DeepSeek-V3比平均速度慢,其输出速度为每秒87.5个Token。
延迟:DeepSeek-V3与平均水平相比延迟更高,接收首个Token(即首字响应时间)需要1.14秒。
上下文窗口:DeepSeek-V3的上下文窗口比平均水平小,其上下文窗口为13万个Token。
最终Artificial Anlaysis得出结论:
“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型,并且击败了OpenAI的GPT-4o(8月),并接近Anthropic的Claude 3.5 Sonnet(10月)。
DeepSeek-V3的人工智能分析质量指数得分为80,领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B,DeepSeek现在是中国的AI领先者。”
12月29日广发证券计算机行业分析师发布研报称:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”
测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面,DeepSeek-V3并未展现出明显优于其他大模型之处。
除了能力,DeepSeek-V3最让业内惊讶的是它的低价格和低成本。
《每日经济新闻》记者注意到,亚马逊Claude 3.5 Sonnet模型的API价格为每百万输入tokens 3美元、输出15美元。也就是说,即便是不按照优惠价格,DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。
相对低廉的价格,得益于DeepSeek-V3的训练成本控制,深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型,花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
DeepSeek“AI界拼多多”也由此得名。
DeepSeek-V3通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。在大规模MoE模型的训练中,DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施,显著降低了训练成本,以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明,模型效果不仅依赖于算力投入,即使在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。
广发证券分析称,DeepSeek-V3算力成本降低的原因有两点。
第一,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。
第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。
科技媒体Maginative的创始人兼主编Chris McKay对此评论称,对于人工智能行业来说,DeepSeek-V3代表了一种潜在的范式转变,即大型语言模型的开发方式。这一成就表明,通过巧妙的工程和高效的训练方法,可能无需以前认为必需的庞大计算资源,就能实现人工智能的前沿能力。
他还表示,DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小,公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和价值主张。
不过,广发证券分析师认为,算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后,有望驱动相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中,推理过程涉及到对大量实时数据的快速处理和决策,仍然需要强大的算力支持。
在DeepSeek-V3刷屏之际,有一个bug也引发热议。
在试用DeepSeek-V3过程中,《每日经济新闻》记者在对话框中询问“你是什么模型”时,它给出了一个令人诧异的回答:“我是一个名为ChatGPT的AI语言模型,由OpenAl开发。”此外,它还补充说明,该模型是“基于GPT-4架构”。
国内外很多用户也都反映了这一现象。而且,12月27日,Sam Altman发了一个帖文,外媒指出,Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。
于是,有人就开始质疑:DeepSeek-V3是否是在ChatGPT的输出基础上训练的?为此,《每日经济新闻》向深度求索发出采访请求。截至发稿,尚未收到回复。
针对这种情况产生的原因,每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示,他对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得了改进。”
TechCrunch则猜测称,深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的,那么该模型可能已经记住了GPT-4的一些输出,现在正在逐字反刍它们。”
“显然,该模型(DeepSeek-V3)可能在某些时候看到了ChatGPT的原始反应,但目前尚不清楚从哪里看到的,”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出,“这也可能是个‘意外’。”他进一步解释称,根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响,因为它可能导致幻觉和误导性答案。
不过,DeepSeek-V3也并非是第一个错误识别自己的模型,谷歌的Gemini等有时也会声称是竞争模型。例如,Gemini在普通话提示下称自己是百度的文心一言聊天机器人。
造成这种情况的原因可能在于,AI公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计,到2026年,90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。
“互联网数据现在充斥着AI输出,”非营利组织AI Now Institute的首席AI科学家Khlaaf表示,基于此,如果DeepSeek部分使用了OpenAI模型进行提炼数据,也不足为奇。
】星空体育平台官网入口是汇集了各大体育赛事的经典回顾,用户可以在这里重温历史上的精彩比赛。平台提供详细的赛事介绍、比赛视频和数据分析,让用户全面了解每一场经典比赛的背景和经过。无论是世界杯、奥运会还是其他重要赛事,都能在这里找到详细的回顾内容。
星空体育平台官网入口一款为用户朋友们打造的出差助手app,能够很好的帮助用户朋友们查看国内外各种出行方式的票,支持在线预定,还能够预约酒店,非常方便好用!
星空体育平台官网入口是一款以智能、内容为核心,与银行、保险公司、基金公司等金融机构合作,为用户提供专业、安全的个人理财服务。
星空体育平台官网入口是一款非常受欢迎的漫画阅读应用程序,提供了数万本优质的国内外漫画资源。应用程序拥有丰富的漫画类型和题材,包括热门日本漫画、国产漫画、轻小说等。用户可以通过应用程序进行在线、离线漫画阅读、漫画订阅、发表评论等操作,同时还支持社交分享和订阅提醒等功能。
每个人的天下衣橱里都缺一件衣服哪一件?下一件!
此前我们正式官宣了《天下》手游×荒野行动的手游少侠联动开启,今天又带来了新情报!联动ng28相信品牌的力量注册入口有道是荒野好兄弟的时装就是香本次联动我们携手开展【衣橱共享计划】。
从本周开始,行动将有多款联动时装陆续亮相大荒,开展是衣橱高贵大气的华丽晚礼服、简洁大方的共享随性穿搭、还是计划ng28相信品牌的力量注册入口舒适宽松的运动休闲款?少侠们最想联动哪种风格的时装呢?大家还可以前往各大官方平台留言,告诉我们你看上了好兄弟的天下哪套新衣,或许接下来你的手游少侠愿望就能实现哦!
最近雨下个不停,联动心情也难免emo了起来,荒野不如来吃块小蛋糕甜一下吧~!行动共享衣橱计划的开展首套联动时装【甜心烘焙】即将上线,即刻化身烘焙大师,可口甜品为你横扫一切烦恼,下面就一起来享受甜点盛宴吧!
甜心烘焙·女
少女将金发精心编成两股麻花辫,头戴蛋糕小帽【烘焙礼帽】,毛茸茸的小熊耳朵发箍更显得软萌。
她身穿一身蕾丝蓬蓬裙,褐色丝带系成领结,白色长筒手套更衬手臂纤细,红白棕三色条纹蝴蝶结系点缀在腰间,中间的小熊脸色微微泛红,浅黄色的围裙处印着的小熊爪印煞是可爱!衣服背面是镂空设计,辅以金扣装点,身后圆滚滚的尾巴手感软糯,脚踩一双高跟圆头皮鞋,有这样的甜心美眉为我服务,手上的小蛋糕瞬间都不香了!
(最终展示以游戏内实装效果为准)
甜心烘焙·男
男装头戴小熊头套,耳朵别出心裁地做成了饼干形状,看上去十分有趣,头套上还别着一顶小礼帽,更添了几分优雅!
白色立领衬衫打底,红色领结搭配同色马甲,外搭一件深褐色外套,胸前和领口处都设计了菱格纹样,自带高级复古感,身后咖啡色渐变披风随风飘扬,下身着一条卡其色长裤,右腿绑了两根皮质腿环,黑色高筒皮靴上用金属条纹装饰,如此帅气的小熊大厨,还没开吃就已经把小天的心俘获了!
(最终展示以游戏内实装效果为准)
全新时装【甜心烘焙】将于本周三更新后上线,快换上这套美味可口的时装与好友们同游大荒吧!
更多精美联动时装将在后续陆续送达,如果少侠还想在大荒穿上好兄弟的其他时装,别忘了在各大官方平台留言告诉我们呦!
战意归宗,故友同行,《天下》手游重生服务器“斗转乾坤”燃情上线,外观、数值可继承,直升手册极速养成,为你创造最佳回归时机!新服巅峰赛事激情开战,看谁率先问鼎天下之巅!全新无双城“势力狩猎”玩法全服开启,群雄逐鹿重燃热血,一决高下!灵兽来袭,派对开启,全新动物派对系列外观趣味上线,邀你一起萌动大荒!