DeepSeek 博客
DeepSeek:中国AI新星的崛起与争议——谷歌Gemini数据疑云笼罩
人工智能领域正上演着一场激烈的技术竞赛,而随之而来的数据伦理与知识产权问题也日益凸显。近日,中国AI实验室DeepSeek发布了其R1推理AI模型的最新版本,这款模型在数学和编码基准测试中表现出众。然…
深度好文
小米正式发布AI模型,与中国科技巨头竞争
小米公司(Xiaomi Corp.)近日正式发布了其自家的开源AI模型——MiMo,正式加入了中国技术巨头们在人工智能(AI)领域的竞赛。随着中国政府大力支持AI技术的研发,这一举措标志着小米进军日益…
DSU研究团队深入分析DeepSeek:数据隐私的隐患和潜在风险
在人工智能技术快速发展的今天,DeepSeek作为一款新兴的语言模型,迅速吸引了全球的注意。其最大的卖点之一是比同类应用程序运行更快,这使得它在发布初期便获得了大量的关注。然而,随着其使用的普及,也开…
DeepSeek-V3:高效能与低成本的完美结合
DeepSeek-V3采用了混合专家(MoE)架构,拥有6710亿个参数,但每个token仅激活370亿参数,极大地提高了计算效率。通过引入多头潜在注意力(MLA)机制和辅助损失自由的负载均衡策略,D…
DeepSeek 开源模型:性能、许可与合规性全解析
在人工智能技术迅猛发展的今天,开源大模型的出现为开发者和研究人员提供了前所未有的机会。DeepSeek 作为其中的佼佼者,其开源策略、性能表现以及合规性问题备受关注。本文将深入解析 DeepSeek …
DeepSeek颠覆AI办公效率:解析其如何实现217%效率跃升
在人工智能应用持续深化的今天,办公场景成为AI落地最快、反馈最直观的关键领域。作为AI办公自动化中的创新典范,DeepSeek 正在以颠覆性的效率提升推动职场变革。根据最新行业数据显示,采用 Deep…
DeepSeek 推出原生稀疏注意力(NSA):长文本处理的高效解决方案
2025年2月18日,DeepSeek 团队发布了一篇题为《原生稀疏注意力:高效长文本建模的新范式》的论文,提出了原生稀疏注意力(NSA)机制。该机制通过动态分层稀疏策略,结合粗粒度的Token压缩和…
2025春季Poe大模型报告解读——DeepSeek使用率腰斩,快手可灵视频模型崛起
2025年春季,全球大模型整合应用平台Poe发布了最新的AI模型使用趋势报告。报告显示,曾经风头无两的中国推理模型代表DeepSeek-R1,使用率较2月份峰值下降了50%以上,当前虽仍位居推理模型第…
在ZUBoard上实现边缘AI推理:使用DeepSeek模型进行本地部署
随着人工智能(AI)和大规模语言模型(LLM)的飞速发展,AI应用场景不断扩展,越来越多的企业和开发者开始关注如何在边缘设备上高效部署AI模型。在许多情况下,特别是在数据隐私、成本或需要离线访问的场景…
DeepSeek赋能中国战斗机设计:人工智能引领航空工业新纪元
近年来,人工智能技术在全球范围内迅速发展,成为推动各行业变革的重要力量。在中国,DeepSeek作为自主研发的先进大语言模型,正在逐步应用于航空航天等高科技领域。近日,沈阳飞机设计研究所的首席设计师王…
DeepSeek:重构信息消费与产业竞争格局
随着人工智能技术的迅猛发展,全球信息消费领域正在经历一场深刻的变革。杭州深度求索人工智能基础技术研究有限公司(DeepSeek)发布的DeepSeek-R1大模型,凭借其创新的MoE架构、超低训练成本…
DeepSeek发布紧急招聘信息,迎接AI产品化新时代
中国AI初创公司DeepSeek近期发布了急需招聘产品管理和设计岗位的通知,表明其正在积极转向AI技术的商业化应用。自2023年成立以来,DeepSeek凭借其低成本高效能的推理模型R1在全球AI市场…
DeepSeek R2:下一代AI大模型即将发布,技术亮点全解析
三个月前,在春节期间,DeepSeek R1的发布迅速吸引了科技圈的关注,这一款大模型凭借其卓越的性能和性价比,突破了AI技术的多个瓶颈,引发了全球范围内的热议。时至今日,随着五一假期的临近,Deep…
DeepSeek锐评:新能源汽车行业本质已是资本博弈,技术理想早被抛却!
新能源汽车行业告别“造辆车就能融资”的黄金期,但细分赛道仍存破局点—— 下沉市场的“实用型代步车”、高端领域的“智能驾驶旗舰”、城市通勤的“微型电动生态”…… 核心在于:用手机行业的迭代速度做研发,用…
DeepSeek-V3:开源大模型的性能与速度全面突破
2024年12月26日,DeepSeek正式发布了其全新自研的开源大模型DeepSeek-V3,在性能和速度上实现了全面突破。维基百科+2AIHub | AI导航+2DeepSeek API Docs…
DeepSeek、OpenAI与Anthropic谁是最环保的AI模型?
前言:AI应用背后的“隐形代价” 在当下这个AI爆炸式发展的时代,各大语言模型不断刷新自然语言理解、代码生成、视频创作等多项能力指标,但鲜少有人关注它们背后巨大的环境代价。每一个你在ChatGPT或D…
宝马将在中国新车型中接入DeepSeek
德国汽车制造商宝马将于今年晚些时候,在中国推出的新车型中接入中国初创公司深度求索(DeepSeek)的人工智能(AI)技术。 据路透社报道,宝马首席执行官齐普塞(Oliver Zipse)星期三(4月…
马来西亚部署国家级AI堆栈,携手华为与开源大模型DeepSeek打造自主人工智能生态
2025年5月,马来西亚通讯部正式发布被誉为“战略人工智能基础设施”的国家级AI堆栈。这一全栈式人工智能生态系统,不仅标志着华为Ascend GPU芯片首次在中国以外国家落地应用,也迎来了中国领先开源…
AI的双刃剑:DeepSeek与全球科技对抗的新时代
2025年,DeepSeek——一款由中国公司开发的人工智能(AI)语言模型,正面临全球范围内越来越多的禁令和审查。自推出以来,DeepSeek的低成本和高效能使其在全球范围内迅速吸引了数百万用户,成…
OpenAI新Agent套件引领AI革新,DeepSeek遭遇挑战,AI技术战火升级
在AI行业的快速发展中,技术创新不断推动着行业变革,多个重量级的AI技术突破正在重塑科技格局。特别是本周,OpenAI推出的全新Agent开发套件,无疑为AI领域带来了革命性的进展;与此同时,Deep…
DeepSeek对企业服务行业的影响:短期爆发,中期调整,长期变革
近年来,人工智能技术迅猛发展,DeepSeek作为国内领先的大模型平台,正逐步渗透到企业服务行业的各个层面。本文将从短期、中期和长期三个阶段,探讨DeepSeek对企业服务行业的深远影响。 一、短期:…
从“追赶者”到“引领者”:DeepSeek如何重塑全球AI格局
在全球人工智能领域,中国科技公司DeepSeek的崛起引起了广泛关注。凭借其开源战略和技术创新,DeepSeek正在从一个“追赶者”转变为“引领者”,对全球AI产业格局产生深远影响。本文将深入分析De…
小米发布MiMo-7B模型,与DeepSeek Prover数学推理AI同步升级
小米公司发布了新一代的推理模型系列——MiMo-7B,宣称它在某些任务上能够超越OpenAI的o1-mini。这个算法系列通过开源许可发布,其推出恰逢DeepSeek发布了其更新版本的Prover,一…
DeepSeek:打破硅谷神话的中国AI黑马
引言: DeepSeek 的崛起震撼了全球科技界,尤其是其发布的 DeepSeek-V3 模型,以低成本、高性能的特点,挑战了美国科技巨头的主导地位。 一、DeepSeek的背景与创始人 DeepSe…
希腊的AI主权之战: DeepSeek 与全球科技竞赛中的隐私与能源挑战
2025年,DeepSeek 作为中国开发的聊天机器人,正面临希腊数据保护当局的调查,可能因涉嫌侵犯用户隐私而遭到审查。这一事件不仅让希腊成为全球数据隐私、能源主权与技术独立之间挑战的前沿阵地,也彰显…
DeepSeek接入Excel全攻略:开启智能办公新时代
在现代办公环境中,提升工作效率是每位职场人士追求的目标。将人工智能工具与日常办公软件结合,已成为提高生产力的有效途径。本文将详细介绍如何将DeepSeek接入Excel,开启智能办公的新篇章。 一、D…
人工智能+军工力量:DeepSeek赋能中国战机设计跃升至新维度
近年来,中国在人工智能技术方面的突破不断引发全球关注。近日,沈阳飞机设计研究所的首席设计师王永庆在接受采访时透露,研究所团队已经将DeepSeek人工智能模型应用于新一代战机的设计与研发之中,取得了显…
基于开发者空间的 DeepSeek API 调用及参数调试攻略
DeepSeek大语言模型算法是一种深度合成服务算法,该模型以Transformer架构为基础,自主研发的深度神经网络模型。模型基于注意力机制,通过海量语料数据进行预训练,并经过监督微调、人类反馈的强…
OpenAI的o3-mini与DeepSeek-R1在AI翻译评估中的表现:全面对比
在人工智能领域,语言模型的推理能力在提升翻译质量和评估准确度方面越来越受到关注。最近,阿里巴巴就曾强调,大型推理模型在AI翻译中的变革潜力。基于这一背景,来自曼海姆大学和纽伦堡技术大学的研究人员进行了…
DeepSeek通信框架性能大跃进,腾讯技术助力AI产业生态再升级
在全球人工智能竞赛加速的当下,大模型训练效率成为衡量技术实力的重要指标。近日,中国AI企业DeepSeek对外宣布,其开源通信框架DeepEP在腾讯的深度技术支持下,性能实现显著飞跃:RoCE网络环境…
Qwen3 技术演进全解析:全面对比 DeepSeek R1/R2 模型,谁才是大模型新王者?
在 2025 年的大模型技术角逐中,阿里巴巴通义千问团队推出的 Qwen3 模型无疑成为聚光灯的焦点。相比 Qwen2.5 以及 Qwen1.5 等历史版本,Qwen3 带来了架构、效率、性能、推理成…