今天下午,DeepSeek 官方正式发布 DeepSeek-V3.1。 相比于前天只在用户群里通知,今天新增了模型升级点、榜单成绩、model card,huggingface 上现在也可以下载模型文件了。 一共两个模型,分别是 V3.1 和 V3.1 base。两个模型结构完全一致,V3.1 的 Base 模型在 V3 的基础上 ...
炒股的朋友都知道一句老话:“炒股不盯盘,到老一场空”。行情瞬息万变,机会稍纵即逝,不时刻盯着,心里总是不踏实。现在AI炒股的概念很火,很多人问我:“泽亮老师,AI听起来很牛,但它能帮我实时盯盘吗?我怎么没见人用过?”今天,我就通过一个真实的案例,带大 ...
适用于常规 AI 模型和 MoE。 DeepSeek 的开源周已经进行到了第三天(前两天报道见文末「相关阅读」)。今天开源的项目名叫 DeepGEMM,是一款支持密集型和专家混合(MoE)GEMM 的 FP8 GEMM 库,为 V3/R1 的训练和推理提供了支持,在 Hopper GPU 上可以达到 1350+ FP8 TFLOPS 的 ...
AI 圈的头条被 DeepSeek 承包了十几天,昨天,OpenAI 终于坐不住了,推出了全新推理模型系列 o3-mini。不仅首次向免费用户开放了推理模型,而且相比之前的 o1 系列,成本更是降低了 15 倍之多。 OpenAI 也称这是其推理模型系列中最新、最具成本效益的模型: 刚刚 ...
最近的 AI 编程圈,实在是太卷了。 感觉我就是睡了一觉,起来天就变了: 前脚Anthropic刚把Claude Code 升级到 2.0、发布Claude sonnet 4.5,后脚 DeepSeek 就密集更新到了 v3.2-exp。 还没等我缓过神,昨晚刷 X,智谱的 GLM-4.6 已经悄悄干到了开源第一,把 DeepSeek 给超了。
近日,国内通用大模型DeepSeek以燎原之势在全球各个领域迅猛发展,也为教育行业的高质量发展带来了新的巨大机遇。 目前,清华大学、浙江大学、上海交通大学、华中科技大学、武汉大学、北京航空航天大学等国内多所高校纷纷宣布,已经完成DeepSeek系列大 ...
昨天,DeepSeek 发布了一个新模型 DeepSeek-OCR。 这是一个专门为 OCR(文字识别)微调的 6.6GB 模型,主要贡献在于首次量化 “视觉 - 文本 token 压缩比”,验证 10× 近无损压缩、20× 仍保有 60% 精度的可行性;提出 DeepEncoder,解决现有编码器 “高分辨率 - 低内存 - 少 ...
据传即将发布新一代模型V4。 去年7月,由于DeepSeek下载量从高峰期的8000多万暴跌至2000多万,下滑72.2%,“DeepSeek跌落神坛”就成为了当时互联网最热门的话题。 但据多位知情人士透露,DeepSeek即将重登王座。他们计划在二月中旬发布新一代模型DeepSeek-V4。 也就是 ...
9 天on MSN
DeepSeek V4 招聘泄露玄机:AI 编程将成核心突破口
随着 DeepSeek V4 预计于 4 月发布,DeepSeek 官网近日上线的一系列新职位揭示了该大模型的战略重心。招聘信息显示,DeepSeek 正在大规模招募 Agent 深度学习算法研究员、数据评测专家及基础设施工程师,工作地点分布于杭州和北京。 核心信号:对标 Claude,发力 AI 编程 此次招聘最引人关注的是对候选人工具掌握能力的要求: ...
9 天on MSN
DeepSeek V4蓄势待发:聚焦AI编程领域,4月竞速成最大看点
DeepSeek官网近日挂出一批新岗位招聘信息,工作地点覆盖杭州与北京,涉及Agent深度学习算法研究员、数据评测专家及基础设施工程师等职位。这一动作被业界视为其即将发布的新一代大模型DeepSeek V4的重要布局,该模型预计于4月面世,其战略方向正引发广泛关注。
快科技3月18日消息,万众期待的DeepSeek V4让大家等得心急,最新说法是4月发布,显然还要再打磨一番,现在DeepSeek官网发了新的工作招聘信息,暴露了DeepSeek大模型的重点方向。
随着 DeepSeek V4 预计于 4 月发布,DeepSeek 官网近日上线的一系列新职位揭示了该大模型的战略重心。招聘信息显示,DeepSeek 正在大规模招募 Agent 深度学习算法研究员、数据评测专家及基础设施工程师,工作地点分布于杭州和北京。
当前正在显示可能无法访问的结果。
隐藏无法访问的结果