分类: 新闻

  • 国内外AI大语言模型API价格对比

    AIGCRank大语言模型API价格对比是一个专门汇总和比较全球主要AI模型提供商的价格信息的工具。我们为您提供最新的大语言模型(LLM)的价格数据,以及一些免费的AI大模型API。通过我们的平台,您可以轻松查找和比较OpenAI、Claude、Mixtral、Kimi、星火大模型、通义千问、文心一言、Llama 3、GPT-4、AWS和Google等国内外主要API提供商的最新价格,确保找到最适合您项目的模型定价。

    模型名称API提供商上下文长度
    Context
    输入价格 $
    1M Tokens
    输入价格 ¥
    1M Tokens
    输出价格 $
    1M Tokens
    输出价格 ¥
    1M Tokens
    产品链接价格链接
    GPT-4OpenAI8K$30.00217.50$60.00435.00查看详情查看价格
    GPT-4o miniOpenAI128K$0.151.09$0.604.35查看详情查看价格
    GPT-4oOpenAI128K$5.0036.25$15.00108.75查看详情查看价格
    GPT-4o-2024-08-06OpenAI128K$2.5018.13$10.0072.50查看详情查看价格
    GPT-4o longOpenAI64K 输出$6.0043.50$18.00130.50查看详情查看价格
    GPT-4 TurboOpenAI128K$10.0072.50$30.00217.50查看详情查看价格
    GPT-4-32kOpenAI32K$60.00435.00$120.00870.00查看详情查看价格
    GPT-3.5-Turbo-0125OpenAI16K$0.503.63$1.5010.88查看详情查看价格
    GPT-3.5-Turbo-instructOpenAI4K$1.5010.88$2.0014.50查看详情查看价格
    Llama-3-70b-instructReplicate8K$0.654.71$2.7519.94查看详情查看价格
    Llama-3-8b-instructReplicate8K$0.050.36$0.251.81查看详情查看价格
    Llama-2-70bReplicate4K$0.654.71$2.7519.94查看详情查看价格
    Llama-2-13bReplicate4K$0.100.73$0.503.63查看详情查看价格
    Llama-2-7bReplicate4K$0.050.36$0.251.81查看详情查看价格
    Mixtral-8x7b-instruct-v0.1Replicate32K$0.302.18$1.007.25查看详情查看价格
    Mistral-7b-instruct-v0.2Replicate32K$0.050.36$0.251.81查看详情查看价格
    Mixtral-8x22bMistral64K$2.0014.50$6.0043.50查看详情查看价格
    Mixtral-8x7bMistral32K$0.705.08$0.705.08查看详情查看价格
    Mistral-7bMistral32K$0.251.81$0.251.81查看详情查看价格
    Mistral-largeMistral32K$4.0029.00$12.0087.00查看详情查看价格
    Mistral-smallMistral32K$1.007.25$3.0021.75查看详情查看价格
    deepseek-chatDeepSeek128K$0.141.00$0.282.00查看详情查看价格
    deepseek-coderDeepSeek128K$0.141.00$0.282.00查看详情查看价格
    pplx-70b-onlinePerplexity4K$1.007.25$1.007.25查看详情查看价格
    pplx-7b-onlinePerplexity4K$0.201.45$0.201.45查看详情查看价格
    Openchat-7bDeepinfra8K$0.070.51$0.070.51查看详情查看价格
    Llama-3-70B-InstructDeepinfra8K$0.594.28$0.795.73查看详情查看价格
    Llama-2-70b-chatDeepinfra4K$0.644.64$0.805.80查看详情查看价格
    Claude-3.5-sonnetAnthropic200K$3.0021.75$15.00108.75查看详情查看价格
    Claude-3-opusAnthropic200K$15.00108.75$75.00543.75查看详情查看价格
    Claude-3-sonnetAnthropic200K$3.0021.75$15.00108.75查看详情查看价格
    Claude-3-haikuAnthropic200K$0.251.81$1.259.06查看详情查看价格
    Claude-2.1Anthropic200K$8.0058.00$24.00174.00查看详情查看价格
    Claude-2.0Anthropic100K$8.0058.00$24.00174.00查看详情查看价格
    Claude-instant-1.2Anthropic100K$0.805.80$2.4017.40查看详情查看价格
    Llama-3-70bGroq8K$0.594.28$0.795.73查看详情查看价格
    Llama-3-8bGroq8K$0.050.36$0.100.73查看详情查看价格
    Mixtral-8x7bGroq32K$0.241.74$0.241.74查看详情查看价格
    Gemma-7bGroq8K$0.100.73$0.100.73查看详情查看价格
    Gemini 1.5 ProGoogle1M$1.259.06$3.7527.19查看详情查看价格
    Gemini 1.0 ProGoogle32K$0.503.63$1.5010.88查看详情查看价格
    Gemini 1.5 FlashGoogle1M$0.130.91$0.382.72查看详情查看价格
    PaLM 2 for Text 32kGoogle32K$0.251.81$0.503.63查看详情查看价格
    Claude-3-opusGoogle200K$15.00108.75$75.00543.75查看详情查看价格
    Claude-3-sonnetGoogle200K$3.0021.75$15.00108.75查看详情查看价格
    Claude-3-haikuGoogle200K$0.251.81$1.259.06查看详情查看价格
    Gemini-1.0-proGoogle32K$0.503.63$1.5010.88查看详情查看价格
    Gemini-1.5-proGoogle1M$3.5025.38$10.0572.86查看详情查看价格
    Gemini-1.5-flashGoogle1M$0.352.54$1.057.61查看详情查看价格
    Llama-2-7b-chat-fp16Cloudflare3K$0.564.06$6.6648.29查看详情查看价格
    Llama-2-7b-chat-int8Cloudflare2K$0.161.16$0.241.74查看详情查看价格
    Mistral-7b-instructCloudflare32K$0.110.80$0.191.38查看详情查看价格
    GPT-4oAzure128K$5.0036.25$15.00108.75查看详情查看价格
    GPT-4-TurboAzure128K$10.0072.50$30.00217.50查看详情查看价格
    GPT-4Azure32K$60.00435.00$120.00870.00查看详情查看价格
    GPT-4Azure8K$30.00217.50$60.00435.00查看详情查看价格
    GPT-4-Turbo-VisionAzure128K$10.0072.50$30.00217.50查看详情查看价格
    GPT-3.5-Turbo-0125Azure16K$0.503.63$1.5010.88查看详情查看价格
    GPT-3.5-Turbo-0613Azure4K$1.5010.88$2.0014.50查看详情查看价格
    GPT-3.5-Turbo-1106Azure16K$1.007.25$2.0014.50查看详情查看价格
    GPT-3.5-Turbo-0301Azure4K$2.0014.50$2.0014.50查看详情查看价格
    GPT-3.5-Turbo-instructAzure4K$1.5010.88$2.0014.50查看详情查看价格
    GPT-3.5-Turbo-0613Azure16K$3.0021.75$4.0029.00查看详情查看价格
    Titan Text ExpressAWS8K$0.201.45$0.604.35查看详情查看价格
    Titan Text LiteAWS4K$0.151.09$0.201.45查看详情查看价格
    Claude-3-opusAWS200K$15.00108.75$75.00543.75查看详情查看价格
    Claude-3-sonnetAWS200K$3.0021.75$15.00108.75查看详情查看价格
    Claude-3-haikuAWS200K$0.251.81$1.259.06查看详情查看价格
    Claude-2.0/2.1AWS100K$8.0058.00$24.00174.00查看详情查看价格
    Claude-instantAWS200K$0.805.80$2.4017.40查看详情查看价格
    Command R+AWS128k$3.0021.75$15.00108.75查看详情查看价格
    Command RAWS128k$0.503.63$1.5010.88查看详情查看价格
    CommandAWS4K$1.5010.88$2.0014.50查看详情查看价格
    Command-lightAWS4K$0.302.18$0.604.35查看详情查看价格
    jurassic-2-ultraAWS2K$18.80136.30$18.80136.30查看详情查看价格
    jurassic-2-midAWS2K$12.5090.63$12.5090.63查看详情查看价格
    Llama-3-instruct-70bAWS8K$2.6519.21$3.5025.38查看详情查看价格
    Llama-3-instruct-8bAWS8K$0.402.90$0.604.35查看详情查看价格
    Llama-2-chat-70bAWS4K$1.9514.14$2.5618.56查看详情查看价格
    Llama-2-chat-13bAWS4K$0.755.44$1.007.25查看详情查看价格
    Mistral-8x7bAWS8K$0.453.26$0.705.08查看详情查看价格
    Mistral-7bAWS8K$0.151.09$0.201.45查看详情查看价格
    Command R+Cohere128K$3.0021.75$15.00108.75查看详情查看价格
    Command RCohere128K$0.503.63$1.5010.88查看详情查看价格
    abab6.5MiniMax8k$4.1430.00$4.1430.00查看详情查看价格
    abab6.5sMiniMax245k$1.3810.00$1.3810.00查看详情查看价格
    abab6.5gMiniMax8k$0.695.00$0.695.00查看详情查看价格
    abab6MiniMax32k$13.79100.00$13.79100.00查看详情查看价格
    abab5.5sMiniMax8k$0.695.00$0.695.00查看详情查看价格
    ERNIE 4.0 Turbo百度文心8K$4.1430.00$8.2860.00查看详情查看价格
    ERNIE 4.0百度文心8K$5.5240.00$16.55120.00查看详情查看价格
    ERNIE-3.5-128k百度文心128K$1.108.00$3.3124.00查看详情查看价格
    ERNIE 3.5百度文心8K$0.564.00$1.6612.00查看详情查看价格
    ERNIE Lite百度文心8K$0.000.00$0.000.00查看详情查看价格
    ERNIE Speed百度文心8K$0.000.00$0.000.00查看详情查看价格
    ERNIE Tiny百度文心8K$0.000.00$0.000.00查看详情查看价格
    ERNIE Character百度文心8K$0.554.00$1.108.00查看详情查看价格
    ERNIE Functions百度文心8K$0.554.00$1.108.00查看详情查看价格
    GLM-4-0520智谱AI128K$13.79100.00$13.79100.00查看详情查看价格
    GLM-4-AirX智谱AI8K$1.3810.00$1.3810.00查看详情查看价格
    GLM-4-Air智谱AI128K$0.141.00$0.141.00查看详情查看价格
    GLM-4-Flash智谱AI128K$0.000.00$0.000.00查看详情查看价格
    GLM-4V智谱AI2K$6.9050.00$6.9050.00查看详情查看价格
    GLM-3-Turbo智谱AI128K$0.141.00$0.141.00查看详情查看价格
    moonshot-v1-8k月之暗面8K$1.6612.00$1.6612.00查看详情查看价格
    moonshot-v1-32k月之暗面32K$3.3124.00$3.3124.00查看详情查看价格
    moonshot-v1-128k月之暗面128K$8.2860.00$8.2860.00查看详情查看价格
    qwen-long通义千问1M$0.070.50$0.282.00查看详情查看价格
    qwen-Turbo通义千问8K$0.282.00$0.836.00查看详情查看价格
    qwen-plus通义千问32K$0.554.00$1.6612.00查看详情查看价格
    qwen-max通义千问8K$5.5240.00$16.55120.00查看详情查看价格
    qwen-max-longcontext通义千问30K$5.5240.00$16.55120.00查看详情查看价格
    qwen1.5-110b-chat通义千问32K$0.977.00$1.9314.00查看详情查看价格
    qwen1.5-72b-chat通义千问32K$0.695.00$1.3810.00查看详情查看价格
    qwen1.5-32b-chat通义千问32K$0.483.50$0.977.00查看详情查看价格
    qwen1.5-14b-chat通义千问8K$0.282.00$0.554.00查看详情查看价格
    qwen1.5-7b-chat通义千问8K$0.141.00$0.282.00查看详情查看价格
    qwen-1.8b-chat通义千问8K$0.000.00$0.000.00查看详情查看价格
    qwen1.5-0.5b-chat通义千问32K$0.000.00$0.000.00查看详情查看价格
    Spark4.0 Ultra科大讯飞$13.79100.00$13.79100.00查看详情查看价格
    Spark3.5 Max科大讯飞$4.1430.00$4.1430.00查看详情查看价格
    Spark Pro科大讯飞$4.1430.00$4.1430.00查看详情查看价格
    Spark Lite科大讯飞$0.000.00$0.000.00查看详情查看价格
    Doubao-lite-4k字节跳动4K$0.040.30$0.080.60查看详情查看价格
    Doubao-lite-32k字节跳动32K$0.040.30$0.080.60查看详情查看价格
    Doubao-lite-128k字节跳动128K$0.110.80$0.141.00查看详情查看价格
    Doubao-pro-4k字节跳动4K$0.110.80$0.282.00查看详情查看价格
    Doubao-pro-32k字节跳动32K$0.110.80$0.282.00查看详情查看价格
    Doubao-pro-128k字节跳动128K$0.695.00$1.249.00查看详情查看价格
    YI-large零一万物32K$2.7620.00$2.7620.00查看详情查看价格
    YI-large-Turbo零一万物16K$1.6612.00$1.6612.00查看详情查看价格
    YI-large-rag零一万物16K$3.4525.00$3.4525.00查看详情查看价格
    YI-medium零一万物16K$0.342.50$0.342.50查看详情查看价格
    YI-medium-200k零一万物200K$1.6612.00$1.6612.00查看详情查看价格
    YI-spark零一万物16K$0.141.00$0.141.00查看详情查看价格
    YI-vision零一万物4K$0.836.00$0.836.00查看详情查看价格
    Hunyuan-pro腾讯混元32K$4.1430.00$13.79100.00查看详情查看价格
    Hunyuan-standard腾讯混元32K$0.624.50$0.695.00查看详情查看价格
    Hunyuan-standard-256k腾讯混元256K$2.0715.00$8.2860.00查看详情查看价格
    Hunyuan-lite腾讯混元4K$0.000.00$0.000.00查看详情查看价格
    Baichuan4百川智能$13.79100.00$13.79100.00查看详情查看价格
    Baichuan3-Turbo百川智能$1.6612.00$1.6612.00查看详情查看价格
    Baichuan3-Turbo-128k百川智能128K$3.3124.00$3.3124.00查看详情查看价格
    Baichuan2-Turbo百川智能$1.108.00$1.108.00查看详情查看价格
    Baichuan2-Turbo-192k百川智能192K$2.2116.00$2.2116.00查看详情查看价格
    step-1-8k阶跃星辰8K$0.695.00$2.7620.00查看详情查看价格
    step-1-32k阶跃星辰32K$2.0715.00$9.6670.00查看详情查看价格
    step-1-128k阶跃星辰128K$5.5240.00$27.59200.00查看详情查看价格
    step-1-256k阶跃星辰256K$13.1095.00$41.78300.00查看详情查看价格
    step-2-16k-nightly阶跃星辰16K$5.2438.00$16.55120.00查看详情查看价格

  • 大模型应用实战指南:从认知到落地的全路径解析

    大模型应用实战指南:从认知到落地的全路径解析。

    《大模型通识与应用:从”会聊天”到”会执行”》核心报告显示,当前大模型正从通用对话工具向垂直领域的任务执行专家加速进化,为各行业带来效率重构的新机遇。

    一、大模型能力跃迁的两大核心趋势

    1. 功能进化:从”闲聊助手”到”任务执行者”

    大模型的能力边界正快速突破对话场景,向精准任务执行延伸。以GPT-4为代表的通用大模型,已实现从日常闲聊到代码生成、复杂数据分析的跨越,MIT 2025年的研究数据显示,其任务完成率较前代模型提升62%。 多模态整合则进一步拓展了应用的便捷性:Lobster(龙虾AI)实现了语音指令到设计成果的直接转化,支持语音描述创意后一键生成PPT、海报设计稿,原本需要数小时的设计修改需求,现在响应时间可缩短至3分钟内。

    2. 行业渗透率:垂直场景的效率革命

    大模型的价值正在各行业的具体场景中落地:

    – 制造业:Manus机械臂搭载自然语言编程系统后,东莞某电子工厂仅通过语音指令即可完成产线参数调整,产线切换效率较传统编程方式提升40%;

    – 法律领域:合同审查AI工具可自动识别条款风险、标注合规问题,平均为律师节省87%的文书处理时间,让从业者聚焦更具价值的策略性工作。

    二、三款高实用性大模型工具测评

    工具名称核心功能典型场景用户价值(ROI)
    Lobster语音指令生成设计稿广告创意、营销物料制作美工人力成本降低35%
    ManusXAI驱动机械臂精准控制精密零部件装配装配误差率降低0.02mm
    DocSifter智能标书生成与审核企业招投标标书合规性提升,中标率提高22%

    三、场景落地的可复制方法论

    1. 四步实施框架:从需求到落地的标准化路径

    – 需求拆解:将业务流程拆解为”输入-处理-输出”三要素,比如客服场景可拆解为「用户语音输入→AI情绪与意图分析→标准化话术推荐」,确保AI任务目标清晰;

    – 工具选型:根据任务复杂度匹配工具能力——基础文本处理、文案生成可选择ChatGPT等通用工具,工业控制、精密操作等场景则需选用Manus等具备专用API的垂直工具;

    – 冷启动训练:上传企业专属数据训练垂直模型,建议至少准备500条标注数据,让AI快速适配企业业务逻辑;

    – 人机协同:设置关键节点的人工复核机制,例如在合同审核、产线调整等关键决策场景,保留15%的人工干预权,平衡效率与风险。

    2. 避坑指南:落地前需警惕的核心问题

    – 警惕”全能型AI”陷阱:无需追求能解决所有问题的工具,单一工具对目标任务的解决率超过80%即符合落地标准,过度追求”全能”反而会增加成本与复杂度;

    – 数据安全优先:涉及企业核心数据的场景,优先选择支持本地化部署的方案,如华为盘古大模型企业版,避免核心数据外溢风险。

    结语

    2026年大模型工具已进入”解决真问题”的务实阶段,对于企业而言,无需等待完美的技术方案,建议采用”小场景切入-快速迭代”的策略:从客服、标书制作等单一痛点切入,通过数据反馈持续优化模型,通常6个月内即可看到明显的效率提升与成本节约效果。

  • ✨阿里王炸新品!打工人直接封神的桌面AI助理来了!!💻💫

    家人们,今天刷到阿里刚发布的【QoderWork】
    本效率废柴直接瞳孔地震🤯
    不用写代码!不用传云端!
    对着电脑说句“整理销售表+出PPT”
    它!真!的!秒!搞!定!了!!(附脑补界面图👉超简洁对话框+进度条狂飙)

    🔥为什么我疯狂心动?
    ✅ 本地运行超安心!文件死守你电脑💻
    (再也不用担心机密表格乱飞!打工人安全感拉满🔒)
    ✅ 智能到像读心术🧠
    “分析Excel,找销量TOP5+画趋势图+写报告”
    它自动拆步骤:清洗→计算→生成图表→输出带结论的PPT!
    ✅ 音频秒变爆款素材🎤
    采访录音丢过去👉自动生成小红书笔记+字幕+公众号长文!
    (博主/运营人直接跪谢!!省下3小时剪辑命😭)
    ✅ 还能自己加“技能”✨
    内置超多工具,定制专属工作流~越用越懂你!

    💬阿里大佬原话戳中泪点:
    “让AI走出聊天框,真正帮你干活!”
    本打工人含泪点赞:终于不用在Excel里反复横跳了啊啊啊!!

    🌟真实使用脑补:
    早上咖啡没凉☕️
    它已把周报写好+配好图+标红重点
    我:???这真是我的电脑??(感动到想给它颁锦旗🇨🇳)

    ⚠️划重点:
    目前开放邀测!手慢无!!
    (蹲到的家人们评论区吼我!!求组队冲🏃‍♀️💨)
    👉指路:阿里Qoder官网(记得搜“QoderWork”!)

    💬互动时间:
    你最想让它帮你干啥?
    ▫️自动回邮件?▫️整理手机相册?▫️写小红书文案?
    👇评论区甩需求!点赞过百我求阿里加更教程!!

    #打工人续命神器 #AI办公天花板 #阿里黑科技真香 #效率开挂日记 #职场妈妈必备

    ✨关注我,带你挖遍让生活变甜的神仙工具!✨

  • 🦞一夜爆火!这个“住在电脑里的贾维斯”,才是真正的AI入口?

    家人们,最近北美 tech 圈疯传一个开源项目——Clawdbot(现在刚改名叫 Moltbot,但大家还是习惯叫它 Clawdbot),被无数人称为 “本地版贾维斯”

    它不像你手机里那些 AI 聊天 App,而是直接住进你的 Mac / 服务器里,通过 Telegram、Slack、iMessage 这些你每天都在用的聊天软件跟你对话,还能操作你的文件、终端、浏览器……甚至帮你自动填报销单!🤯

    今天就来手把手带你上车 + 拆解它为什么这么特别👇


    🔍 它到底是什么?

    Clawdbot 是由知名开发者 Peter Steinberger(@steipete)发起的开源项目,定位是 Personal AI Assistant(个人 AI 助手)

    但它最牛的地方在于:
    ✅ 本地优先(Local-first):所有数据存在你自己的电脑里
    ✅ 无独立 App:通过你已有的聊天工具交互(比如 Telegram)
    ✅ 能动手做事:不只是聊天,还能执行真实任务!

    简单说:它不是“另一个 AI 聊天窗口”,而是你电脑里的数字员工💼


    💻 手把手部署指南(超详细!)

    ✅ 前期准备

    • 一台 Mac / Linux / WSL2 机器
    • Node.js ≥ v20(推荐)
    • Bun(可选但超快!作者亲推✨)
    • 一个 LLM API Key(Claude / GPT / Gemini 都行)
    • 建议从 Telegram 入手!配置最简单~

    🚀 三步启动

    # 1. 克隆项目
    git clone https://github.com/clawdbot/clawdbot.git
    cd clawdbot
    
    # 2. 安装依赖(用 Bun 更快!)
    bun install
    
    # 3. 创建 .env 文件

    在 .env 里填入:

    编辑 env

    ANTHROPIC_API_KEY=你的 Claude Key
    TELEGRAM_BOT_TOKEN=从 @BotFather 拿到的 Token
    TELEGRAM_ALLOWED_USER_IDS=你的 Telegram ID(防别人白嫖!)

    然后运行:

    编辑 bash

    bun run dev

    📱 手机远程控制?

    对!你可以在手机 Telegram 里给机器人发消息:

    “ping”

    如果它回你 “pong” —— 恭喜!连接成功🎉
    从此你就能用手机指挥家里的 Mac 干活了

    ⚠️ iMessage / WhatsApp 也能接,但需要额外配置,新手先玩 Telegram 就好~


    🦾 解锁“手脚”:技能系统太香了!

    Clawdbot 本身是个“躯干”,真正厉害的是它的 Skills(技能包)

    比如你可以让它:

    “帮我列出桌面上所有包含 ‘Confidential’ 的文件”
    “打开 Chrome,登录 Notion,截图发我”
    “检查 Git 状态并告诉我有没有未提交的改动”

    这些能力都来自 skills/ 目录下的插件,比如:

    • filesystem:读写本地文件
    • browser:控制浏览器
    • fetch:调用 API

    而且社区还在不断贡献新技能!它会越用越聪明,越用越能干💪


    ⚠️ 避坑 & 安全提醒(必看!)

    • 记忆存在哪? → 默认在 ~/.clawd,删掉就“失忆”
    • 网络要稳! → 需频繁调用 Claude / OpenAI API
    • 千万设白名单! → 不设 ALLOWED_USER_IDS = 全世界都能用你的机器人!API 费用爆炸不说,还可能被黑!

    🔒 它有键盘、有屏幕、有身份——一旦失控,后果严重!
    请务必当成“高危实验品”谨慎使用!


    💡 为什么它值得被关注?

    1️⃣ 最好的 UI,是没有 UI

    它不强迫你打开新 App,而是融入你现有的工作流。你在 Telegram 聊天,它就在 Telegram 回你;你在 Slack 开会,它就在 Slack 帮你查资料。

    未来 AI 或许不该是个“目的地”,而是一层智能图层

    2️⃣ 从“聊天”到“做事”

    传统 AI 只会回答问题,Clawdbot 却能执行任务——这才是真正的“Agent”。

    它不是靠模型多强,而是靠连接真实世界的工具生态

    3️⃣ 数据在你手里

    所有记忆、配置都以 Markdown 存在本地,你可以随时查看、备份、删除。

    私密 + 透明 + 长效 = 真正属于你的 AI 助手!


    ❤️ 总结

    Clawdbot 没有炫酷的新算法,但它用产品思维回答了一个关键问题:

    用户不需要新入口,只需要把 AI 能力,无缝嵌入他们 already 在用的工具里。

    微信为什么难被取代?因为它够简单、够高频。
    与其造一个“全能 AI App”,不如让 AI 成为你现有生活的增强插件

    而这,或许才是 AI 入口的终极形态。


    🔗 实用资源(收藏!)

  • 微软 Copilot 免费升级 GPT-5.2!专家级工作流直接起飞,比专业人士还牛?

    宝子们!微软 Copilot 又搞大事啦🎉 今天正式推送 OpenAI 最强模型 GPT-5.2,还是免费升级哦!这次直接开启 “专家级” 工作流新时代,把办公效率拉到天花板~

    🌟 两大模型共存,思考型更强大

    GPT-5.2 和 GPT-5.1 同时在线,Plus 版本是 “思考型” 变体 —— 简单说就是更会深度思考啦!处理表格、写审查代码、啃长文档,速度快到飞起,还能搞定复杂工具调用和图像分析~

    🚀 性能直接翻倍,碾压专业人士

    在 44 个职业任务测试里,GPT-5.2Thinking 居然70.9% 优于 / 持平行业专家(之前 GPT-5 只有 38.8%)!写 PPT、安排日程、做专业交付物,比你请的顾问还靠谱,办公自动化直接卷出新高度~

    🔧 硬核测试满分,编程数学全拿捏

    • 编程领域:SWE-Bench Pro 测试刷新纪录,甩 GPT-5.1Thinking 几条街;
    • 数学竞赛:AIME2025 直接拿100% 满分,GPQA Diamond 逻辑测试 92.4 分;
    • 逻辑科学:CharXiv 推理、ARC-AGI-2 大幅提升,从基础助手变身为 “数字智慧体”~

    现在网页 / Windows / 移动端都能用上,免费体验专家级 AI 助力!宝子们试过 Copilot 新功能吗?快来评论区聊聊你的办公效率神器👇

  • AI助手争霸!谁能成为“赢家通吃”王者?

    宝子们,最近硅谷顶尖风投机构a16z发布的消费级AI市场年度重磅报告,真的太炸裂了🔥!现在通用AI助手赛道竞争超激烈,用户往往就选一个主力产品,“赢家通吃”格局正在加速形成。

    报告显示,AI使用率是上升了,但用户跨平台使用意愿超低。就拿ChatGPT的周活用户来说,不到10%会同时用其他AI服务;主流产品里,也只有约9%的用户会为多个助手付费订阅。

    目前OpenAI还是厉害,有8 – 9亿周活用户领先,但它的“超级应用”策略面临挑战。谷歌用“实验田”模式让Gemini飞速追赶,桌面用户同比增长155%,付费订阅增速接近ChatGPT两倍👏。

    从数据看,ChatGPT用户量领先,用户黏性也高,日活/月活比率是Gemini的两倍。但Gemini增长势头超猛,付费用户增长更是把ChatGPT远远甩在后面。

    产品策略上,OpenAI像建“围墙花园”,把各种功能往ChatGPT里塞,可界面变复杂了;谷歌则是“试验田”模式,让创新产品独立发展,不过产品有点分散。

    其他玩家也各有绝招👍。Anthropic的Claude专注技术用户,编程助手收入可观;Perplexity服务注重效率的非技术群体;马斯克的xAI产品Grok增长超快,功能迭代也厉害,被说是能力演进速度最快的AI产品。

    未来AI助手竞争关键,就是谁更懂用户需求,还能转化成好的商业模式。宝子们,你们更看好谁呢🤔?

    AI助手竞争 #赢家通吃 #OpenAI #谷歌 #差异化突围

  • 10级漏洞刚补完,React又炸了!现代Web“默认底座”因一行代码缺失引发全球地震,开发者经历最黑暗一周

    10级漏洞刚补完,React又炸了!现代Web“默认底座”因一行代码缺失引发全球地震,开发者经历最黑暗一周

    12 月 12 日,React 官方确认,研究人员在验证上周补丁时,竟又在 React Server Components(RSC)里发现了两处新漏洞。

    过去一周,React2Shell 漏洞的余威仍在:服务器被劫持挖矿、云厂商紧急封禁、甚至引发 ;为了把风险压下去,Vercel 甚至在一个周末就付出了 75 万美元的漏洞赏金与应急处置成本。一次前端框架的漏洞,直接打穿了整个技术栈。React 官方连续发布紧急通告,反复强调“请立即升级”,短时间内已经是第二次大规模补丁更新。

    这次披露的两个漏洞分别是:高危 DoS(拒绝服务)CVE-2025-55184,单个请求即可导致服务器崩溃;以及中危源码泄露 CVE-2025-55183,可能泄露 React Server Components 的源代码。

    1 一个 React 漏洞,撼动全球 Web

    过去一周,一个被称为 React2Shell 的漏洞席卷了整个互联网行业。之所以引发如此级别的震荡,根本原因只有一个:React 的地位太重要了,它几乎是现代 Web 的“默认底座”。

    从 Meta 自家的 Facebook、Instagram,到 Netflix、Airbnb、Shopify、Walmart、Asana 等大型平台,统统都离不开它;更不用说数以百万计的开发者生态,并且还有很多框架都依赖于存在漏洞的 React 包。

    React 团队将其编号为 CVE-2025-55182,其在通用漏洞评分系统中获得了满分 10.0 的严重性评级。作为 Next.js 的创建者和主要维护方,Vercel 也为这一问题单独分配了 CVE 编号 CVE-2025-66478。

    其可怕之处在于攻击者几乎无需任何前置条件即可利用该漏洞。云安全厂商 Wiz 观察到,39% 的云环境包含存在 CVE-2025-55182 漏洞的 Next.js 或 React 实例。据估计,泄露事件发生时,超过两百万台服务器存在安全漏洞。更糟糕的是,他们在实验验证中发现,这个漏洞的利用“几乎百分百命中”,可以稳定达到完整的远程代码执行。

    受影响的组件范围包括 react-server-dom-webpack 等核心模块 19.0 至 19.2.0 版本,同时波及多个 React 框架和打包器的默认配置,例如 Next.js、React Router、Vite RSC 等。对于许多框架(尤其是带有 App Router 的 Next.js),RSC 实际上默认是开启的。

    当一个 10 级漏洞被公开时,其中不只是“漏洞被报告了、被修了”这么简单,而是有真实世界的破坏性影响。

    多位开发者在 X 上公开了自己中招的经历,其中就包括开发者 Eduardo。服务器被封后,他立刻排查日志,发现机器早已被“接管”——CPU 飙到 361%,可疑进程疯狂占用资源,还不断向荷兰某个 IP 发起连接:“我的服务器不再运行我的应用程序了,它在为别人挖矿!”

    更糟的是,入侵并非 SSH 暴力破解,而是发生在 Next.js 容器内部:攻击者利用漏洞进入后,可以在服务器上执行他们想执行的任何代码,随后投放更“职业化”的恶意程序,甚至把进程伪装成 nginxs、apaches 之类的 Web 服务以降低暴露风险。“它仅通过一个 Next.js Docker 容器就感染了我的整个服务器!”

    最后他警告:“如果 Docker 还在用 ROOT 权限运行、又没更新被利用的 React 版本,你很快就会被黑。”(因为有 ROOT 权限,那么就可以安装 cron、systemd 和持久化脚本,从而在重启后仍然存在。)

    非营利安全组织 ShadowServer Foundation 表示,自漏洞披露以来,来自被僵尸网络控制的 Next.js 资产的攻击流量突然飙升 10 倍:“和其他机构一样,我们也观察到有人在大规模尝试利用 React 的 CVE-2025-55182,其中包括与僵尸网络相关的活动。”

    为什么说几乎“一行代码”即可修复

    安全研究者 Lachlan Davidson 最早披露了该问题,并发布了详尽的技术分析。他将漏洞描述为“一个安全检查的严重缺失,与极具创造性的利用机制交织而成”。

    研究流程本身也极具挑战性:据披露,他为此投入超过 100 小时,而第一个公开复现攻击代码的独立研究者 Maple 则在补丁公开后的数十小时内成功构造了最小可行攻击链,展示了漏洞可被快速 weaponize 的风险。

    简单的说,这个漏洞并不是出在某个“奇怪的边角功能”,而是出在 React Server Components 的核心通信机制上。

    为了让服务器组件变得足够快,React 设计了 Flight 协议。你可以把它理解成 React 自带的一套“前端专用数据通道”:服务器不再一次性把完整页面数据丢给浏览器,而是按渲染树结构,分批把数据发过去。这样,界面可以先渲染能渲染的部分,剩下的慢慢补齐。

    问题在于,这种能力非常强大。Flight 协议不仅要传字符串、数字、JSON 数据,还要传“还没完成的东西”,比如 Promise 这样的中间状态,并重建组件树。为了做到这一点,React 在服务器端需要对客户端发来的请求内容进行反序列化和解释,把它们还原成可以继续执行的对象。

    漏洞就出在这里。攻击者可以伪造一个特殊的 HTTP 请求,把“看起来像正常 Flight 数据”的内容发送到任何 React Server Function 端点。React 在解析这些数据时,会误以为它们是合法的内部对象,并按正常流程继续处理。结果就是,攻击者构造的数据被当成了代码执行路径的一部分,最终在服务器上直接触发了远程代码执行。

    整个过程不需要登录、不需要凭证,也不需要绕过传统意义上的安全边界。仅仅因为 React 在内部序列化结构上缺失一个基础的 hasOwnProperty 校验,即被攻破了关键的运行时边界。

    Lachlan Davidson 将该漏洞负责任地报告给了 Meta 后,Meta 随即与 React 团队协作,在短短四天内推出了紧急补丁——从实现上看,它几乎就是“补上一行代码”,却阻断了一条足以摧毁服务器的攻击链。

    2 Vercel、Cloudflare 等无辜“躺枪”

    10 级漏洞一曝光,最先“躺枪”的往往不是某个小团队,而是一整条依赖 React 的产业链,尤其是前端托管与 Serverless 平台。以 Vercel 为代表的头部平台几乎必然站到风暴中心,因为它们既是 Next.js 的关键维护者,也是海量应用的默认入口。

    应急阶段,各家厂商确实第一时间把 WAF 顶上来了。Vercel、Cloudflare、AWS、Akamai、Fastly 等公司都部署了规则,用来拦截已知的 React2Shell 利用载荷模式。这的确能争取时间,但问题在于,WAF 只能当缓冲,不能当答案。

    WAF 的本质是规则匹配模式,攻击者完全可以调整 payload 形态绕过;很多应用根本不依赖这些服务提供商,自托管、私有化部署或裸跑公网的实例更是 WAF 覆盖不到;更关键的是,边缘侧的缓解措施永远只是纵深防御的一层,而不是你的补丁策略。对这种 10/10 级别的 RCE 来说,真正的修复只有一件事:升级 React/Next 并重新部署,把漏洞代码从运行环境里彻底清掉。

    也正因为“不要把 WAF 当主修复手段”这句话戳到了痛点,业内出现了不小的争执。Assetnote 联合创始人 Shubham Shah 在领英上发文控诉 Vercel CEO 以一种近乎霸凌的态度,要求他撤下关于“不应依赖 WAF 防护此漏洞”的推文。Shubham Shah 表示:

    “Vercel CEO 曾试图否认其 WAF 可被绕过的事实,该漏洞涉及最新的 Next.js/RSC 远程代码执行。他以一种近乎霸凌的态度,要求我撤下关于“不应依赖 WAF 防护此漏洞”的推文。我当时的建议是:用户应当直接修补自身系统,而非依赖 WAF——因为我们当时已能绕过 Cloudflare 的防护,而现在 Vercel 的 WAF 同样可被绕过。这一建议至今依然成立。

    WAF 固然有其作用,但核心解决方案始终是修复系统漏洞。目前许多用户难以甄别自身系统的风险点,防御者更需要清晰信息来指导修补工作。像 Vercel 这样的 WAF 厂商,不应通过施压研究人员来掩盖其 WAF 可被绕过的事实。

    我刚为 react2shell-scanner 工具发布了更新,新增了 –vercel-waf-bypass 参数,该功能基于 Searchlight 网络安全研究团队 Adam Kues 设计的攻击载荷,可有效绕过 Vercel 的 WAF 防护。”

    出了问题试图掩盖总是无济于事的,随着更多人发现 Vercel 的漏洞后,Vercel 态度出现了大转变,Vercel CEO 已就他此前质疑 WAF 可被绕过的态度致歉,并向 Searchlight 网络安全研究团队表达了敬意。

    Vercel 团队在数分钟内响应了 Shubham Shah 团队的报告,并在半小时内部署修复方案。Shubham Shah 在最新的领英帖子中表示:

    “Vercel CEO 已就他此前质疑WAF可被绕过时的态度致歉,并向Searchlight网络安全研究团队表达了敬意。他还邀请我们在共享Slack工作空间中协作。

    我们已通过其专项漏洞赏金计划(

    https://lnkd.in/gMsnZFeu
    )提交了多个有效的WAF绕过方案。其中部分漏洞使我们能完全绕过Vercel的WAF防护层(这类漏洞非常有趣!),另一些则得益于我们对Node.js和Next.js的深入理解。
    截至目前,团队中的Adam Kues、Dylan Pindur和我本人都独立发现了不同的绕过方法。协助Vercel对我们至关重要,因为我们的许多客户都深度依赖其基础设施。当前WAF绕过的难度正逐渐增加。Vercel团队能在数分钟内响应我们的报告,并在半小时内部署修复方案。他们对此事的重视程度令人欣慰。最终,这成了一个圆满的结局。”

    在新漏洞和 React 10 级漏洞的双重压力下,Vercel 临时启动了堪称史上最激进的安全补洞计划。

    12 月 11 日,在 Youtube 上,一档名为《编程播客》的栏目剖析了因为这个“完美黑客”的攻击,Vercel 如何在短短一个周末就花费了 75 万美元来阻止它,以及 Dockerfile 中可能导致用户的环境暴露的那一行代码。

    这档播客中提到,事件曝光后,Vercel 迅速启动应急流程,与 React 团队、HackerOne 社区及安全研究人员协作,在短短一个周末内完成排查与修复,并支付了总计 75 万美元的漏洞赏金。这一处置速度和透明度,被业内评价为“极具示范意义的公关与技术响应”。

    事件之所以未造成更大规模的破坏,关键在于社区与平台的快速反应。漏洞公开后,Vercel 与 HackerOne 合作,将相关漏洞及边界情况全部开放给白帽社区。在三个昼夜内,共收到 17 到 19 条修复建议与边界情形,涉及不同程度的安全隐患。最终,Vercel 支付了约 75 万美元的赏金,用于奖励这些在关键时刻参与修复的开发者与安全研究人员。包括 React、Next.js 等团队在内的多方工程师也在周末全程投入,推动补丁快速落地。

    由于 React 用户群实在太广泛,除了 Vercel 受影响比较严重外,Cloudflare 也一度乱了阵脚。

    为了补救 React2Shell 漏洞带来的影响,Cloudflare 仓促推出一项变更,导致约 28% 的 HTTP 流量受到影响,大量依赖 Cloudflare 的网站返回 500 内部服务器错误,一度造成约四分之一的互联网流量无法访问。

    Cloudflare 首席技术官 Dane Knecht 随后表示,此次事件并非源于网络攻击,而是公司在仓促应对 React Server Components 中的高危漏洞时引入的内部变更所致。

    除了这些平台外,英国国家医疗服务体系 (NHS) 英格兰国家网络安全中心(CSOC)周四也表示,已经存在多个功能性的 CVE-2025-55182 概念验证漏洞利用程序,并警告说“在实际环境中继续成功利用该漏洞的可能性非常高”。

  • GPT-5.2来袭!办公效率原地起飞💥

    家人们,谁懂啊!日常工作中,做表格、写代码、处理长文本这些任务简直让人头大😩。每次遇到复杂问题,都恨不得有个超级助手来帮忙。这不,OpenAI 发布的 GPT – 5.2就成了我的救星🌟!

    GPT – 5.2定位是“最适合日常专业使用的模型”,经过数月研发,就是为了给咱创造更多经济价值。和前一代 GPT – 5.1相比,它在制作电子表格、构建演示文稿等多项任务上都有显著提升。就像那位免疫学研究者用 GPT – 5.2 Pro 生成免疫系统关键问题,深度和说服力都超棒👍。

    而且 OpenAI 在“AI 代理工作流”方面改进明显,目标是让 ChatGPT 成为更强大的个性化助手。好多企业,像 Notion、Shopify 等都提前拿到测试权限啦。GPT – 5.2更注重实用性和结构化输出,交互体验也很好。

    现在它会在 ChatGPT 逐步上线,先给付费用户开放,约三个月后 GPT – 5.1 就会下线。OpenAI 还会“渐进式”部署,保障咱的体验。宝子们,这么厉害的新模型,赶紧期待起来呀💗!

    #GPT – 5.2 #OpenAI #AI助手 #办公效率提升 #新模型发布

  • 2025北京AI白皮书发布,产值将超4500亿!

    宝子们👋,2025年11月29日,2025中国人工智能大会暨全国人工智能学院院长(系主任)年会在北京启幕啦🔥!

    会上发布了《北京人工智能产业白皮书(2025)》。这份白皮书可太有料了✨!它指出2025年全球人工智能从单点技术突破向生态协同创新演进。北京的人工智能产业发展成果那叫一个显著👏。

    产业规模量质齐升,2025年上半年核心产业规模就达到2152.2亿元,同比增长25.3%,全年有望超4500亿呢!AI企业超2500家,已备案大模型183款。而且高校院所、新型研发机构、核心企业产出众多前沿成果。政策体系丰富,产业生态活力迸发,投融资活跃,国际合作热度也提升了。

    未来,人工智能会推动生产力变革、拓展认知边界、促进技术普惠。北京在人工智能领域的地位那是杠杠的💯!咱一起关注这个充满潜力的行业吧,说不定能抓住新的机遇呢😎!

    #北京人工智能 #产业白皮书 #核心产值 #AI发展 #科技前沿

  • 300ms开声!微软实时语音模型绝了✨

    宝子们,今天必须给大家分享微软开源的实时语音模型VibeVoice – Realtime – 0.5B👏!

    以前用传统TTS模型,起音时间动不动就1 – 3秒,那种卡顿感真的太影响体验了😫,这就是我们在语音模型使用中的痛点。而VibeVoice – Realtime – 0.5B完美解决了这个问题,它从输入文本到发声平均仅需300毫秒,几乎零延迟,就像和真人对话一样,你打字对方就开始回应,超丝滑💯。

    它的能力还不止于此!它能一次性生成长达90分钟的超长音频,全程流畅自然,就像专业播音员朗读一样。而且原生支持最多4个角色同时对话,情绪切换丝滑。内置情感感知模块还能自动识别情绪,不需要手动标注,开箱即用👍。

    我亲自体验了一下,在HuggingFace上用它朗读《三体》第一章,毫无破音,效果超棒。它英文表现接近商用级别,中文也很优秀,虽然部分多音字、轻声词处理还有提升空间,但官方会推出精调版本。轻量级设计,在普通笔记本上就能跑满实时速度,已经可以集成到好多工具中啦。
    目前这个模型已经完全开源,支持商用,社区里也有很多有趣的Demo。宝子们别错过,赶紧去试试👇!