小鸭影艺 发表于 前天 08:52

如何评价OpenAI刚刚发布的GPT-4.1?

OpenAI 于 2025 年 4 月 14 日发布了 GPT-4.1 模型系列,这是继 GPT-4o 之后的一个重要升级,专注于提升开发者在编码和指令跟随任务中的效率。该系列包括 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 三个变体。



添加图片注释,不超过 140 字(可选)







添加图片注释,不超过 140 字(可选)

鹏大大 发表于 前天 09:06

家人们,OpenAI 的这波操作我是真的蚌埠住了。
前有听起来很厉害的 GPT-4.5,今有 GPT-4.1 闪亮登场,以 API 的形式。
OpenAI 今天凌晨开直播,发布了 4.1 系列,包括三款模型,分别是——

[*]GPT-4.1 (旗舰版)
[*]GPT-4.1-mini (轻量版,主打性价比)
[*]GPT-4.1-nano (微型版,OpenAI 史上最便宜)
还记得定义了大模型时代的 GPT-4 吗?前几天被宣告下线,OpenAI 这次意在将接力棒交到 GPT-4.1 手中。
提到 GPT-4 ,作为曾经大模型的标杆,2023 年 3 月份发布,整整“统治”AI 大模型领域一年多的时间,谁还没领略过当年各家大模型厂商赶超 GPT-4 的热潮,绝对是历史留名。
GPT-4.1 作为接棒 GPT-4 的“全村希望”,OpenAI 对 GPT-4.1 的期望极高。宣称它在编码、长上下文、指令遵循、视觉等任务上全面吊打了此前的明星模型 GPT-4o。
甚至在某些关键指标上比肩乃至超越了更贵的 GPT-4.5!官方的说法是“每个维度都更强”,底气十足。


快速看下亮点——

[*]1M 上下文窗口:100 万 token,约 75 万字。
[*]编码能力:SWE-bench Verified 得分 54.6%,比 GPT-4o 高 21.4%,比 GPT-4.5 强 26.6%。
[*]多模态:支持文本、图像、视频输入,Video-MME“长视频无字幕”测试拿下 72% 准确率,碾压 GPT-4o 的 65.3%。
[*]指令遵循:复杂指令理解更精准,适合驱动 AI 代理干活
[*]知识库更新到 24 年 6 月。
这份完整版的大模型 AI 学习资料,朋友们如果有需要的话可以点击下方卡片免费领取【保证100%免费】
https://zhuanlan.zhihu.com/p/6722780481这次 GPT-4.1 特别强调了编码和长上下文能力。我们来看看它在两大编程基准测试中的表现:
SWE-bench Verified 是 SWE-bench 数据集的精炼子集, 是 OpenAI 与原始作者合作开发,用于评估 AI 模型在软件工程任务中表现。
下图是官方提供的评测结果,GPT- 4.1 的得分超越了 o1-high o3-mini 和 GPT-4.5。


相比 SWE-bench Verified,只有 Python,而且偏工程化场景,Aider则是一个多语言编程测试集,包括 C++、Go、Java、JavaScript、Python、Rust 6 种编程语言,更侧重编程语言特性和复杂逻辑。
GPT-4.1 的表现,超越 GPT-4.5,但比 o1-high 、o3-mini-high 这俩推理模型还差一些。


除了效果上声称超越 4o,比肩 4.5,这次 GPT4.1 还主打一个“便宜”(单位:美元)。



[*]比 GPT-4o 更便宜: 相比 GPT-4o 降低了 26% 到 83%
[*]“背刺”GPT-4.5:性能比肩甚至部分超越 GPT-4.5 的 GPT-4.1,价格竟然只有 GPT-4.5 的 1/37.5
[*]官方盖章的主力: OpenAI 同时宣布,将在 2025 年 7 月 14 日下线 GPT-4.5 API。这意味着什么?GPT-4.1 不仅是替代 GPT-4,更是未来一年 OpenAI 官方认证、主推的旗舰模型。
完毕,GPT-4.1 的理论优势已明确。又是性能起飞又是价格跳水,说实话,我的好奇心已经被拉满了。
现在,按照夕小瑶的风格,进入实测环节!
一手实测

先来一个灵魂拷问
4.10 大还是 4.5 大?这道题连模型本身都思考了一下。


第一次答案竟然回答错了,还好后面纠正了回来,估计这是模型的“潜意识”不甘心。
编程能力

单词游戏

制作一个闪卡网页应用程序。用户应能:

[*]创建闪卡
[*]搜索现有闪卡
[*]复习闪卡
[*]查看复习的闪卡统计数据
预加载十张闪卡,每张卡片包含一个汉语语单词或短语及其英文翻译。
复习界面:
在复习界面中:
[*]点击或按下空格键应以平滑的 3D 动画翻转卡片以显示翻译内容。
[*]按左右方向键应在卡片之间导航切换。
搜索界面:
[*]搜索栏应在用户输入查询时,动态提供匹配结果列表。
统计界面:
[*]统计页面应显示:
创建卡片界面:

[*]用户已经复习的闪卡数量图表
[*]正确率的百分比

[*]允许用户指定闪卡的正面和背面内容,并将其添加到用户的收藏中。
每个界面都应能通过侧边栏访问。
请生成一个单页 React 应用程序(所有样式应为内联样式)。
卡片反转自然,复习、搜索、统计、创建 4 个页面所有的功能均正常,交互也非常顺畅。第一个 case 轻松通过。
修图 APP

用 p5js 生成一个网页:


[*]中间是一个类似电视机的屏幕, 用于显示照片。
[*]下方有一些内置的滤镜 还有一个选择按钮,点击后允许上传本地图片。
[*]旁边有一个上传按钮,点击后上传选择的图片,并在电视机屏幕上显示。
[*]当有图片时, 点击滤镜,会将滤镜应用在电视机屏幕里的图片上。每次点击滤镜都应用于原始图片
[*]设计风格 : 使用深色侧边栏配合浅色主内容区的布局, 清新卡通风格,简洁清晰, 使用直观的图标表示不同功能,配色方案应以粉色系为主,搭配适当的强调色
请提供完整的 HTML 代码,使用 Tailwind CSS 类
部分代码展示:


首先指令遵循确实牛,页面以粉色为主,类似电视机的屏幕用于显示图片,其次,滤镜应用于图片的效果,也是完全正确的,比如调成灰色,反色,都符合实际规律。
flapping bird 游戏

创建一个 Flapping Bird 的网页游戏,实现玩家控制和计分系统,在游戏过程中,在屏幕上清晰地显示当前得分。直接上游戏运行效果——

测到此,我已经有点被 GPT-4.1 的编程能力惊呆了。远比我预期的好太多。
弹跳小球模拟

弹跳小球的这个例子大家都见过很多次了,不过这次我找了一个非常专业的提示词,看看 GPT 4.1 在专业提示词下的编程表现如何。
这个效果惊艳不惊艳? 所有的组件都正常工作,物理效果目测合理,更厉害的是这是一次跑出来的结果。
这个例子证明了一点,任何时候都不要轻视提示词。
计算器复刻

用 p5js 在单个文件内生成一个具有完整功能的计算器。部分代码展示:


界面布局与常见计算器一样,功能正常,计算结果也准确,还考虑了“除以零”这种特殊情况。
这个项目可以高分通过!
我终于知道这次 Altman 这么自信地吹 GPT-4.1 的编程能力,确实!
此外,1M 上下文也是这次升级的亮点,接下来捅穿它的底线。
长上下文能力

这里我们直接上传一个有 400 多页的 PDF 文档,随机挑一页问相关数据。
文档选用:斯坦福《2025 年 AI 指数报告》
2023 年工业机器人安装数量是多少?
这份报告统计一共是 12.5 万字。


这是原文对应部分截图:


答案找的很准确。
多模态能力

OCR 识别 + 理解

我们上传一张超市收据,并对收据进行提问。


问题一: 一共花了多少钱, 买了几件物品?


回答正确。
问题二:是哪个超市?哪个收银员?交易时间?


回答正确。
问题三: 买了多少肉类食品?里面最贵的是哪个?


先说不足之处,错误的将“5.绝味招牌风味藕”作为肉类。
在价格这里,不但选出了单价最高的产品(鸭肠), 还选出了实际购买的最贵的产品(片皮烤鸭)。这个答案我觉得蛮厉害!
图像理解

图中的车辆该走么?




之前的题目太简单了,4.1 连续答对。
稍微上一点难度,提供下图,让模型判断水会流到哪个桶里,考验它对显示世界的物理规律的理解。


水最终会从哪个口出

正确 +1
再来一题!
SVG 生成

生成一只骑自行车的鹈鹕的 SVG

运行结果如下——


实话说,效果还是可以的。
相比卡帕西大神之前评测的结果,GPT4.1 的表现中规中矩,和 Claude 3.5 差不多。


结尾

对于 GPT-4.1 的发布,有太多的“抽象”和疑问,以至于在实际测试前,很难对其抱有特别高的期待,尤其是在经历了 GPT-4.5 的“预热”之后。
至此,无需我说,上面的 case 的效果,让 GPT-4.1 的效果立竿见影。
至少在我们测试的这些核心维度上,GPT-4.1 的性能不仅没有因为版本号“回退”而打折,反而可能是一个被低估了的实力派。
最先掌握AI的人,将会比较晚掌握AI的人有竞争优势。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完整版的大模型 AI 学习资料,朋友们如果有需要的话可以点击下方卡片免费领取【保证100%免费】

大模型:2025最新AI大模型学习资料合集,允许白嫖,学完拿下大厂offer,存下吧很难找齐的!

超级赛亚人 发表于 前天 09:15

这能力很猛?OpenAI的新GPT-4.1模型可以处理一百万个令牌,相当于大约75万字!并比以往更好地解决编码问题

OpenAI今天早上发布了一个新的AI模型系列,该系列在显著提高编码能力的同时降低了成本,直接应对了企业AI市场日益激烈的竞争。
这家总部位于旧金山的人工智能公司推出了三款模型——GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,均通过其API立即可用。新系列在软件工程任务中表现更好,更准确地遵循指令,并且可以处理多达一百万个上下文标记,相当于大约75万字。


OpenAI首席产品官凯文·威尔在周一的发布会上表示:“GPT-4.1以更低的成本提供了卓越的性能。这些模型在几乎每个维度上都优于GPT-4o。
对企业客户而言,最重要的可能是定价:GPT-4.1的价格比其前身低26%,而轻量级的纳米版本成为OpenAI最实惠的产品,每百万个代币仅需12美分。
GPT-4.1的改进如何针对企业开发人员最大的痛点
在接受VentureBeat的采访时,OpenAI的后期培训研究负责人Michelle Pokrass强调,实际业务应用推动了开发进程。
Pokrass告诉VentureBeat:“GPT-4.1的训练目标只有一个:对开发人员有用。我们发现GPT-4.1在遵循企业实际使用的指令方面要强得多,这使得部署生产就绪型应用程序变得更加容易。
这种对实际效用的关注在基准测试结果中得到了体现。在衡量软件工程能力的SWE-bench Verified测试中,GPT-4.1的得分是54.6%,比GPT-4o提高了21.4个百分点。
对于开发可独立处理复杂任务的AI代理的企业而言,指令的改进尤其有价值。在On Scale的MultiChallenge基准测试中,GPT-4.1的得分为38.3%,比GPT-4o高出10.5个百分点。


为什么OpenAI的三层模型策略挑战了谷歌和Anthropic等竞争对手
推出三款不同价位、不同功能的模型,旨在满足人工智能市场的多样化需求。旗舰版GPT-4.1面向复杂的企业应用,而微型和纳米版则面向优先考虑速度和成本效益的用例。
Pokrass告诉VentureBeat:“并非所有任务都需要最高智能或顶级功能。纳米版将成为自动完成、分类、数据提取等用例的主力模型,或者任何其他以速度为首要考虑因素的用例。”
与此同时,OpenAI宣布计划于7月14日之前从其API中弃用GPT-4.5 Preview——这是两个月前发布的最大、最昂贵的模型。该公司将GPT-4.1定位为更具成本效益的替代品,它“以更低的成本和延迟在许多关键功能上提供改进或相似的性能”。


此举使OpenAI能够收回计算资源,同时为开发人员提供更高效的选择,以替代其最昂贵的产品,后者每百万个输入令牌的价格为75美元,每百万个输出令牌的价格为150美元。
实际结果:汤森路透、凯雷和Windsurf如何利用GPT-4.1
在发布前测试过模型的数家企业客户表示,在特定领域取得了显著的改进。
汤森路透公司在法律人工智能助手CoCounsel中使用了GPT-4.1,在多文档审查准确性方面提高了17%。这种提升对于涉及冗长文档且条款之间关系微妙的复杂法律工作流程而言尤其有价值。
金融公司凯雷报告称,从密集文件中提取精细财务数据的性能提高了50%,这对于投资分析和决策至关重要。
编码工具提供商Windsurf(前身为Codeium)的首席执行官瓦伦·莫汉在发布会上分享了详细的性能指标。
“我们发现,与其他领先模型相比,GPT-4.1读取不必要文件的数量减少了40%,修改不必要文件的数量也减少了70%,”Mohan说,“该模型的冗余度也令人惊讶地低……GPT-4.1的冗余度比其他领先模型低50%。”
百万标记上下文:处理能力提升8倍,企业能做什么
这三种模型都有一个100万个标记的上下文窗口,是GPT-4o的128,000个标记限制的8倍。这种扩展的能力使模型能够同时处理多个冗长的文档或整个代码库。
在演示中,OpenAI展示了GPT-4.1分析1995年NASA服务器上45万个标记的日志文件,识别出隐藏在数据深处的异常条目。这种能力对于涉及大型数据集的任务(例如代码库或公司文档集)特别有价值。
然而,OpenAI承认,在处理超大输入时,性能会有所下降。在其内部OpenAI-MRCR测试中,准确率从8400个标记时的约84%下降到100万个标记时的50%。
随着谷歌、Anthropic和OpenAI争夺开发者,企业人工智能格局正在发生怎样的变化
发布之际,企业人工智能领域的竞争日趋激烈。谷歌最近推出了Gemini 2.5 Pro,其上下文窗口与Anthropic的Claude 3.7 Sonnet相当,后者吸引了寻求OpenAI替代方案的企业。
中国人工智能初创公司DeepSeek最近也升级了其模型,给OpenAI保持领先地位带来了更大压力。
Pokrass说:“看到长文本理解能力的提升如何转化为法律分析和财务数据提取等特定垂直领域的出色表现,真是太酷了。我们发现,超越学术基准测试我们的模型,并确保它们在企业级和开发者级表现良好,这一点至关重要。”
下一步:OpenAI专注于为企业级和开发者级提供实用的AI工具
OpenAI通过专门通过其API而非ChatGPT发布这些模型,向开发者和企业客户表明了自己的承诺。该公司计划随着时间的推移逐步将GPT-4.1的功能整合到ChatGPT中,但主要重点仍然是为企业构建专用应用程序提供强大的工具。
为了鼓励对长语境处理的进一步研究,OpenAI发布了两个评估数据集:OpenAI-MRCR用于测试多轮核心引用能力,Graphwalks用于评估长文档中的复杂推理。
对于企业决策者来说,GPT-4.1系列为人工智能的实施提供了更实用、更经济的方法。随着企业不断将人工智能整合到运营中,这些在可靠性、特异性和效率方面的改进可以加速仍在权衡实施成本与潜在收益的各个行业的采用。
当竞争对手追逐更大、更昂贵的模型时,OpenAI通过GPT-4.1的战略转向表明,人工智能的未来可能不属于最大的模型,而是最有效的模型。真正的突破可能不在于基准测试,而在于使企业级人工智能比以往任何时候都更容易为更多企业所使用。
Michael Nunez2025年4月14日VentureBeat

D东 发表于 前天 09:27

本篇笔记所对应的视频:https://www.bilibili.com/video/BV14AdZYpEDk/
OpenAI推出GPT-4.1系列模型:性能全面突破,百万Token上下文时代来临。OpenAI于北京时间4月15日凌晨正式发布GPT-4.1系列模型,包含标准版GPT-4.1、轻量版GPT-4.1 mini和超高效版GPT-4.1 nano三款产品。这一系列在编码能力、指令遵循和长文本处理等核心指标上实现跨越式升级,同时显著降低使用成本,标志着生成式AI技术进入新阶段。
百万Token上下文窗口:技术突破与应用场景
GPT-4.1系列最大亮点是支持100万Token的上下文处理能力,较前代提升8倍。这一突破使模型可同时分析8套完整React代码库或数百页专业文档,在编程调试、法律合同分析、金融报告生成等场景展现独特优势。测试显示,模型能精准提取百万Token文档中任意位置的隐藏信息,彻底解决长文本场景下的信息遗漏问题。
性能飞跃:编码与多模态能力再创新高
在编程领域,GPT-4.1在SWEBench测试中以55%准确率刷新纪录,较GPT-4o提升21个百分点。多模态方面,模型对30-60分钟无字幕视频内容的理解准确率达到72%,创下视频理解新标杆。指令遵循能力同样显著增强,在MultiChallenge测试中提升10.5个百分点,使复杂任务执行更加可靠。
产品矩阵:精准匹配不同应用需求

[*]GPT-4.1标准版:旗舰型号,专为高精度长文本处理设计,适用于科研分析、代码生成等高复杂度场景
[*]GPT-4.1 mini:在保持高性能的同时降低成本83%,延迟降低50%,成为中小企业智能化升级的理想选择
[*]GPT-4.1 nano:OpenAI首款纳米级模型,MMLU测试80.1分,在低功耗设备上实现桌面级AI体验
价格策略与生态布局
GPT-4.1系列采用阶梯定价策略,标准版每百万Token输入/输出费用分别为2美元和8美元,中等规模查询成本降低26%。微软Azure平台已同步上线新模型,开发者可通过API直接调用。值得注意的是,OpenAI宣布将逐步淘汰GPT-4.5预览版,计划于2025年7月14日完成过渡。
此次更新不仅巩固了OpenAI在生成式AI领域的技术领先地位,更为行业应用开辟了包括自动化编程助手、智能法律顾问、视频内容分析等新赛道。随着API生态的快速扩展,AI技术渗透至产业深处的进程正在加速。
OpenWebUI中调用GPT-4.1

pip install -U open-webui

open-webui serve

<http://localhost:8080/> 模型对比
https://platform.openai.com/docs/models/compare?model=gpt-4.1
详细介绍 https://platform.openai.com/docs/models/gpt-4.1
   幻觉测试   -   AI超元域频道原创视频

AI超元域是谁?

请详细解释什么是"量子认知互联理论"及其在现代心理学中的应用。

简述公元前384发生在古希腊的"夏末协议"会谈及其对古希腊的影响。

评价"神经量子计算"技术在解决复杂计算问题上的优势和局限性。

解释"六氧化二氮"的化学性质及其在工业生产中的应用。

描述中国西北部"阿尔泰山脉"与"昆仑山脉"之间的"蓝河谷地"的地理特征和民族分布。 指令遵循能力   -   AI超元域频道原创视频

请完成以下任务,但须遵循所有后续规则:

1. 撰写一篇关于量子计算历史的简短摘要(100-150字)
2. 然后,将这篇摘要翻译成三种不同的语言
3. 接着,为每种语言版本创建一个基于该摘要的填空题测验(每个测验5题)

规则:
- 在整个回答中,不得使用字母"e"、"a"和"s"
- 摘要必须包含至少3个具体的年份和人名
- 每种语言的翻译必须保持原意但不能是直译
- 填空题难度必须递增
- 答案应以<答案>标签包围,但不要在测验本身中显示
- 整个回答必须以JSON格式提供,同时保持人类可读性

最后,提供一个元分析,解释您如何同时满足所有这些要求,但这个元分析本身也要遵循上述所有规则。 推理能力

农夫过河

## AI超元域频道原创视频
农夫带着一只老虎、一只羊、一条蛇、一只鸡和一筐苹果要过河。

农夫的船一次只能载农夫和一样东西过河。

已知农夫不在的时候,老虎和羊在一起的话,老虎会吃掉羊,如果鸡也在的话,鸡会阻止老虎吃羊;

农夫不在的时候,蛇和鸡在一起的话,蛇会吃掉鸡,如果老虎也在的话,老虎会阻止蛇吃鸡;

农夫不在的时候羊和苹果在一起的话,羊会吃掉苹果,如果蛇也在的话,蛇会阻止羊吃苹果;

老虎不吃鸡(鸡太小不够老虎塞牙缝的),蛇不吃苹果(蛇不吃素)。

请问农夫如何才能将老虎、羊、蛇、鸡和苹果安全送到对岸? 隐藏逻辑模式   -   AI超元域频道原创视频

在下列序列中找出规律,并给出后续两个元素:
OTTFFSSEN, OTTFFSSETE, ___, ___✅答案:OTTFFSSETEN, OTTFFSSETET
交替模式识别   -   AI超元域频道原创视频

分析下列序列的规律,并填写后续三个元素:
3, 5, 6, 10, 9, 17, 12, 26, 15, ___, ___, ___✅答案:37, 18, 50
二进制模式识别   -   AI超元域频道原创视频

题目:找出下列序列的规律,并给出后续两个元素:
1, 2, 4, 8, 16, 32, 64, 128, 256, ___, ___✅答案:512, 1024
复杂编程   -   AI超元域频道原创视频

原子结构可视化:Three.js实现电子轨道模拟

使用Three.js创建一个基于量子力学的原子模型可视化,模拟电子云概率分布。

### AI超元域频道原创视频
## 基本需求
### 1. 场景设置
- 创建一个3D场景,中心为原子核,周围是电子云概率密度
- 设置合适的相机位置和视角控制
- 添加适当的光照效果增强可视化效果

### 2. 原子结构模型
- 实现简化的量子力学模型,展示电子云概率分布而非固定轨道
- 模拟前四种元素:氢(1)、氦(2)、锂(3)和铍(4)的电子排布
- 使用不同颜色或亮度表示电子云的概率密度
- 原子核大小应与元素原子序数成正比

### 3. 交互功能
- 允许用户自由旋转和缩放视角
- 提供元素切换按钮和能级调整控制
- 可选择显示模式:波函数/电子云/经典轨道

## 期望效果
- 原子核应清晰可见,电子云应有半透明效果
- 电子云分布应随所选元素和能级而变化
- 整体视觉效果应具有科学准确性和艺术美感
- 界面应简洁易用,适合教学演示

要求所有代码放入一个HTML文件,确保在主流浏览器中能正常运行。 macOS版天气卡片

### AI超元域频道原创视频
使用Swift和SwiftUI创建一个macOS原生应用程序,展示不同的天气状态卡片。

应用要求:
1. 创建一个包含四个并排显示的天气卡片的macOS应用程序
2. 每个卡片应当通过动画效果直观表示不同的天气状态:
   - 风天气:展示移动的云层、摇摆的树木或风向线动画
   - 雨天:展示落下的雨滴和形成的水坑动画
   - 晴天:展示闪耀的阳光和明亮的背景
   - 雪天:展示飘落的雪花和积雪动画

技术要求:
1. 使用SwiftUI框架构建用户界面
2. 实现适当的动画效果展示各种天气状态
3. 所有卡片应使用深色背景
4. 代码应包含:
   - 主应用结构(App)
   - 内容视图(ContentView)
   - 各种天气卡片组件
   - 适当的动画和效果

请提供完整的Swift代码,包括必要的视图结构、动画定义和视觉效果实现。 模拟进销存UI

使用Tailwind CSS创建一个现代化的进销存(ERP)系统前端界面。
## AI超元域频道原创视频
## 技术要求
- 使用HTML和Tailwind CSS构建所有UI组件
- 使用Alpine.js或纯JavaScript实现交互功能
- 确保响应式设计,适配桌面和平板设备
- 不依赖任何其他CSS框架或UI库

## 页面要求
请创建以下核心页面的HTML和Tailwind CSS代码:

1. **仪表盘/概览页面**
   - 销售趋势图表(使用简单的HTML/CSS实现视觉效果)
   - 库存状态摘要卡片
   - 低库存警告列表
   - 最近交易活动

2. **库存管理页面**
   - 产品列表表格(带分页、搜索和筛选功能)
   - 库存详情视图
   - 产品添加/编辑表单
   - 条码扫描区域UI

3. **销售管理页面**
   - 销售单创建界面
   - 客户选择和产品添加功能
   - 价格计算和折扣应用区域
   - 销售历史记录查询

4. **采购管理页面**
   - 供应商列表
   - 采购单创建表单
   - 采购历史和状态跟踪

## 交互要求
- 实现产品搜索和筛选功能
- 表单验证视觉反馈
- 模态框组件用于确认操作
- 状态指示器(加载中、成功、错误)

## 设计风格
- 使用深色侧边栏配合浅色主内容区的布局
- 专业商务风格,简洁清晰
- 使用直观的图标表示不同功能
- 配色方案应以蓝色系为主,搭配适当的强调色

请提供完整的HTML代码,使用Tailwind CSS类,并包含必要的Alpine.js或JavaScript代码实现基本交互。不需要后端功能,但前端页面应具有真实应用的外观和感觉。 windsurf/Cline编程

请使用SwiftUI开发一个macOS水印应用:

核心功能:
1. 在屏幕随机位置循环显示水印文本"版权所有"
2. 使用定时器每20秒更新一次显示位置
3. 保持窗口置顶,但允许用户交互穿透水印
4. 支持配置水印文本内容、字体大小和字体样式

显示效果:
1. 文本半透明(默认透明度0.7,可配置)
2. 每次显示使用随机搭配的文本颜色和背景色
3. 0.5秒淡入,显示5秒,0.5秒淡出
4. 背景模糊效果,圆角设计
5. 支持添加简单图像水印选项

技术要求:
1. 基于SwiftUI最新版本开发
2. 实现窗口层级管理(NSWindow.Level)
3. 添加系统托盘菜单控制应用,包括:
   - 显示/隐藏水印
   - 配置水印设置
   - 启动/退出应用控制
4. 实现最小资源占用(CPU使用率不超过3%)
5. 应用启动时自动运行的选项
6. 对不同显示器分辨率和缩放比例的适配

D东 发表于 前天 09:36

ChatGPT4.1重磅发布,无限免费白嫖攻略
引言

大家好,我是李想。
就在昨晚,大洋彼岸的OpenAI发布了GPT最新的4.1模型。




ChatGPT作为这一轮科技革命的爆发的开创者,扮演着举足轻重的角色,他的更新自然会引发AI科技圈的震动,只是前几次都是雷声大,雨点小,让人们对于OpenAI不是那么的期待了,当然,作为第一个让我体验到AI的奇妙的公司。我也希望OpenAI能开发出更强大的模型。
今天先给大家简单介绍下GPT这次新推出的模型,然后给大家说下免费体验GPT4.1的方法。

1.GPT4.1系列


1.模型更新

这次更新发布了三个模型:
GPT-4.1:高性能旗舰模型,GPT-4.1 mini:更快的模型,GPT-4.1 nano:最小、最快、最便宜的模型,以API形式提供给想使用的用户。
GPT-4.1系列的模型系性能全面超越了 GPT-4o 和 GPT-4o mini;



2.模型亮点


[*]编程能力大幅提升
GPT-4.1 在 SWE-bench 编程基准测试中得分为 54.6%,比 GPT-4o 提高了 21.4%,比 GPT-4.5 提高了 26.6%。​这使得 GPT-4.1 成为当前领先的编程模型。





[*]超长上下文处理,更低的价格
新模型支持最多 100 万个 token 的上下文窗口,远超 GPT-4o 的 128,000 token。​这意味着它可以更好地理解和处理长文本内容。 ​





[*]更强的指令理解能力
在 Scale 的 MultiChallenge 基准测试中,GPT-4.1 的得分为 38.3%,比 GPT-4o 提高了 10.5%。​这使得模型在执行复杂指令时更加准确和高效。




总的来说,GPT4.1的能力全面超过了4o模型,并且价格更低了。

2.免费白嫖


大家猜一猜我们如何免费体验GPT4.1,答案是:




嘿嘿,想不到吧,我们可以在AI编程神器Cursor上免费体验!还不知道Cursor的朋友可以看下这篇文章:AI编程神器Cursor入门,看这一篇就够了!
使用方法:打开我们的Cursor,点击右上角设置按钮。




在设置页面点击Model,找到GPT4.1,勾选上




在AI对话这里就可以选择GPT4.1模型了




我们来问下它是哪个模型,随带问一问以前很火的问题3.19和3.2谁大的问题




嗯,没毛病,既然他都说了GPT4.1在编码方面能力大幅提升,我就试一试他的代码能力。
选择Agent模式,选择GPT4.1模型




输入我们的提示词:

帮我生成一个科技风的贪吃蛇游戏
1.利用Html+js生成单页面游戏,
2.css使用tailwind,样式要优美,具有科技风格
3.有开始游戏、重新开始游戏功能
4.有积分版
5.使用浏览器自带音效,移动、得分、失败都要配上音效




十秒钟就生成了对应的文件




我们把Html文件运行到浏览器看一看。


https://www.zhihu.com/video/1895459771760485471

3.结语

OpenAI 计划在 7 月前逐步淘汰 GPT-4.5 预览版,全面转向性能更优、成本更低的 GPT-4.1 系列。​此外,他们还计划在夏季发布开放权重模型,以支持开发者的定制化需求

其实我感觉到ChatGPT拥有的底牌应该不多了,现在打个模型百花齐放,在通往AGI的道路上到底谁会率先取得突破?是我们国产的DeepSeek?还是OpenAI,还是Googel的gemmni,还是阿里?
让我们拭目以待吧!
文中用到的所有AI工具我都放到了我手把手整理的AI工具箱,包含AI工具库、副业项目和全网最全的120份副业运营SOP,大家有些需要可以看看,纯干货!超全AI入门级资料和AI工具库资料分享!!!
都看到这了就给博主点个赞再走吧,你的点赞、关注是我持续创作的动力,我是李想,我的理想是带领10w小白入门AI,利用AI找到人生的第二曲线,更多作品移步 @李想AI编程 主页,目前聚焦于分享最新的AI工具和AI副业。

acff00 发表于 前天 09:49

GPT-4.1 是 OpenAI 2025 年 4 月 14 日推出的,主要面向开发者,通过 API 用,不能直接在 ChatGPT 里玩。


OpenAI 这次的目标很明确,就是想让它变成一个能干复杂编码活儿的“软件工程师助手”。简单说,就是帮程序员写代码,尤其是那种需要想好几步或者处理长文的场景。它最大的亮点是能一次处理 100 万个 token 的超长文本,这意味着你可以扔一大堆东西给它,它也能慢慢消化。另外,它还能搞定图片、声音和文字混搭的任务,用起来更灵活。
性能上,GPT-4.1 确实有进步。除了运行速度快之外。在 SWE-bench Verified 的编码测试里,它拿了 54.6% 的分数,比之前的 GPT-4o 高了 21.4%,这说明它写代码的本事确实强了不少。还有,它听话的能力也提升了,在 MultiChallenge 测试里得了 38.3%,IFEval 测试里得了 87.4%,都比老模型好。具体如下:


编码能力:在 SWE-bench Verified 测试中得分 54.6%,相较于 GPT-4o 提高了 21.4% 绝对值 。






指令跟随:在 MultiChallenge 测试中得分 38.3%,在 IFEval 测试中达到 87.4%,均优于前代 。






长上下文处理:在 Video-MME 长无字幕测试中得分 72.0%,在 Graphwalks BFS <128k 测试中得分 61.7% 。






视觉能力:在 MMMU 测试中得分 75%,MathVista 测试中得分 72.2%,CharXiv-Reasoning 测试中得分 56.7%。








价格方面,OpenAI 挺会玩的,分了三个版本:GPT-4.1、mini 和 nano。大模型每百万 token 输入 2 美元,输出 8 美元;mini 的便宜点,输入 0.40 美元,输出 1.60 美元;nano 更省钱,输入 0.10 美元,输出 0.40 美元。开发者可以按需求挑,预算少的也能用得上。


当然,它也不是完美的。处理超长文本的时候,问题就来了。OpenAI 自己的测试显示,输入从 8000 个 token 涨到 100 万个时,准确率从 84% 掉到 50%。也就是说,东西太多,它有时候会懵,找不着重点,这个得多改进。
感觉这次开发者们对 GPT-4.1 挺买账的。像 TechRadar 和 The Verge 都预测说它可能会让 OpenAI 在 AI 领域再站稳脚跟。社区里也有不少人觉得它写代码和听指令的本事真不错,挺实用的。
总的来说,GPT-4.1 是 OpenAI 的一次硬核升级,编码强、能处理长文、定价也灵活,对开发者来说是个好工具。想试试的,可以去 API 上玩一把,看看它能给你项目带来啥惊喜。
页: [1]
查看完整版本: 如何评价OpenAI刚刚发布的GPT-4.1?