您怎么看GPT 4o？

您怎么看GPT 4o？

发表于 2025-4-18 14:00:46

GPT4o是算力最强的大模型，意思是GPT4o比起其他的AI，更像人，更容易训练更快学习。
由官方公布的数据可知，GPT4o是性价比最高的新模型。

然而算力评定，有很多人都做过测试，其中我个人最认可的是国外大佬创建了一个主题数据集，可以用来衡量不同大型语言模型（LLM）的分类性能。
该数据集由200个句子组成，分为50个主题，其中一些主题彼此紧密相关，旨在增加分类任务的难度。
整个数据集由开发者手动创建并标注，语言为英文。
使用GPT-4（gpt-4-0613）将数据集翻译成多种语言，在评估中，只评估数据集的英文版本——这意味着结果不应受到使用相同语言模型进行数据集创建和主题预测可能引起的潜在偏差的影响。

评定的模型有：

GPT-4o: gpt-4o-2024-05-13
GPT-4: gpt-4-0613
GPT-4-Turbo: gpt-4-turbo-2024-04-09
Gemini 1.5 Pro: gemini-1.5-pro-preview-0409
Gemini 1.0: gemini-1.0-pro-002
Palm 2 Unicorn: text-unicorn@001

语言模型的任务是将数据集中的每个句子与正确的主题进行匹配，这使我们能够计算每种语言的准确度分数和每个模型的错误率，由于模型大多分类正确，错误率越低，模型性能越好。
国内由于地域不太方便，我当时测试时用的是API个中转，我就用的是下面这三个，非常丝滑！
A. AI 云原生：
https://aicloud.mygptmeta.com/

B.渗透智能-ShirtAI:
https://www.myshirtai.com/

C.GPTMeta API：全球大模型API
https://api.mygptmeta.com/

由此可见，GPT-4o 的错误率是所有模型中最低的，只有 2 个错误，至于其他的如Palm 2 Unicorn、GPT-4 和 Gemini 1.5 接近 GPT-4o——说明这些模型也是紧跟其后。
有意思的是，GPT-4 Turbo 的性能与 GPT-4–0613 类似，根据这个测试，则更加证明了GPT4o在对语句以及文字上是最强！
而我最经常用GPT4o，就是在写作方面，可以说只要训练方法得当，就能让GPT4o一分钟对联、一分钟直译文言文、一小时读完百万字小说。
由于篇幅有限，与AI使用权限和入门使用方法的部分，我就不多说了，大家可以到知乎知学堂的AI应用公开课学习，里面有详细讲解20多种主流AI工具的实操技巧和权限获取
入口我放下面了：
点击上面卡片，添加工作人员就会发送AI工具体验，还有教程和资源，不然给你AI工具你也不会用。

下面我来说说高级玩法～
一.教会GPT4o耍对联

一开始的GPT4o是连对联的平仄也不会！
问题是：下联为水天一色月无边，请对上联！

楼是平声，边也是平声，对联最简单都要仄起平收，放心这种情况在任何一个AI上，都是一样，目前AI都不会用，接下来是训练的方法：

1.GPT学习《学对歌诀》，这是让GPT学习最简单的对联训练资料
2.教GPT分辩什么仄起平收（今音，古音较复杂并非加入训练），对联的基本规则
3.教GPT分辩对联规则，同类词对应
4.教GPT检查上下联不能出现相同字数

一步一步来，先输入《学对歌诀》让GPT「学习」：

接下来就是教会GPT什么是仄起平收：

先问GPT对仄起平收的理解，只有这样我才知道GPT的真实对联水平怎么样？
然后直接给出判定今音仄起平的条件和数词类、事物类的判定条件，还提出了让GPT标出拼音来辅助判断等等，具体的Prompt：

1.尾字「仄起平收」：普通话读音1、2声调为平声，3、4 声调为仄声（没有用古音的平仄，得要加入林正三的方法或者死记古仄字）——这是对联知识，预设条件。
2.可以在撰写答案时，可以标出拼音以及声调就知道是否对错——运用GPT「自检」，让GPT根据平仄的条件来对输出的上联时判断，尾字标出拼音后检查是否符合平仄条件，不符合就重写。
3.与数词一二三……十百千比较是否数词，与「天、地、日、月、山、河、川」比较是否同类词——对联知识，这是预设条件，要求对「一色」时也要用数词来对，还有「水天」要对仗得是同样的词类，这是让GPT自检自己的输出内容，然后根据预设条件判断词类是否一致。
4.最后要对比上联跟下联「水天一色月无边」中的每个汉字比较，是否上下联有相同的汉字——让GPT自检，判断依据就是上下联是否出现相同的汉字。

结果很好！
出句：水天一色月无边
对句：风雨千重山有路

就这样简单的训练，GPT4o就具备了对景物联的能力。
其实对联的平仄还得加上：135不论，246分明。

眼利的小伙伴会发现，训练GPT4o怎么就那么容易？
并且我把多个需求整合到一条Prompt当中！不需要什么高性能显卡以及大数据！！！
是的，只要一条Prompt，而不是多条Prompt，就能训练GPT4o，这是GPT4o的新特性，具有记忆功能，gpt可以记住自己的操作，从而可以修改自己的操作。

这样就相当于是灯神给你三个愿望。你可以许愿，要无数的愿望一样。

GPT4o免费用户一天只能40条，GPT Plus20刀一个月的2小时也就80条，随意浪费了一条都是钱吖！
可以设定任务后，让GPT自己判断没有问题后，就可以继续下一步，具体能进行多少步，就得看你的Prompt写得有多精细：if……else if ……else。
二.一次读百万字小说

除了用来对联，还可以训练GPT4o用来阅读小说，GPT一次只能上传约100万字以内的文本内容，于是我就分两次来传，一次可以阅读8章，然后「继续」就能再读8章。
解析一下以下的Prompt：

请阅读上传的文档「道诡异仙0.docx」，写精读笔记，显示为中文，要求：上传文件，并且要求要显示中文，不然很容易显示为英文
1.精读笔记要有时间、主角、地点和发生的事件

预设一个条件，就是让GPT读完之后，要按每章以时间、主角、地点、事件整理出来

2.读第一章就写一个200字的精读简要，写时要符合「1」的要求

前一句是命令GPT做一个200字精读简要，后一句是让GPT自检要满足「1」的条件

3.继续读下一章，写一个200字的精读简要，写时要符合「1」的要求

这个是相当于for，让GPT读完第一章之后再读下一章，同时还要自检要满足「1」

4.不断重复「3」，直到读到「第五百零六章道士」，才能结束

这一条是让GPT一直读完「第五百零六章道士」

5.检查是否「4」是否执行，如果没有执行就继续执行「4」

这个是让GPT自检，是否读完了「五百零六章」，没有就要继续读！

然而，GPT的算力最强，只能读8章，接下来只能一直「继续」，所以要搞个脚本，例如等个五分钟，发送文本「继续」并按下回车键，就能一直读下去。
很多小伙伴在用AI工具时，总会觉得这AI工具不好用，以及输出质量堪优，看完本文估计就有了答案吧！
其实你随手找的AI工具，肯定不如专业的AI工具，有了AI工具，还得专业的Prompt针对你的需求来训练，你没有AI工具，也不知道怎么训练和使用AI，可以直接知乎知学堂的AI应用公开课学习一下，添加助教老师，就能领取到AI工具体验，还有Prompt教程，不会用AI工具，课上都会讲AI文案、AI写作、AI绘画、AI制作PPT、AI视频等等实例。
入口在下面：
<a data-draft-node="block" data-draft-type="edu-card" data-edu-card-id="1807080632171507712">所以GPT4o能干什么？
就看你想干什么，基本上人能做的，GPT都能做，GPT不会就当是自家儿子让他学习！

发表于 2025-4-18 14:14:08

我怎么看，我看不了，现在开放的GPT4o和发布会上的4o根本不是一个物种。
发布会介绍的4o是一个可以实时的用视觉以及听觉信息沟通的怪物，把手机摄像头功能给它打开，它能够告诉你面前有什么，甚至还能根据你的语音语调来判断你的心情状态等等。
这是当时的一个案例视频，描述的这两个OpenAI的员工在庆祝某一个人的生日。

https://www.zhihu.com/video/1796228858237816833
它甚至在发布会上强到可以识别狗的状态。

https://www.zhihu.com/video/1796228904278683648
注意，真正的或者说满血版的GPT4o应该是一个可以「实时接收信息并作出几乎无延时反应」的怪物。

但实际上开放给大众的GPT4o是这个东西，跟GPT4以及GPT3.5没有本质性的区别，说白了还是你说一句它回一句的版本。

只是据说增加了视觉处理方向的能力，说实话这种图片解读GPT4，也就是它的上一个版本做的也不错，

这是GPT4的结果，我个人觉得大差不差，GPT4o好像是升级了它的描述功能。

但是不管怎么说，发布会上的GPT4o跟现在只有开会员才能用的GPT4o并不是一个东西，特别是最关键的「实时」或者是「低延时」的交互功能没有开放。
如果让我评价“满血版”GPT4o，我会给予我的最高评价：
1 超强的多模态能力，文本、音频和视觉输入输出无缝连接
2 情感识别：可以读取人类情绪，人机交互的新范式
3 快速相应：平均320毫秒的反应速度，跟人类相差无几
4 性能提升：处理速度翻倍，价格减半。
这些特性代表了AI走向全面化以及普及化，但问题是它跟Sora一样，没有把宣传上的功能展现出来，甚至真正展现的时间都遥遥无期。
所以我们可以理解为OpenAI最强的大模型其实还是23年的年中推出的GPT4，但问题是差不多过去了一年多的时间OpenAI并没有发布更强的模型，而这段时间内国内外很多厂家都在发力，推出了不输GPT4多少的产品，还有之前落在下风的开源大模型，这段时间也在奋起直追。
这些行为倒逼GPT4o“有限度的免费”，这个条件就是一天限制几条免费，其实跟之前区别不大，还是只有ChatGPT3.5无限畅饮，其他的都要收费。
所以如果想要满足自己对于更好更强的大模型需求，只有两个解法，要么直接买OpenAI的会员，一个月20刀，要么拥有独属于自己的大模型。
毕竟最强的开源大模型性能直追GPT4，特别是还具备了闭源大模型绝对不可能满足的“本地运行确保数据安全”的特性。
不过好在现在的开源大模型很多，我们只需要做简单的训练跟微调就可以拥有自己的专属AI助手，比如根据自己的编程习惯训练出来的AI Agent，可以说是又快又好，事半功倍。
开源大模型其实正好对应了具体的业务场景，比如很多的公司就在用开源大模型结合自己公司内部的知识库进行专属大模型的开发，这样的大模型甚至要比GPT4o更加适合自己的业务。
甚至一些人已经用大模型给自己量身定制了一套AI智能体，也就是所谓的AI超级个体，一个人承包了以前一个团队才能做完的活。
对AI大模型感兴趣的，特别是对于大模型应用场景以及落地现状，强推去看一下这个科普课程，特别是开源模型应用场景和落地方案，一定要仔细听！入口我直接给大家找过来了，直接听就可以⬇️
对了，课程里关于「大模型」、「多模态」的实际应用、算法原理、未来趋势等，一定要仔细听，学完你基本上也能清晰了解可落地的AI产品到底用了什么AI技术，也对后续自己的职业发展有启发。
这个就是具体的微调或者灵魂注入[1]的过程，看起来是不是很简单？
只要你有一定的编程基础，不管是程序员还是产品经理，听完公开课都可以很容易的做到这些。

在我的日常工作中，基本上已经离不开AI大模型了，不管是写代码还是写注释，它比我的写得又快又好，特别是现在的工作，但凡能够跟AI大模型沾边的，工资要比普通的高一截，这也是驱使我深入学习的强烈意愿！
当然，如果你不是程序员的话，也可以看看国内现成的AI工具：
文字类
这类型大模型对我来说主要有两个功能。一个是读，一个是写。
读一般要么是帮我读冗长的邮件，或者是读很多篇论文。
这个我推荐两个AI工具：
1 Kimi Chat - 直接读链接，读文章
2 通义千问 - 超长上下文，非常强的检索精度。
Kimi Chat
Kimi Chat可以直接读链接或者是文件，这一点儿尤其好用。
比如说你想要看一篇新闻报道，或者说公众号文章，有些非常难以复制，有些甚至限制读取。
Kimi Chat的好处就是可以拿到链接后可以直接读，并且准确度相当的可以。

还有一个场景就是Arxiv的文章。

很多情况下我只想看看这篇文章有没有价格，快速的浏览一下即可，但是就算是浏览一遍，也得花个几分钟，最主要的是可能还看不完整。
这种情况下就可以直接让Kimi Chat来帮我读。

非常的棒，并且这个逻辑也可以平移到别的内容上，比如你看到微信公众号上有一篇很不错的文章，但是由于篇幅太长，你就可以把链接直接扔给Kimi。

让它总结下这篇文章，非常的快且相对来说很准确。

通义千问
最新版本的通义千问已经发布，引入了其核心升级：“地表最强”的上下文处理能力。
这项进展使得该平台能够轻松处理高达一千万字的中文文本，相当于同时阅读20部《三体》（每本约50万字）和3套《哈利·波特》全集。
此功能对许多用户来说无疑是革命性的，特别是面对那些篇幅极长的文档，如涉及复杂的芯片架构的资料，其篇幅通常超过数千乃至数万页，对个人而言几乎不可能完全阅读，最多只能作为查阅工具。然而，得益于大型模型与强大的记忆能力，处理长篇幅文本不再是难题。
例如，通义千问能够针对特定的关键术语提供全面解释，有效地理解和分析长文。我曾测试了一个超过300页的人工智能报告，若亲自阅读需耗费数日。
例如，我想查询该报告中关于K12教育里，AP计算机科学考试的性别比例，现在能够迅速得到答案。
这是原文中的内容。

这是我让通义千问粉丝和检索到的内容，不知道你注意到没，原文是英文，而我问的是中文，所以它回答的也是中文，并且回答的出来的结果完全正确。

这就是长文上下文的好处，你总是可以非常轻易的获取你想要的内容。
多文件读取并理解
这次我们测试的同时读取很多个文档，按照1000万字的读取能力，理论上一次性读100多个文档是比较轻松的，我们这里就在arxiv按照关键词LLM找了最新的论文。

选择了最新的15篇并下载了下来，就先读取这15篇文章。

可以看到，非常轻松的就把这15篇内容加载到了通义千问上

并且提了一个需求，就是分析这些

还是一样的丝滑，可以非常轻松的将这些文章上传并进行处理。

这个特性有个非常强大的使用场景，就是做文件综述，一般的文件综述需要看很多的论文，几十篇粗读是非常正常的，读个上百篇也不是不可能。
这个方法可以将繁琐的写综述变得十分的轻松，这是一个对于总结某些知识点非常有用的功能。
音频类
通义听悟 - 免费的实时翻译软件

话不多说我就给你看看这个效果有好多，你随便放一个英文视频，可以非常丝滑的给你实时的播报中文字幕。

甚至它可以识别出不同人的声音，这对于多人谈话类的视频非常的有用，你可以非常容易的做摘抄以及记录。
比如下面这个视频，就涉及到多人对话，主持人、马斯克和一个评论家，加起来有三个人。

我们可以把视频下载下来并选择多人对话的参数。

5分钟左右的视频，只需要15秒钟进行翻译。

画画类
奇域AI
中国风AI，出的图的中国风特点非常的鲜明。如果你要做一些具有极其中国元素的作品，比如刺绣、中式美学、皮影等等，就非常推荐用奇域AI。

它的使用也很简单，只需要提示词即可。

如果你自己缺乏创意的话，也可以看看别人的作品，只需要点个赞就能看到其他人的提示词了。

libilibi
这个估计很多AI绘画的人都知道，是一个机遇stable diffusion的平台，里面有很多分享出来的绘画模版和技巧等等。

最主要的是，你只需要登陆就可以免费的在别人的基础上生图，也可以免费的用这个网站提供的免费算力。
当然了，如果你要做进阶版的内容，比如训练Lora那就需要花钱了。

发表于 2025-4-18 14:27:31

基本相当于gpt3.9，不如gpt4，你用用就知道了。
而且openai现在鸡贼之处在于，
你默认用gpt4o算的是gpt4的限额。
你没注意的话，莫名其妙三小时50条就刷完了。
虽然4o对plus无限额，但你深入写点东西还得指望4。

发表于 2025-4-18 14:40:47

算力差不多，4o性价比拉满！
帮我每个月怒省20刀，而且人都免费了还要啥自行车啊～
我先给大家展示一下我刚用GPT-4o做的一个数值模拟GIF动画：

这是一个2D热传导的数值模拟动画。上图中的这个模型是正方形材料，上左下右四条边的温度分别是：50℃、100℃、200℃、300℃。
上图右侧是颜色标尺，白色是温度上边界，黑色是温度下边界。
随着时间的推移，我们可以很清楚的看到这个四边形模型的温度分布变化情况。
而写出来这个小程序，只用了几个Prompt就完成了。
这是第一句：

然后是第二句、第三句和第四句Prompt：

其实中间还有一句是出理程序运行的bug，我就不贴上来了。
GPT-4o给出的最终程序代码我贴出来，如下图：

import numpy as np
import matplotlib.pyplot as plt
from matplotlib.animation import FuncAnimation, PillowWriter
# 定义网格大小和材料参数
nx, ny = 30, 30 # 网格点数
Lx, Ly = 1.0, 1.0 # 物体尺寸
k = 1.0 # 导热系数
rho = 1.0 # 密度
c = 1.0 # 比热容
alpha = k / (rho * c) # 热扩散系数
T_left, T_right, T_top, T_bottom = 100.0, 300.0, 200.0, 50.0 # 边界条件
T_initial = 20.0 # 初始温度
# 时间步长和总时间
dx, dy = Lx / (nx - 1), Ly / (ny - 1)
dt = min(dx, dy)**2 / (4 * alpha) # 根据稳定性条件选择时间步长
total_time = 0.1
time_steps = int(total_time / dt)
# 生成网格
x = np.linspace(0, Lx, nx)
y = np.linspace(0, Ly, ny)
X, Y = np.meshgrid(x, y)
# 初始化温度场
T = np.full((ny, nx), T_initial, dtype=np.float64)
# 设置边界条件
T[:, 0] = T_left
T[:, -1] = T_right
T[0, :] = T_top
T[-1, :] = T_bottom
# 创建图形对象
fig, ax = plt.subplots()
contour = ax.contourf(X, Y, T, 20, cmap=&#39;hot&#39;)
cbar = plt.colorbar(contour)
cbar.set_label(&#39;Temperature (K)&#39;)
ax.set_xlabel(&#39;X (m)&#39;)
ax.set_ylabel(&#39;Y (m)&#39;)
ax.set_title(&#39;2D Heat Conduction Over Time&#39;)
# 更新函数
def update(frame):
global T
T_new = T.copy()
for i in range(1, ny - 1):
for j in range(1, nx - 1):
T_new[i, j] = T[i, j] + alpha * dt * (
(T[i + 1, j] - 2 * T[i, j] + T[i - 1, j]) / dy**2 +
(T[i, j + 1] - 2 * T[i, j] + T[i, j - 1]) / dx**2
)
T = T_new
ax.clear()
contour = ax.contourf(X, Y, T, 20, cmap=&#39;hot&#39;)
ax.set_xlabel(&#39;X (m)&#39;)
ax.set_ylabel(&#39;Y (m)&#39;)
ax.set_title(f&#39;2D Heat Conduction at Time = {frame * dt:.4f} s&#39;)
return contour
# 创建动画
ani = FuncAnimation(fig, update, frames=time_steps, repeat=False)
# 保存动画为GIF
ani.save(&#39;heat_conduction.gif&#39;, writer=PillowWriter(fps=30))
# 显示动画
plt.show()

复制代码

是不是很震惊，我反正是震惊到了。对于数值计算老鸟来说，写这个程序其实不费事，但是对于刚刚上研一的同学来说，GPT-4o可以让你快速上手一个新的领域，并且从一个很小的项目开始，比如上面这个2D传热的有限元仿真小程序。
不管是之前的GPTplus还是现在的4o 在学习、创作、创意、信息收集等许多方面都很能打，可以说是六边形战士了，建议现在免费，自己上手实操体验一下。
如果没有资源、指令、权限，建议看看知乎知学堂的AI公开课，主要讲的就是GPT等主流AI的使用体验、技巧，1节课讲完GPT、MJ、SD、等主流AI的操作技巧。
听完你就知道GPT 4o有多牛了，官方入口指路：

注意：
别忘记领他们整合的AI资源包，包括：
1. 提示工程&指南.pdf,
2. AI提示词设计只指南.pdf
3. 20款AI工具精选.pdf
4. 工作汇报PPT模板-20套
特别是前两个，会教你如何写好Prompt提示词，建议先收藏保存，有时间慢慢啃～

你可能注意到了，我上面的对话截图并不是来自于ChatGPT，其实是来自字节跳动的Coze海外版。
这也是我使用GPT的主要方式，原因很简单，可以自定义GPT，免费，支持GPT-4, GPT-4o, GPT-4 Turbo等，如下图：

甚至可以看到，Coze还支持 Google Gemini 1.5 Flash 和Pro，你在Coze中随便怎么定义GPT，然后救可以选择用上面任何一个api来驱动你的自定义GPTs。
在上面的示例中，我定义了一个GPT，名叫『我的4O老师』。其实，我在Coze中定义了很多专属GPT，每一个都是虚拟助理的对象，比如今天我又打造了一个MBTI心理学分析顾问：

她叫王晓林，背后是GPT-4o在驱动，在我的Coze应用列表中，她是这样的：

其实，在Coze里面打造GPT-4o的虚拟助理，还可以通过各种插件来进行赋能，比如给她配上DALLE-3，就可以证生成图片：

如果你给她配上GPT4V的插件，就可以识别分析图片，并将图片描述成文本：

如果你给她配上Google Search的插件，就可以实时访问Google，为你搜索任何内容：

如果你给她配上Concensus插件，就可以帮你快速查找论文：

Coze中有大量的插件可供选择，帮你赋能你的GPT-4o虚拟助理。此外，更加有意思的是：你可以给自己的GPT-4o虚拟助理配置声音，支持中文普通话，比如我用的比较多的『桃子』，如下图：

你给自己的虚拟助理配置好了语音后，就可以在Coze设置一下Autoplay，这样可以让Coze自动用语音和你交互了，如下图，这个Autoplay在页面的右上角，点击Voice的菜单就会出现：

除此之外，还可以给自己的GPT-4o虚拟助理定义知识库，并进行记忆设置：

知识库就是将你独有的一些数据、文件、表格、图片上传上去，而记忆设置中可以自定义数据库和变量，并且开启长期记忆，让虚拟助理记得你过去的对话内容与情景。
我这里就不过多介绍了，大家自己可以慢慢摸索Coze中的这些功能，也是我现在不续费Plus账号，而全面转向Coze海外版来使用GPT-4o的原因。
可以负责任的说，Coze中的GPT-4o比OpenAI的还好用，你们试试就知道了。

发表于 2025-4-18 14:53:30

作为gpt4的“免费替”，还是很香的。但要是和发布会比，幻灭谈不上，还是多多少少有些落差的，说说实际使用中的感受吧。
图像识别、理解、描述方面还是不错的：

文本生成方面，GPT-4o在生成诗词、描述图片情绪等方面确实很出色。尤其是赏析诗词，非常到位。但在上网查信息、事件评判等需要更多背景知识的任务中,表现就相对一般。
文生图方面，我让它画“月下飞天镜，云生结海楼”的画面。这是gpt4-o的作品，好家伙真给我来镜子升天图，钢铁直AI啊属于是：

但至少，人家是照顾到了这首诗是写长江江面的，意境方面的意思是ok的。gpt4的更要命，直接朝着诡异的方向去了：

数据分析方面，我上传了谷歌的财报，让它帮我把营收数据做成表格。gpt4-o，是分不同的维度做了n个表格，最后给出了分析总结：

而gpt4是生成了一张大而全的表格，然后就没有然后了。这方面gpt4o赢了。
网不太稳的话，还会有各种奇奇怪怪的问题。而且越要紧干活的时候，越高发！

速度方面确实是快一点，但因为当前可以体验的gpt4o依旧是图文版本，不是语音互动，所以速度优势的体感并没有那么明显。
但是它免费啊！！
虽说免费用户每天使用GPT-4o的次数有限(每3小时10次)，超出限制后要么升级为付费用户，要么只能使用GPT-3.5；但其实不敞开了问的话，也够用了！毕竟花钱真的太肉疼了。。。
如果你是懂一点技术的人员，就更不必花这个钱了。完全可以在开源大模型的基础上外挂私有知识库，在本地构建自己的AI助手。有条件的还可以通过简单的微调，做自己的专属模型。又快，又有私有知识库的加持，还可以敞开了用，多香！
详细的原理以及技术路径，建议去听听业内大佬老师主讲的课程，两天的科普公开课，系统化地介绍大模型技术栈的方方面面，以及AI应用落地流程和优秀案例。现在大模型开发和训练框架已经非常丰富了，如果只是应用这一块，甚至可以做到0代码，总之就是个信息差的问题，真的没有那么难。
入口我给大家找来了，趁着现在免费，直接听就可以⬇⬇⬇
我现在基本上就是各种AI工具完全离不开，太提高生产力了！如果你离技术比较远，也完全可以把AI用起来，国内的各种工具已经发展得很好用了。以下基本上是被我淘汰了很多之后，常用的一些AI工具，分享给你：
聚合AI类

ShirtAI

网页版：<a href="http://link.zhihu.com/?target=https%3A//www.myshirtai.com/" class=" external" target="_blank" rel="nofollow noreferrer">https://www.myshirtai.com/
移动版本：https://apps.apple.com/us/app/shirtai/id6474819973
一款集成全球大模型的AI产品，问答、绘画、文档解读、思维导图生成、语音合成等等常用功能基本上都有了，国内就可以正常体验GPT4o。

还拥有300+的指令库，能智能地提供有效的Prompt，特别适合刚接触AI的人员上手。
gpt元宇宙

官网：https://www.mygptmeta.com/
“拼车”gpt，而且还是独享聊天列表的效果，不会有隐私问题以及动不动上不去的问题。开局选个车队，然后就是正常使用了。

页面基本上1:1复刻了官方，熟悉的配方熟悉的味道。
辅助写作类

NotionAI

https://www.notion.so
Notion不多说了吧，大名鼎鼎的笔记工具，做知识管理、工作空间都是非常好用的。因为自由度高，功能设计人性化，风靡全球。
NotionAI是它家工作取里面内嵌的AI，写作方面手拿把掐。在工作区的任何一个地方点斜杠，就可以唤起AI，帮你梳理个目录结构啊，做个续写啊，润色啊，都非常方便。

辅助办公类

chatPPT

人在职场飘，谁也避免不了成为被PPT支配的人。但是有了这个工具，手残党也能做出漂亮的ppt！在下方的对话框中输入你想要做的PPT主题，比如“生成一款智能助手产品AI小蜜的产品介绍”。然后工具会引导你选标题、定目录、选风格，然后就是一气呵成的生成。

有多款原创可商用的PPT动画，数据看板，动态图标、3D词云图，效果是可以做到拉满的。当然内容还是需要微调，可以根据自己的需要下载不同的格式，有 PDF 格式、pptx 格式、长图格式等。因为兼容WPS和office软件，下到本地之后做调整会更方便。
不能说完全解放双手，把做PPT的过程提4倍速是有的。
TreeMind树图

网页入口：https://shutu.cn/
思维导图也是工作和学习离不开的工具。虽然很直观，但制作过程繁琐。现在不一样了，有了工具。可以一句话生成导图，也可以上传文档，让它基于文档进行总结和导图制作。

想像一下，大家都是爱看不爱做，但你能量产。。。。所以必须要偷偷用起来啊！

通义听悟

听悟网页版 - 现已全新升级为通义听悟 (tingwu.cn)
基于通义千问大模型和音视频AI模型的AI助手，主要就是处理声音相关，可以进行实时语音识别，实现对话的实时记录、多语言翻译、发言总结、提取PPT等等。

这个真的很多情况下能帮大忙。比如有时候我们突然和客户开会，聊的内容是完全不熟悉的领域，这个时候它就能实时记录会议内容，而且分角色梳理出大家的发言内容，还能够整理出会议总结和待办。会后，就能一目了然地回顾整个会议内容。

还有比如你需要集中暴利刷课的时候，通义听悟能帮你快速转写音视视频内容，还能生成章节摘要，笔记什么的，这个功能真的是非常感人。
类似还能派上用场的还有培训、直播、看视频、听播客等场景。
音乐生成类

Suno AI

https://suno.com/
大名鼎鼎的Suno AI ，一推出就引发过音乐圈地震。使用方法也是超级简单，可以支持填入特定歌词、生成歌词以及纯演奏音乐。

然后是选音乐风格。

点生成就可以了。对，就是这么简单地实现了编曲自由。做视频自媒体的，尤其对bgm要求并不是特别高的，再不用费劲巴拉的到处搜罗无版权bgm了。
无论是不是技术人员，拥抱AI是王道。先别讲什么替代不替代的，就是在提高工作效率的前提下多摸会鱼，也是香的。

您怎么看GPT 4o？

本周热门