tkv2373 LV
发表于 2025-4-9 19:07:26
DeepSeek 是一个模型系列,目前个人没办法像投喂数据那样直接去“创造自己模型”使用DeepSeek的架构 。
DeepSeek是由相关团队研发和训练的。训练一个像DeepSeek这样的大规模模型是非常复杂且需要巨大资源的过程:
首先,要有大量的高质量数据 ,比如文本、图像等不同类型数据。这些数据要经过仔细筛选、整理和标注,确保准确可用。
然后,要有强大的计算资源,像大量高性能的GPU集群,用来运行训练算法。
接着,需要专业的算法和训练策略 ,调整模型的参数让它能够从数据中学习到知识和模式。
普通用户如果想要使用DeepSeek模型,可以通过其官方开放的接口或者应用来间接使用它提供的能力,而不是自己去进行“投喂数据创造模型”这种超大型、高难度的操作。 |
|