先头部队 发表于 6 天前

国内主流AI大模型都是Python 开发的,国外AI大模型是什么语言开发的?为什么要用python?

国内的AI:
百度的文心一言
抖音的豆包
等等等等这些大数据AI模型,都是用python语言开发的。
国外的AI大数据模型是用什么语言开发出来的呢?
为什么要用python不用其他语言呢??

唐小蛇 发表于 6 天前

这个问题问的,让我有个疑惑,题主啥职业。
你知道国内主流ai大模型都是用的 python,却不知道国外用的啥。
如果是业内人士,不可能不知道。如果是外行,怎么知道国内用的 python?
难道,为了引出题目中的两个栗子?

fdsgsg 发表于 6 天前

从最新公布的TIOBE 2月编程语言排行榜可以看出,Python继续遥遥领先。



从长期历史走势来看,Python大概从2018年开始乘风而上,华丽逆袭。这风,必然是人工智能。




人工智能是一个一头连着科研、一头连着工程的领域,而且科研是上游、工程是下游。搞数据和算法的科研工作者,本身不是专业的程序员,他们对于编程工具是没有情怀方面的因素的。他们的需求非常现实,能够抄起来就用,快速验证自己的idea的语言就是雪中送炭的好语言。

而Python的简单易用正中他们下怀。

于是数据科学、算法领域都不约而同选择了用Python,这就积累下来了大量的工具库。后来TensorFlow等框架出现之后,基于Python,人工智能领域逐渐形成了完善的社区和生态。所以再往后的人要想摸着石头过河,必然就一沾沾一手Python,以至于Python几乎成了深度学习入门的第一课。

Python 适用于科学计算、Web 开发、桌面 GUI 开发、网络爬虫开发、自动化运维、自动化测试、自动化运维等领域,广阔的适用特性又让它在工程开发中游刃有余。

所以Python被称为“胶水语言”,不仅体现在可以把不同领域的模块、库和工具连接在一起以及把不同开发语言连接在一起;还体现在可以把科研和工程连接在一起。

Python在统计领域排名第一,在人工智能编程领域排名第一,在脚本编写方面排名第一,在系统测试方面排名第一,不足为奇。



编程语言“名人榜”( 2003-2023)

蓝小枫 发表于 6 天前

回答前几个都是卖课噶韭菜的,实际上python只是最外层的调用接口,真正跑的逻辑都在c++上。但是他们不会告诉你,因为这样就没法噶韭菜了。

asdf 发表于 6 天前

很简单,因为做AI不需要造轮子!
我来举几个耳熟能详的例子,都很适合作为例子学习AI大模型。
第一个是Meta的开源大模型Llama2,这是它的链接。
GitHub - facebookresearch/llama: Inference code for LLaMA models映入眼帘的问卷后缀主要有两类,md-Markdown文件,一般是说明文件;py-Python文件,一般是工程文件。


再点进去具体的工程文件,清一色的py,python文件。


再深入一点儿,打开model.py模型文件,你看这个torch没,它是做深度学习基本上必备的库,它是基于Python写的。


再来一个OpenAI开源的GPT2,也是清一色的python文件。
https://github.com/openai/gpt-2/tree/master/src

不过GPT2是五年前的作品,它的model模型文件里面用的是tensorflow,它也是做深度学习的库。


你可以看这个图,做深度学习,其实主流的AI大模型,靠的就是这些工具,最底层就是C++或者C语言,因为它们的运行速度更快,但是缺点就是学习难度高,曲线长。
想要更加深入的了解大模型,我建议大家从拥有自己的GPT开始,这是最经典也是目前综合性能最强的大模型,如果你还不会大模型部署微调,建议听听知乎知学堂开展的AI大模型公开课,课程会带你学习大模型背后的技术原理,LangChain、Fine-tune技术,从理论实践,到深度讲解,带你全程体验微调过程,定制属于自己的大模型。课上还能直接对话AI技术大佬,现场答疑,干货满满!
课程邀请了2名圈内AI技术大牛讲课,趁着现在还免费,建议IT人都去看看,语言不限,如果了解Python 收获会更大!
因此在C++的基础上开发了更多的框架,用的是高级语言,比如说Python就是其中之一。
像PyTorch(Meta Llama)、TensorFlow(OpenAI GPT2)就是典型的例子,也有一些工作是用的MXNext等。


但是从主流角度来讲,会Pytorch基本上就差不多了。
但如果你要是从学习的角度来看,Pytorch只是专门来做大模型框架的,但是除了模型框架之外,其实还有不少的东西要学,才能覆盖完AI的大多数方向。
主要的库就这么几个,标*的是必学的,其他的可以暂时不学,或者让ChatGPT代劳。

库/模块名称简介*NumPy提供了大量的数学函数以及用于操作大型数据集或数学数组的函数*pandas提供了一种灵活的数据结构,使我们能够在 Python 中处理和分析表格型或异质型数据*Matplotlib一个用于创建静态、动态或交互式可视化图表的库Seaborn提供了一组高级界面,用于绘制吸引人的统计图形*Scikit-Learn提供了一些简单且高效的工具,用于数据挖掘和数据分析TensorFlow一个开源的深度学习框架,由 Google Brain 团队开发Keras一个用于构建和训练深度学习模型的高级接口PyTorch一个开源的深度学习框架,由 Facebook 的人工智能研究团队开发
在掌握Python基础和有了ChatGPT的辅助之后,开始机器学习的实操部分其实变得不那么困难了。
你可以利用机器学习算法的cheatsheet,逐一让ChatGPT帮你生成算法,并详细解释每一步,这个过程不仅比传统的学习方式更快,也更加有趣。
例如,如果你对线性回归(linear regression)感兴趣,你可以这样询问ChatGPT:“请使用Python创建一个线性回归的机器学习模型,并用模拟数据对其进行训练和验证。请一步步指导我如何实现,包括相关的数学公式。”



不懂的地方直接问ChatGPT,比如说你不想问现成的库,想自己做一个加强印象,你可以这么问。



记得,遇到不懂的问题,直接提问即可。
实际操作经验通常是学习中的最佳老师。通过参与小型项目进行实战是极佳的学习方式。Kaggle平台提供了众多数据集,非常适合这种实践。你可以通过以下链接访问这些数据集:
<a href="http://link.zhihu.com/?target=https%3A//www.kaggle.com/datasets%3Fsearch%3Dmachine%2Blearning" class=" external" target="_blank" rel="nofollow noreferrer">https://www.kaggle.com/datasets?search=machine+learning
在Kaggle上,每个数据集都对应一个特定的机器学习任务。选择一个感兴趣的项目开始,先从阅读和学习他人的代码做起。

兰若 发表于 6 天前

你看到的只是上层建模层确实大部分是用python写的
但是底层框架c++、rust实现都有
之所以建模用python 是因为python语言开发便捷性和各种建模生态的健全

webgotoo 发表于 6 天前

国外主流AI大模型的开发语言多样,但以Python为主。选择Python是因为其简单易学、高效实用、拥有大量库支持机器学习、深度学习等任务。例如,TensorFlow和PyTorch等深度学习框架都是用Python开发的,极大简化了AI模型的开发和部署。同时,Python对数据处理和大数据分析的能力强大,特别适合用于大数据AI模型的构建。简而言之,Python在AI领域具有广泛的应用和明显的优势。其他语言也有应用,但Python是目前最主流的选择之一。
页: [1]
查看完整版本: 国内主流AI大模型都是Python 开发的,国外AI大模型是什么语言开发的?为什么要用python?