深入了解 ChatGPT 的训练之旅：揭秘成本背后的数据和算法 (深入了解成语)

ChatGPT7个月前发布 howgotuijian

346 0 0

ChatGPT

ChatGPT 是近几个月来最受关注的 AI 工具之一。它由 OpenAI 开发，是一个大型语言模型，能够执行各种与语言相关的任务，包括文本生成、翻译和问答。

但是，像 ChatGPT 这样的人工智能模型的训练成本非常高。在文章中，我们将深入探讨 ChatGPT 的训练之旅，揭秘其背后的数据和算法，并估计其训练成本。

数据

训练一个像 ChatGPT 这样的大型语言模型需要大量的数据。 OpenAI 使用了训练数据集，其中包含来自各种来源的大约 1750 亿个单词。这些数据包括：

书籍
文章
网站
对话
代码

OpenAI 还使用了一种名为 “互联网宽文本语料库” (Common Crawl) 的数据集，其中包含从互联网上抓取的超过 4500 亿个单词。这些数据为 ChatGPT 提供了广泛的知识和对语言的理解。

算法

ChatGPT 使用了一种名为「Transformer」的神经网络架构。 Transformer 架构于 2017 年由 Google AI 开发，它特别适合处理顺序数据，如文本。 ChatGPT 使用了一个由 1750 亿个参数组成的 Transformer 模型，使它能够学习语言的复杂模式和关系。

为了训练 ChatGPT，OpenAI 使用了一种名为「无监督学习」的技术。这意味着该模型不需要对输入数据进行明确标记。相反，该模型利用数据中固有的模式来学习语言。该模型经过大量数据的训练，能够识别单词序列之间的关系，生成连贯且类似人类的文本。