模型

GPT-2

traeai 已收录 2 篇与 GPT-2 相关的内容。最新一篇是「AI Paper Review: Language Models are Unsupervised Multitask Learners (GPT-2)」，由 freeCodeCamp.org 发布。

别名：gpt2

由 OpenAI 开发的开源语言模型，常用于教学与实验性推理任务。

已跟踪 2 条高相关材料

TraeAI 观察

AI Paper Review: Language Models are Unsupervised Multitask Learners (GPT-2)

freeCodeCamp.org · 9.2 分

GPT-2证明了仅通过无监督的下一词预测训练，大语言模型可自发涌现出多任务能力，无需任务特定微调即可实现翻译、问答和摘要等功能。

Serving Multiple Users at Once: How Continuous Batching Keeps LLM Inference Efficient

Machine Learning Mastery · 8.7 分

连续批处理（Continuous Batching）通过动态调度和 ragged batching 解决静态批处理中因填充导致的 GPU 空闲问题，使 LLM 推理在多用户场景下更高效；实测显示其可将吞吐量提升 2–3 倍，同时减少平均延迟。

freeCodeCamp.org5月11日3193 字 (约 13 分钟)

GPT-2证明仅通过无监督的下一词预测训练，大语言模型可自发涌现出多任务能力，无需任务特定微调即可实现翻译、问答和摘要等功能。

入选理由：GPT-2在800万网页文本上训练，参数量达15亿，首次展示零样本迁移能力。

精选文章#GPT-2#大语言模型#零样本学习#Transformer英文

Machine Learning Mastery6月1日6661 字 (约 27 分钟)

连续批处理通过动态调度与 ragged batching 解决静态批处理中因填充导致的 GPU 空闲问题，使 LLM 推理在多用户场景下更高效；实测显示其可将吞吐量提升 2–3 倍，同时减少平均延迟。

入选理由：静态批处理因固定长度填充导致短请求空等，最长请求决定整批完成时间，GPU 利用率常低于 60%

精选文章#LLM#推理#批处理#GPU 优化英文

回答基于：GPT-2 相关 2 条材料