T
traeai
登录

模型

GPT-2

别名:gpt2

由 OpenAI 开发的开源语言模型,常用于教学与实验性推理任务。

已跟踪 2 条高相关材料

TraeAI 观察

相关材料

已收录 2 条与 GPT-2 相关的内容,按评分排序。

AI Paper Review: Language Models are Unsupervised Multitask Learners (GPT-2)

AI论文综述:语言模型是无监督多任务学习者(GPT-2)

freeCodeCamp.org3193 字 (约 13 分钟)
92

GPT-2证明仅通过无监督的下一词预测训练,大语言模型可自发涌现出多任务能力,无需任务特定微调即可实现翻译、问答和摘要等功能。

入选理由:GPT-2在800万网页文本上训练,参数量达15亿,首次展示零样本迁移能力。

精选文章#GPT-2#大语言模型#零样本学习#Transformer英文
Serving Multiple Users at Once: How Continuous Batching Keeps LLM Inference Efficient

同时服务多位用户:连续批处理如何保持 LLM 推理高效

Machine Learning Mastery6661 字 (约 27 分钟)
87

连续批处理通过动态调度与 ragged batching 解决静态批处理中因填充导致的 GPU 空闲问题,使 LLM 推理在多用户场景下更高效;实测显示其可将吞吐量提升 2–3 倍,同时减少平均延迟。

入选理由:静态批处理因固定长度填充导致短请求空等,最长请求决定整批完成时间,GPU 利用率常低于 60%

精选文章#LLM#推理#批处理#GPU 优化英文

跨材料问答 · GPT-2

回答基于:GPT-2 相关 2 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容