中华网 china.com

娱乐
当前位置:娱乐 > 影视长廊 > 正文

chatgpt是啥很强吗谁研发的 ChatGPT会抢谁的饭碗?(2)

chatgpt是啥很强吗谁研发的 ChatGPT会抢谁的饭碗?(2)
2023-02-08 09:57:02
《家有儿女》“夏东海”扮演者高亚麟被曝出轨家暴14:05

这次RLHF的方法得以在ChatGPT上应用,并取得了很好的效果。但RLHF实际上并不容易训练,强化学习很容易遇到模式坍塌,反馈过于稀疏这类问题,训练起来很困难。这可能也是为什么论文在3月发表,ChatGPT在12月才上线,中间需要大量的时间来调优。

此外,指令调整(instruction tuning)的贡献也很大。InstructGPT虽然在参数上比GPT-3少了100倍(13亿 vs 1750亿),它的输出效果比GPT-3以及用监督学习进行微调的模型都要好得多。

根据知乎用户“避暑山庄梁朝伟”的观点:“Instruction Tuning和Prompt方法的核心一样,就是去发掘语言模型本身具备的知识。而他们的不同点就在于,Prompt是去激发语言模型的补全能力,比如给出上半句生成下半句、或者做完形填空,都还是像在做language model任务,而Instruction Tuning则是激发语言模型的理解能力,通过给出更明显的指令,让模型去理解并做出正确的反馈。”

以上内容仅中华网独家使用,未经本网授权,不得转载、摘编或以其他方式使用。
(责任编辑:于浩淙 Hzx0176)
关键词:

相关报道:

    关闭