NewBeeNLP公众号-NewBeeNLP最新文章-次幂数据

RAG还是微调?大模型微调技术全面盘点

全面盘点算法工程师需要掌握的大模型技术

05月16日

乘风破浪,川流入海 —— LLM在阿里妈妈智能文案的应用

1.引言在现代广告系统中,文案是不可或缺的一部分,几乎参与了广告素材的各个地方。随着NLP技术的极速发展,广

05月16日

GPT-4o:深夜炸场,她 来了!

无延迟视听语音+情绪感知交互+全球免费

05月14日

DPO作者新作|From r to Q*

Your Language Model is Secretly a Q-Function

05月13日

综述来啦!港大发布SSL4Rec:170篇「自监督学习」推荐算法

综述170篇「自监督学习」推荐算法,港大发布SSL4Rec:代码、资料库全面开源!

05月11日

万字长文总结大模型微调技能图谱

全面盘点算法工程师需要掌握的大模型技术

05月09日

SIGIR2024 | UniSAR: 搜索与推荐统一用户转换行为建模

TLDR: 本文提出了一个统一的搜推间用户转换行为建模框架,有效地对不同类型的细粒度行为转换进行建模,为用户

05月09日

Llama 3技术剖析、微调、部署以及多模态训练

剖析Llama 3的核心技术,讲解如何基于Llama 3进行模型的微调和多模态模型训练和微调。

04月29日

ICLR 2024 || 图学习领域,注意力IS OFTEN NOT ALL YOU NEED!!!

今天给大家介绍一篇论文,这篇论文探讨了图神经网络中自注意力机制与虚拟节点的异同。作者从理论和实验两个角度对比了图Transformer和带虚拟节点的消息传递图神经网络在一致性表达能力上的差异

04月26日

大模型综述出书了

在2023年3月,我们发表了大语言模型综述文章《A Survey of Large Language Mod

04月26日

苹果卷开源大模型,OpenELM亮相

苹果也在行动中。

04月25日

文末送书 | 大模型开发的及时雨!《LangChain实战》全新教程来袭

大语言模型“芝麻开门”的首选框架(之一)怎么学?

04月25日