AINLP公众号-AINLP最新文章-次幂数据

yyds! AAAI 2024等顶会论文合集出炉

众所周知,论文是人工智能学习的基石,因为论文展示了不同方向最新的研究成果,了解并且掌握这些学习成果,会对自己写

05月07日

Unsloth微调Llama3-8B,提速44.35%,节省42.58%显存,最少仅需7.75GB显

01前言本文主要介绍Unsloth,它可以显著提升大模型的训练速度,减少显存占用,我们将其整合到Firefl

05月07日

SIGIR 2024 | 共现关系还是细粒度偏好?ID和模态信息解耦的会话推荐

作者 | 张晓堃单位 | 大连理工大学·信息检索研究室研究方向 | 推荐系统论文题目:Disentangli

05月07日

幻方发布全球最强MOE大模型! DeepSeek-V2

仓库和技术报告地址:https://github.com/deepseek-ai/DeepSeek-V21.

05月07日

大语言模型与推荐系统:SIGIR 2024 相关论文导览

© 作者|李炳黔机构|中国人民大学研究方向|大语言模型、推荐系统本文聚焦 SIGIR 2024 大语言模型结

05月07日

大模型中文微调最佳神器!"弱智吧"is all you need

大型语言模型(LLM)在近些年取得了重大进展,特别是在英语方面,然而,LLM 在中文指令调优方面仍然存在明显差

05月06日

我看阿里的年终奖总算发了!

到4月底了,这两天看朋友圈,发现阿里的年终奖终于发了,问了问老同学,也从网上检索了不少信息,基本搞清楚了阿里

05月06日

大模型算法题(5)

本系列将持续整理一些LLM中关键的、细节的、值得关注的内容,持续更新~如有错漏,欢迎指正~1.使用半精度训练

05月06日

值得一看的大模型+生成式图分析若干任务及提示总结:兼看大模型用于文本分类体系挖掘

我们来继续看看两个问题,一个是关于大模型与图分析结合有哪些任务,对应方案有哪些?另一个是如何使用大模型做文本

05月06日

RAG已死? RAG vs Long-Context LLM

作者:lucas大叔文章链接:https://zhuanlan.zhihu.com/p/693574568导

05月06日

大模型时代的核心推荐技术,这本书全讲到了!文末赠书

达观数据真实行业案例,呈现B端高频规则和策略

05月05日

生存还是毁灭?大模型时代的传统对话机器人将何去何从

“ 在ChatGPT大火之前,对话机器人(ChatBot)是为数不多的能够为NLP领域提供商业化的产品之一

05月05日

梳理RWKV 4,5(Eagle),6(Finch)架构的区别以及个人理解和建议

0x0. 前言RWKV系列模型的迭代速度比较快,主要是下面两篇paper:RWKV: Reinventing

05月05日

RAG开源项目Qanything源码阅读1-概述+服务

最近是想找一个开源的RAG项目进行进一步学习,选了这个项目:https://github.com/netea

05月05日

70后新晋中国科学院院士,任985校长!

最年轻的副部长级大学校长

05月02日

如何在本地部署运行Llama3

Llama3 目前发布了8B和70B两种尺寸huggingface Llama3模型主页:https://h

05月02日

从第一性原理看大模型Agent技术

作者:凡心原文地址:https://zhuanlan.zhihu.com/p/662538702在大模型技术

05月02日

Lite-LLM4Rec:大幅降低用LLM做推荐任务的耗时

论文名称: Rethinking Large Language Model Architectures fo

05月02日

LLM4CS:一种利用LLM提升多轮会话检索的效果的方案

今天分享一篇人大的文章,大型语言模型知道您的会话上下文搜索意图(Large Language Models

05月02日