yyds! AAAI 2024等顶会论文合集出炉

众所周知，论文是人工智能学习的基石，因为论文展示了不同方向最新的研究成果，了解并且掌握这些学习成果，会对自己写

05月07日

Unsloth微调Llama3-8B，提速44.35%，节省42.58%显存，最少仅需7.75GB显

01前言本文主要介绍Unsloth，它可以显著提升大模型的训练速度，减少显存占用，我们将其整合到Firefl

05月07日

SIGIR 2024 | 共现关系还是细粒度偏好？ID和模态信息解耦的会话推荐

作者 | 张晓堃单位 | 大连理工大学·信息检索研究室研究方向 | 推荐系统论文题目：Disentangli

05月07日

幻方发布全球最强MOE大模型！ DeepSeek-V2

仓库和技术报告地址：https://github.com/deepseek-ai/DeepSeek-V21.

05月07日

大语言模型与推荐系统：SIGIR 2024 相关论文导览

05月07日

大模型中文微调最佳神器！"弱智吧"is all you need

大型语言模型（LLM）在近些年取得了重大进展，特别是在英语方面，然而，LLM 在中文指令调优方面仍然存在明显差

05月06日

我看阿里的年终奖总算发了！

到4月底了，这两天看朋友圈，发现阿里的年终奖终于发了，问了问老同学，也从网上检索了不少信息，基本搞清楚了阿里

05月06日

大模型算法题(5)

本系列将持续整理一些LLM中关键的、细节的、值得关注的内容，持续更新~如有错漏，欢迎指正~1.使用半精度训练

05月06日

值得一看的大模型+生成式图分析若干任务及提示总结：兼看大模型用于文本分类体系挖掘

我们来继续看看两个问题，一个是关于大模型与图分析结合有哪些任务，对应方案有哪些？另一个是如何使用大模型做文本

05月06日

RAG已死? RAG vs Long-Context LLM

作者：lucas大叔文章链接：https://zhuanlan.zhihu.com/p/693574568导

05月06日

大模型人才今年的薪资。。。

爆满！

05月05日

大模型时代的核心推荐技术，这本书全讲到了！文末赠书

达观数据真实行业案例，呈现B端高频规则和策略

05月05日

生存还是毁灭？大模型时代的传统对话机器人将何去何从

“ 在ChatGPT大火之前，对话机器人（ChatBot）是为数不多的能够为NLP领域提供商业化的产品之一

05月05日

梳理RWKV 4，5(Eagle)，6(Finch)架构的区别以及个人理解和建议

0x0. 前言RWKV系列模型的迭代速度比较快，主要是下面两篇paper：RWKV: Reinventing

05月05日

RAG开源项目Qanything源码阅读1-概述+服务

最近是想找一个开源的RAG项目进行进一步学习，选了这个项目：https://github.com/netea

05月05日

70后新晋中国科学院院士，任985校长！

最年轻的副部长级大学校长

05月02日

如何在本地部署运行Llama3

Llama3 目前发布了8B和70B两种尺寸huggingface Llama3模型主页：https://h

05月02日

从第一性原理看大模型Agent技术

作者：凡心原文地址：https://zhuanlan.zhihu.com/p/662538702在大模型技术

05月02日

Lite-LLM4Rec:大幅降低用LLM做推荐任务的耗时

论文名称: Rethinking Large Language Model Architectures fo

05月02日

LLM4CS：一种利用LLM提升多轮会话检索的效果的方案

今天分享一篇人大的文章，大型语言模型知道您的会话上下文搜索意图（Large Language Models

05月02日