Skip to content

AI大模型领域的推荐阅读清单

本文用于收集整理我感兴趣的AI大模型领域的推荐阅读清单,主要包括综述论文、经典论文和前沿论文。即使已经聚焦到大模型领域,它仍然是个很大的范畴;而从实用性的角度出发,我将收敛到围绕RAG技术和拓展应用的材料。

01. 网络材料

本文聚焦检索增强生成(RAG)技术。RAG 结合信息检索与大模型,缓解 “幻觉” 问题,核心链路含索引、检索和生成。传统 RAG 存在的问题,可由Graph RAG 引入知识图谱改进。基于二者相似性设计通用 RAG 架构,抽象 IndexStore 统一存储,集成蚂蚁开源框架 DB-GPT 等。Graph RAG 可从内容索引、检索生成优化,未来 RAG 有望向智能体架构演进。

文章聚焦GraphRAG技术。它相比传统RAG,引入知识图谱,能理解实体关系,在复杂查询场景表现更优,适用于实体关联复杂、语义推理需求高的场景,如智能客服、医疗问诊等。其将非结构化数据转知识图谱存储,检索时提取实体,增强LLM生成。GraphRAG分索引和查询阶段,有本地和全局搜索方法。不过,该技术还不成熟,面临建模、图谱规模、建图可控性等挑战,数据到知识过程也存在问题。

此页面是Neo4j官方文档关于RAG标签的聚合。Neo4j是目前主流商业应用的图数据库,提供了强大的数据分析能力。LangChain与Neo4j有深度的技术合作,并在Microsoft中有生产型项目的应用。因此,中小型Graph RAG项目的起手式可以从Neo4j图数据库开始。

02. 专著图书

03. 论文清单

3.1 综述论文

社区检测是网络分析的基础任务,通过将网络划分成多个子结构来揭示其潜在功能,在众多现实网络问题中应用广泛。传统的社区检测方法多基于概率图模型,借助先验知识推断社区结构。随着网络问题和数据愈发复杂,深度学习等新方法不断涌现,这类方法能将网络数据转化为低维表示。 然而,目前人们对社区检测的理论和方法基础理解不足,这对网络分析领域的未来发展极为关键。

在本文中,作者构建了一个统一的网络社区发现方法架构,展现了社区检测领域的前沿水平。通过全面回顾现有方法,提出新分类法,将其分为概率图模型和深度学习两类,并详细探讨了每类方法的核心思想。 为推动社区检测发展,作者发布了多领域基准数据集,强调其在网络分析任务中的应用。最后,讨论了该领域面临的挑战,并对未来研究方向提出建议,为后续研究提供了重要参考。

科普阅读:

3.2 经典论文

3.3 前沿论文

04. 我的评述