semanticscholar专题

作者:游鱼思


简介

https://www.semanticscholar.org/

提供了2亿篇论文的智能检索,有摘要和元数据,大部分可以下载全文。

库中最重要的部分:对文档进行分区。 文档分区的目标是读取源文档,将文档拆分为多个部分,对这些部分进行分类, 并提取与这些部分关联的文本。根据文档类型,非结构化使用不同的方法 对文档进行分区。

LlamaIndex集成

https://llamahub.ai/l/semanticscholar

LlamaIndex的 SemanticScholarReader 类,实现逻辑: