Arxiv (Arxiv)
arXiv是一个开放获取的存档,包含了200万篇物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程与系统科学以及经济学方面的学术文章。
安装和设置 (Installation and Setup)
首先,您需要安装arxiv
Python包。
pip install arxiv
其次,您需要安装PyMuPDF
Python包,该包将从arxiv.org
网站下载的PDF文件转换为文本格式。
pip install pymupdf
文档加载器 (Document Loader)
请参阅使用示例。
from langchain.document_loaders import ArxivLoader
检索器 (Retriever)
请参阅使用示例。
from langchain.retrievers import ArxivRetriever