支持向量机 (SVM)
支持向量机 (SVM) 是一组用于分类、回归和异常值检测的监督学习方法。
本笔记本介绍了如何使用一个底层使用 scikit-learn
包的 SVM
的检索器。
主要基于 https://github.com/karpathy/randomfun/blob/master/knn_vs_svm.html
#!pip install scikit-learn
#!pip install lark
我们想要使用 OpenAIEmbeddings
,所以我们需要获取 OpenAI API 密钥。
import os
import getpass
os.environ["OPENAI_API_KEY"] = getpass.getpass("OpenAI API 密钥:")
OpenAI API 密钥: ········
from langchain.retrievers import SVMRetriever
from langchain.embeddings import OpenAIEmbeddings
使用文本创建新的检索器
retriever = SVMRetriever.from_texts(
["foo", "bar", "world", "hello", "foo bar"], OpenAIEmbeddings()
)
使用检索器
现在我们可以使用检索器了!
result = retriever.get_relevant_documents("foo")
result
[Document(page_content='foo', metadata={}),
Document(page_content='foo bar', metadata={}),
Document(page_content='hello', metadata={}),
Document(page_content='world', metadata={})]