Skip to main content

NLP云

NLP云是一个人工智能平台,可以让您使用最先进的AI引擎,甚至使用自己的数据训练自己的引擎。

embeddings端点提供了几个模型:

  • paraphrase-multilingual-mpnet-base-v2:Paraphrase Multilingual MPNet Base V2是一个非常快速的模型,基于Sentence Transformers,非常适合在50多种语言中提取嵌入(请参阅完整列表)。

  • gpt-j:GPT-J返回高级嵌入。它可能比基于Sentence Transformers的模型(如上所述)返回更好的结果,但速度也更慢。

  • dolphin:Dolphin返回高级嵌入。它可能比基于Sentence Transformers的模型(如上所述)返回更好的结果,但速度也更慢。它原生支持以下语言:保加利亚语、加泰罗尼亚语、中文、克罗地亚语、捷克语、丹麦语、荷兰语、英语、法语、德语、匈牙利语、意大利语、日语、波兰语、葡萄牙语、罗马尼亚语、俄语、塞尔维亚语、斯洛文尼亚语、西班牙语、瑞典语和乌克兰语。

pip install nlpcloud
from langchain.embeddings import NLPCloudEmbeddings
import os

os.environ["NLPCLOUD_API_KEY"] = "xxx"
nlpcloud_embd = NLPCloudEmbeddings()
text = "这是一个测试文档。"
query_result = nlpcloud_embd.embed_query(text)
doc_result = nlpcloud_embd.embed_documents([text])