打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Py之sentence-transformers:sentence-transformers的简介、安装、使用方法之详细攻略
Py之sentence-transformers:sentence-transformers的简介、安装、使用方法之详细攻略
sentence-transformers的简介
Sentence Transformers,它使用BERT等模型进行多语句、段落和图像嵌入。该框架提供了一种简单的方法来计算句子、段落和图像的稠密向量表示。这些模型基于Transformers网络,如BERT / RoBERTa / XLM-RoBERTa等,在各种任务中取得了最先进的性能。文本在向量空间中嵌入,以便相似的文本靠近,并可以使用余弦相似度有效地找到。
我们提供了越来越多的面向100多种语言的最先进的预训练模型,针对各种用途进行了微调。
此外,该框架允许轻松微调自定义嵌入模型,以在特定任务上实现最佳性能。有关完整的文档,请参阅 www.SBERT.net。
1、一些亮点包括
支持各种Transformers网络,包括BERT、RoBERTa、XLM-R、DistilBERT、Electra、BART等。
多语言和多任务学习
在训练过程中进行评估,以找到最佳模型
10多种损失函数,允许针对语义搜索、释义挖掘、语义相似性比较、聚类、三元组损失、对比损失等特定调整模型。
2、可以使用此框架进行以下用途
计算句子嵌入
语义文本相似性
聚类
释义挖掘
翻译句子挖掘
语义搜索
检索和重新排列
文本摘要
多语言图像搜索、聚类和重复检测
Computing Sentence Embeddings
Semantic Textual Similarity
Clustering
Paraphrase Mining
Translated Sentence Mining
Semantic Search
Retrieve & Re-Rank
Text Summarization
Multilingual Image Search, Clustering & Duplicate Detection
3、支持的预训练模型
我们提供了超过100种语言的大量预训练模型。一些模型是通用模型,而其他模型产生特定用例的嵌入。只需传递模型名称即可加载预训练模型:SentenceTransformer('model_name')。
地址:Pretrained Models — Sentence-Transformers documentation
from sentence_transformers import SentenceTransformermodel = SentenceTransformer('model_name') sentence-transformers的安装
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple sentence-transformers
sentence-transformers的使用方法
1、基础用法
(1)、如何使用已经训练好的Sentence Transformer模型来为另一个任务嵌入句子
# 首先下载一个预训练模型from sentence_transformers import SentenceTransformermodel = SentenceTransformer('all-MiniLM-L6-v2')# 然后提供一些句子给模型sentences = ['This framework generates embeddings for each input sentence', 'Sentences are passed as a list of string.', 'The quick brown fox jumps over the lazy dog.']sentence_embeddings = model.encode(sentences)# 现在有了一个带有嵌入的NumPy数组列表for sentence, embedding in zip(sentences, sentence_embeddings): print("Sentence:", sentence) print("Embedding:", embedding) print("")
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
sentence-transformer库 | 句子语义向量化
进入BERT时代,向量语义检索我们关注什么
HuggingfaceTransformers(1)-HuggingFace官方课程
将句子表示为向量(下):基于监督学习的句子表示学习(sentence embedding)
保姆级教程,用PyTorch和BERT进行文本分类
近期值得读的知识图谱论文,这里帮你总结好了
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服