Embeddings API
将文本转换为向量表示,用于检索、分类、聚类等场景
POST/v1/embeddings
嵌入 API 将文本转换为数值向量,使计算机能够理解文本之间的语义关系。 广泛应用于语义搜索、推荐系统、文本分类、聚类分析等场景。
请求参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| model | string | 是 | 要使用的嵌入模型可选值: text-embedding-3-small, text-embedding-3-large, text-embedding-ada-002 |
| input | string | string[] | 是 | 要向量化的文本,可以是单个字符串或字符串数组 |
| encoding_format | string | 否 | 返回的嵌入向量格式可选值: float, base64默认: float |
| dimensions | number | 否 | 输出向量的维度(仅 text-embedding-3-large 支持) |
请求示例
以下示例展示如何使用不同编程语言调用 Embeddings API:
curl https://api.mintcloud.ai/v1/embeddings \
-H "Authorization: Bearer $MINT_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "text-embedding-3-small",
"input": "The food was delicious and the service was great."
}'响应格式
字段说明
object总是返回 "list"
data嵌入向量数组,每个元素包含 embedding、index 和 object 字段
model使用的模型名称
usage使用的 token 数量统计
响应示例
{
"object": "list",
"data": [
{
"object": "embedding",
"embedding": [
0.0023064255,
-0.009327292,
// ... 1536 dimensions for text-embedding-3-small
],
"index": 0
}
],
"model": "text-embedding-3-small",
"usage": {
"prompt_tokens": 8,
"total_tokens": 8
}
}向量维度
text-embedding-3-small
1536 维度
text-embedding-3-large
3072 维度(可自定义)
text-embedding-ada-002
1536 维度
使用场景
语义搜索
将文档和查询语句向量化,通过余弦相似度计算找到最相关的内容
文本分类
使用嵌入向量作为特征,结合分类器实现文本分类任务
聚类分析
将文本转换为向量后,使用 K-Means 等算法进行聚类分析
推荐系统
基于用户和物品的向量表示,计算相似度进行个性化推荐