1. 音频(Audio)
LLM Hub Docs
  • API 参考
    • 获取模型列表
      • OpenAI 格式
      • Gemini 格式
    • 聊天
      • OpenAI 格式(Chat)
        • OpenAI Chat Completions
        • OpenAI Responses
      • Claude Message
      • Gemini Generating Content
    • 文本补全(Completions)
      • 创建文本补全
    • 音频(Audio)
      • OpenAI 格式
        • 文本转语音
        • 音频转录
        • 音频翻译
      • Gemini 格式
        POST
    • 视频(Videos)
      • Sora 格式
        • 创建视频
        • 获取视频任务状态
        • 获取视频内容
        • 视频混剪
      • 可灵格式
        • Kling 文生视频
        • 获取 Kling 文生视频任务状态
        • Kling 图生视频
        • 获取 Kling 图生视频任务状态
      • 即梦格式
        • 即梦视频生成
      • 创建视频生成任务
      • 获取视频生成任务状态
    • 图片(Images)
      • OpenAI 格式
        • 生成图像
        • 编辑图像
      • Qwen 格式
        • 生成图像
        • 编辑图像
      • Gemini 格式
    • Realtime
      • 实时 WebSocket 连接
    • 嵌入(Embeddings)
      • OpenAI 格式
      • Gemini 格式
    • 审查(Moderations)
      • 内容审核
    • 重排序(Rerank)
      • 文档重排序
    • 未实现
      • Fine-tunes
        • 列出微调任务 (未实现)
        • 创建微调任务 (未实现)
        • 获取微调任务详情 (未实现)
        • 取消微调任务 (未实现)
        • 获取微调任务事件 (未实现)
      • Files
        • 列出文件 (未实现)
        • 上传文件 (未实现)
        • 获取文件信息 (未实现)
        • 删除文件 (未实现)
        • 获取文件内容 (未实现)
    • Gemini格式
      • Gemini 流式聊天 (streamGenerateContent)
    • Midjourney
      • Midjourney 生成图片
      • Midjourney 变换操作
      • Midjourney 图片描述
      • Midjourney 图片融合
      • 获取 Midjourney 任务状态
      • 按条件查询 Midjourney 任务
      • 获取 Midjourney 图片
    • Playground
      • Playground 聊天
    • Suno
      • Suno 提交任务
      • 获取 Suno 任务状态
      • 批量获取 Suno 任务
    • 创建编辑
      POST
  • 数据模型
    • ErrorResponse
    • Usage
    • Model
    • ModelsResponse
    • GeminiModelsResponse
    • Message
    • MessageContent
    • ToolCall
    • Tool
    • ResponseFormat
    • ChatCompletionRequest
    • ChatCompletionResponse
    • ChatCompletionStreamResponse
    • CompletionRequest
    • CompletionResponse
    • ResponsesRequest
    • ResponsesResponse
    • ResponsesStreamResponse
    • ClaudeRequest
    • ClaudeMessage
    • ClaudeResponse
    • EmbeddingRequest
    • EmbeddingResponse
    • ImageGenerationRequest
    • ImageEditRequest
    • ImageResponse
    • ImageGenerationResponse
    • AudioTranscriptionRequest
    • AudioTranslationRequest
    • AudioTranscriptionResponse
    • SpeechRequest
    • RerankRequest
    • RerankResponse
    • ModerationRequest
    • ModerationResponse
    • GeminiRequest
    • GeminiResponse
    • GeminiAudioResponse
    • VideoRequest
    • VideoResponse
    • VideoTaskResponse
    • VideoTaskMetadata
    • VideoTaskError
    • OpenAIVideo
    • OpenAIVideoError
    • MjTaskResponse
    • MjTaskResult
    • SunoTaskResponse
    • SunoTaskResult
    • ApiResponse
    • PageInfo
    • User
    • Channel
    • Token
    • Redemption
    • Log
  1. 音频(Audio)

Gemini 格式

POST
/v1beta/models/{model}:generateContent
使用 Gemini 模型生成音频/语音。
通过 generationConfig.responseModalities 设置为 ["AUDIO"] 并配置 speechConfig 来生成语音输出。
支持的模型:
gemini-2.5-flash-preview-tts
gemini-2.0-flash-live-001

请求参数

Authorization
Bearer Token
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token
示例:
Authorization: Bearer ********************
or
Path 参数

Body 参数application/json

示例
{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "Say cheerfully: Have a wonderful day!"
                }
            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "AUDIO"
        ],
        "speechConfig": {
            "voiceConfig": {
                "prebuiltVoiceConfig": {
                    "voiceName": "Kore"
                }
            }
        }
    }
}

请求示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api.llmhub.com.cn/v1beta/models/gemini-2.5-flash-preview-tts:generateContent' \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data-raw '{
    "contents": [
        {
            "role": "user",
            "parts": [
                {
                    "text": "Say cheerfully: Have a wonderful day!"
                }
            ]
        }
    ],
    "generationConfig": {
        "responseModalities": [
            "AUDIO"
        ],
        "speechConfig": {
            "voiceConfig": {
                "prebuiltVoiceConfig": {
                    "voiceName": "Kore"
                }
            }
        }
    }
}'

返回响应

🟢200
application/json
成功生成音频
Body

示例
{
    "candidates": [
        {
            "content": {
                "role": "model",
                "parts": [
                    {
                        "inlineData": {
                            "mimeType": "audio/wav",
                            "data": "UklGRiQAAABXQVZFZm10IBAAAAABAAEARKwAAIhYAQACABAAZGF0YQAAAAA="
                        }
                    }
                ]
            },
            "finishReason": "STOP"
        }
    ],
    "usageMetadata": {
        "promptTokenCount": 10,
        "candidatesTokenCount": 100,
        "totalTokenCount": 110
    }
}
修改于 2025-12-22 14:12:38
上一页
音频翻译
下一页
创建视频
Built with