nex/scripts/detect_openai.py

#!/usr/bin/env python3
"""OpenAI 兼容性接口测试脚本

用法:
    python3 scripts/openai_compat_test.py --base_url <url> [options]

示例:
    python3 scripts/openai_compat_test.py --base_url https://api.example.com/v1
    python3 scripts/openai_compat_test.py --base_url https://api.example.com/v1 --api_key sk-xxx --model gpt-4o
    python3 scripts/openai_compat_test.py --base_url https://api.example.com/v1 --stream --tools
"""

import json
import argparse
from typing import Dict, List, Tuple, Any
from core import (
    create_ssl_context,
    TestCase,
    run_test_suite,
    validate_response_structure,
)


def build_headers(api_key: str) -> Dict[str, str]:
    """构建 OpenAI API 请求头"""
    h = {"Content-Type": "application/json"}
    if api_key:
        h["Authorization"] = f"Bearer {api_key}"
    return h


# ==================== OpenAI 响应验证函数 ====================

def validate_openai_models_list_response(response_text: str) -> Tuple[bool, List[str]]:
    """验证 OpenAI Models List 响应

    根据API文档，响应应包含：
    - object: "list"
    - data: array of Model objects
    """
    errors = []

    try:
        data = json.loads(response_text)
    except json.JSONDecodeError as e:
        return False, [f"响应不是有效的JSON: {e}"]

    # 检查必需字段
    if "object" not in data:
        errors.append("缺少必需字段: object")
    elif data["object"] != "list":
        errors.append(f"字段 'object' 值错误: 期望 'list', 实际 '{data['object']}'")

    if "data" not in data:
        errors.append("缺少必需字段: data")
    elif not isinstance(data["data"], list):
        errors.append(f"字段 'data' 类型错误: 期望 list, 实际 {type(data['data']).__name__}")
    else:
        # 验证每个 model 对象
        for i, model in enumerate(data["data"]):
            if not isinstance(model, dict):
                errors.append(f"data[{i}] 不是对象")
                continue

            # 检查 model 对象的必需字段
            model_required = ["id", "object", "created", "owned_by"]
            for field in model_required:
                if field not in model:
                    errors.append(f"data[{i}] 缺少必需字段: {field}")

            # 检查 object 字段值
            if "object" in model and model["object"] != "model":
                errors.append(f"data[{i}].object 值错误: 期望 'model', 实际 '{model['object']}'")

    return len(errors) == 0, errors


def validate_openai_model_retrieve_response(response_text: str) -> Tuple[bool, List[str]]:
    """验证 OpenAI Model Retrieve 响应

    根据API文档，响应应包含：
    - id: string
    - object: "model"
    - created: number
    - owned_by: string
    """
    required_fields = ["id", "object", "created", "owned_by"]
    field_types = {
        "id": str,
        "object": str,
        "created": (int, float),
        "owned_by": str
    }
    enum_values = {
        "object": ["model"]
    }

    return validate_response_structure(response_text, required_fields, field_types, enum_values)


def validate_openai_chat_completion_response(response_text: str) -> Tuple[bool, List[str]]:
    """验证 OpenAI Chat Completion 响应

    根据API文档，响应应包含：
    - id: string
    - object: "chat.completion"
    - created: number
    - model: string
    - choices: array
    - usage: object (可选)
    """
    errors = []

    try:
        data = json.loads(response_text)
    except json.JSONDecodeError as e:
        return False, [f"响应不是有效的JSON: {e}"]

    # 检查必需字段
    required_fields = ["id", "object", "created", "model", "choices"]
    for field in required_fields:
        if field not in data:
            errors.append(f"缺少必需字段: {field}")

    # 检查 object 字段值
    if "object" in data and data["object"] != "chat.completion":
        errors.append(f"字段 'object' 值错误: 期望 'chat.completion', 实际 '{data['object']}'")

    # 检查 choices 数组
    if "choices" in data:
        if not isinstance(data["choices"], list):
            errors.append(f"字段 'choices' 类型错误: 期望 list, 实际 {type(data['choices']).__name__}")
        else:
            for i, choice in enumerate(data["choices"]):
                if not isinstance(choice, dict):
                    errors.append(f"choices[{i}] 不是对象")
                    continue

                # 检查 choice 对象的必需字段
                choice_required = ["index", "message", "finish_reason"]
                for field in choice_required:
                    if field not in choice:
                        errors.append(f"choices[{i}] 缺少必需字段: {field}")

                # 检查 message 对象
                if "message" in choice and isinstance(choice["message"], dict):
                    msg = choice["message"]
                    if "role" not in msg:
                        errors.append(f"choices[{i}].message 缺少必需字段: role")
                    elif msg["role"] != "assistant":
                        errors.append(f"choices[{i}].message.role 值错误: 期望 'assistant', 实际 '{msg['role']}'")

    # 检查 usage 对象（可选）
    if "usage" in data and data["usage"] is not None:
        if not isinstance(data["usage"], dict):
            errors.append(f"字段 'usage' 类型错误: 期望 object, 实际 {type(data['usage']).__name__}")
        else:
            usage_required = ["prompt_tokens", "completion_tokens", "total_tokens"]
            for field in usage_required:
                if field not in data["usage"]:
                    errors.append(f"usage 缺少必需字段: {field}")

    return len(errors) == 0, errors


def main():
    parser = argparse.ArgumentParser(
        description="OpenAI 兼容性接口测试",
        formatter_class=argparse.RawDescriptionHelpFormatter,
    )
    parser.add_argument("--base_url", required=True, help="API 基础地址 (如 https://api.example.com/v1)")
    parser.add_argument("--api_key", default="", help="API 密钥 (默认空)")
    parser.add_argument("--model", default="gpt-4o", help="模型名称 (默认 gpt-4o)")
    parser.add_argument("--vision", action="store_true", help="执行视觉相关测试")
    parser.add_argument("--stream", action="store_true", help="执行流式响应测试")
    parser.add_argument("--tools", action="store_true", help="执行工具调用测试")
    parser.add_argument("--logprobs", action="store_true", help="执行 logprobs 测试")
    parser.add_argument("--json_schema", action="store_true", help="执行 Structured Output 测试")
    parser.add_argument("--all", action="store_true", help="开启所有扩展测试")
    args = parser.parse_args()

    if args.all:
        args.vision = True
        args.stream = True
        args.tools = True
        args.logprobs = True
        args.json_schema = True

    base_url = args.base_url.rstrip("/")
    api_key = args.api_key
    model = args.model
    ssl_ctx = create_ssl_context()
    headers = build_headers(api_key)
    headers_bad_auth = build_headers("invalid-key-xxx")

    chat_url = f"{base_url}/chat/completions"

    # --- 收集测试用例 ---
    cases: List[TestCase] = []

    # ---- Models API ----
    cases.append(TestCase(
        desc="获取模型列表 (GET /models)",
        method="GET",
        url=f"{base_url}/models",
        headers=headers,
        validator=validate_openai_models_list_response
    ))
    cases.append(TestCase(
        desc="获取指定模型详情 (GET /models/{model})",
        method="GET",
        url=f"{base_url}/models/{model}",
        headers=headers,
        validator=validate_openai_model_retrieve_response
    ))
    cases.append(TestCase(
        desc="获取不存在的模型 (GET /models/nonexistent-model-xxx)",
        method="GET",
        url=f"{base_url}/models/nonexistent-model-xxx",
        headers=headers
    ))

    # ---- Chat Completions: 正面用例 ----
    cases.append(TestCase(
        desc="基本对话（仅 user）",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [{"role": "user", "content": "Hi"}],
            "max_tokens": 5
        },
        validator=validate_openai_chat_completion_response
    ))
    cases.append(TestCase(
        desc="system + user 对话",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [
                {"role": "system", "content": "You are a helpful assistant."},
                {"role": "user", "content": "1+1="}
            ],
            "max_tokens": 5
        },
        validator=validate_openai_chat_completion_response
    ))
    cases.append(TestCase(
        desc="developer + user 对话",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [
                {"role": "developer", "content": "You are a helpful assistant."},
                {"role": "user", "content": "1+1="}
            ],
            "max_tokens": 5
        },
        validator=validate_openai_chat_completion_response
    ))
    cases.append(TestCase(
        desc="多轮对话（含 assistant 历史）",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [
                {"role": "user", "content": "Hi"},
                {"role": "assistant", "content": "Hello!"},
                {"role": "user", "content": "1+1="}
            ],
            "max_tokens": 5
        },
        validator=validate_openai_chat_completion_response
    ))
    cases.append(TestCase(
        desc="temperature + top_p",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [{"role": "user", "content": "Hi"}],
            "max_tokens": 5,
            "temperature": 0.5,
            "top_p": 0.9
        },
        validator=validate_openai_chat_completion_response
    ))
    cases.append(TestCase(
        desc="max_tokens 限制",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [{"role": "user", "content": "讲一个故事"}],
            "max_tokens": 10
        },
        validator=validate_openai_chat_completion_response
    ))
    cases.append(TestCase(
        desc="stop sequences",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [{"role": "user", "content": "数数: 1,2,3,"}],
            "max_tokens": 20,
            "stop": ["5"]
        },
        validator=validate_openai_chat_completion_response
    ))
    cases.append(TestCase(
        desc="n=2 多候选",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [{"role": "user", "content": "Hi"}],
            "max_tokens": 5,
            "n": 2
        },
        validator=validate_openai_chat_completion_response
    ))
    cases.append(TestCase(
        desc="seed 参数",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [{"role": "user", "content": "Hi"}],
            "max_tokens": 5,
            "seed": 42
        },
        validator=validate_openai_chat_completion_response
    ))
    cases.append(TestCase(
        desc="frequency_penalty + presence_penalty",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [{"role": "user", "content": "Hi"}],
            "max_tokens": 5,
            "frequency_penalty": 0.5,
            "presence_penalty": 0.5
        },
        validator=validate_openai_chat_completion_response
    ))
    cases.append(TestCase(
        desc="max_completion_tokens 参数",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [{"role": "user", "content": "讲一个故事"}],
            "max_completion_tokens": 10
        },
        validator=validate_openai_chat_completion_response
    ))
    cases.append(TestCase(
        desc="JSON mode (response_format: json_object)",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [
                {"role": "system", "content": "以 JSON 格式回复: {\"answer\": \"ok\"}"},
                {"role": "user", "content": "test"}
            ],
            "max_tokens": 10,
            "response_format": {"type": "json_object"}
        },
        validator=validate_openai_chat_completion_response
    ))

    # ---- Chat Completions: 负面用例 ----
    cases.append(TestCase(
        desc="缺少 model 参数",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "messages": [{"role": "user", "content": "Hi"}],
            "max_tokens": 5
        }
    ))
    cases.append(TestCase(
        desc="缺少 messages 参数",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "max_tokens": 5
        }
    ))
    cases.append(TestCase(
        desc="messages 为空数组",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [],
            "max_tokens": 5
        }
    ))
    cases.append(TestCase(
        desc="无效 API key",
        method="POST",
        url=chat_url,
        headers=headers_bad_auth,
        body={
            "model": model,
            "messages": [{"role": "user", "content": "Hi"}],
            "max_tokens": 5
        }
    ))
    cases.append(TestCase(
        desc="不存在的模型 (chat)",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": "nonexistent-model-xxx",
            "messages": [{"role": "user", "content": "Hi"}],
            "max_tokens": 5
        }
    ))
    cases.append(TestCase(
        desc="畸形 JSON body",
        method="POST",
        url=chat_url,
        headers=headers,
        body="invalid json{"
    ))

    cases.append(TestCase(
        desc="max_tokens 为负数",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [{"role": "user", "content": "Hi"}],
            "max_tokens": -1
        }
    ))
    cases.append(TestCase(
        desc="max_tokens = 0",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [{"role": "user", "content": "Hi"}],
            "max_tokens": 0
        }
    ))
    cases.append(TestCase(
        desc="temperature 超出范围 (2.5)",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [{"role": "user", "content": "Hi"}],
            "max_tokens": 5,
            "temperature": 2.5
        }
    ))

    # ---- --vision ----
    if args.vision:
        image_url = (
            "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/"
            "Gfp-wisconsin-madison-the-nature-boardwalk.jpg/"
            "2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg"
        )
        cases.append(TestCase(
            desc="图片 URL 输入 + detail 参数 (--vision)",
            method="POST",
            url=chat_url,
            headers=headers,
            body={
                "model": model,
                "messages": [
                    {"role": "system", "content": "简短描述图片"},
                    {"role": "user", "content": [
                        {"type": "text", "text": "用一个词描述这张图"},
                        {"type": "image_url", "image_url": {
                            "url": image_url, "detail": "low"
                        }}
                    ]}
                ],
                "max_tokens": 10
            },
            validator=validate_openai_chat_completion_response
        ))

    # ---- --stream ----
    if args.stream:
        cases.append(TestCase(
            desc="基本流式 (--stream)",
            method="POST",
            url=chat_url,
            headers=headers,
            body={
                "model": model,
                "messages": [{"role": "user", "content": "Hi"}],
                "max_tokens": 5,
                "stream": True
            },
            stream=True,
            validator=validate_openai_chat_completion_response
        ))
        cases.append(TestCase(
            desc="流式 + include_usage (--stream)",
            method="POST",
            url=chat_url,
            headers=headers,
            body={
                "model": model,
                "messages": [{"role": "user", "content": "Hi"}],
                "max_tokens": 5,
                "stream": True,
                "stream_options": {"include_usage": True}
            },
            stream=True,
            validator=validate_openai_chat_completion_response
        ))
        cases.append(TestCase(
            desc="流式 + stop sequences (--stream)",
            method="POST",
            url=chat_url,
            headers=headers,
            body={
                "model": model,
                "messages": [{"role": "user", "content": "数数: 1,2,3,"}],
                "max_tokens": 20,
                "stream": True,
                "stop": ["5"]
            },
            stream=True,
            validator=validate_openai_chat_completion_response
        ))

    # ---- --tools ----
    if args.tools:
        tool_weather = {
            "type": "function",
            "function": {
                "name": "get_weather",
                "description": "获取指定城市的天气",
                "parameters": {
                    "type": "object",
                    "properties": {
                        "location": {"type": "string", "description": "城市名称"}
                    },
                    "required": ["location"]
                }
            }
        }
        cases.append(TestCase(
            desc="工具调用 tool_choice: auto (--tools)",
            method="POST",
            url=chat_url,
            headers=headers,
            body={
                "model": model,
                "messages": [{"role": "user", "content": "北京天气怎么样？"}],
                "max_tokens": 50,
                "tools": [tool_weather],
                "tool_choice": "auto"
            },
            validator=validate_openai_chat_completion_response
        ))
        cases.append(TestCase(
            desc="工具调用 tool_choice: required (--tools)",
            method="POST",
            url=chat_url,
            headers=headers,
            body={
                "model": model,
                "messages": [{"role": "user", "content": "北京天气怎么样？"}],
                "max_tokens": 50,
                "tools": [tool_weather],
                "tool_choice": "required"
            },
            validator=validate_openai_chat_completion_response
        ))
        cases.append(TestCase(
            desc="指定函数调用 tool_choice: {name} (--tools)",
            method="POST",
            url=chat_url,
            headers=headers,
            body={
                "model": model,
                "messages": [{"role": "user", "content": "北京天气怎么样？"}],
                "max_tokens": 50,
                "tools": [tool_weather],
                "tool_choice": {
                    "type": "function",
                    "function": {"name": "get_weather"}
                }
            },
            validator=validate_openai_chat_completion_response
        ))
        cases.append(TestCase(
            desc="多轮工具调用（构造 tool 结果）(--tools)",
            method="POST",
            url=chat_url,
            headers=headers,
            body={
                "model": model,
                "messages": [
                    {"role": "user", "content": "北京天气怎么样？"},
                    {"role": "assistant", "content": None, "tool_calls": [{
                        "id": "call_001", "type": "function",
                        "function": {
                            "name": "get_weather",
                            "arguments": "{\"location\": \"Beijing\"}"
                        }
                    }]},
                    {"role": "tool", "tool_call_id": "call_001",
                     "content": "{\"temperature\": 22, \"condition\": \"晴\"}"}
                ],
                "max_tokens": 20,
                "tools": [tool_weather]
            },
            validator=validate_openai_chat_completion_response
        ))
        cases.append(TestCase(
            desc="parallel_tool_calls: false (--tools)",
            method="POST",
            url=chat_url,
            headers=headers,
            body={
                "model": model,
                "messages": [{"role": "user", "content": "北京和上海的天气怎么样？"}],
                "max_tokens": 50,
                "tools": [tool_weather],
                "tool_choice": "auto",
                "parallel_tool_calls": False
            },
            validator=validate_openai_chat_completion_response
        ))

    # ---- --logprobs ----
    if args.logprobs:
        cases.append(TestCase(
            desc="logprobs + top_logprobs (--logprobs)",
            method="POST",
            url=chat_url,
            headers=headers,
            body={
                "model": model,
                "messages": [{"role": "user", "content": "Hi"}],
                "max_tokens": 5,
                "logprobs": True,
                "top_logprobs": 2
            },
            validator=validate_openai_chat_completion_response
        ))

    # ---- --json-schema ----
    if args.json_schema:
        cases.append(TestCase(
            desc="Structured Output json_schema (--json_schema)",
            method="POST",
            url=chat_url,
            headers=headers,
            body={
                "model": model,
                "messages": [{"role": "user", "content": "1+1等于几？"}],
                "max_tokens": 20,
                "response_format": {
                    "type": "json_schema",
                    "json_schema": {
                        "name": "math_answer",
                        "strict": True,
                        "schema": {
                            "type": "object",
                            "properties": {
                                "answer": {"type": "number"},
                                "explanation": {"type": "string"}
                            },
                            "required": ["answer", "explanation"],
                            "additionalProperties": False
                        }
                    }
                }
            },
            validator=validate_openai_chat_completion_response
        ))

    # ---- 高级参数测试 ----
    # logit_bias: 修改特定token的似然
    cases.append(TestCase(
        desc="logit_bias 参数测试",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [{"role": "user", "content": "Hello"}],
            "max_tokens": 5,
            "logit_bias": {"1234": -100, "5678": 50}
        },
        validator=validate_openai_chat_completion_response
    ))

    # reasoning_effort: 推理努力级别（需要模型支持）
    cases.append(TestCase(
        desc="reasoning_effort: medium",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [{"role": "user", "content": "1+1=?"}],
            "max_tokens": 10,
            "reasoning_effort": "medium"
        },
        validator=validate_openai_chat_completion_response
    ))

    # service_tier: 服务层级
    cases.append(TestCase(
        desc="service_tier: auto",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [{"role": "user", "content": "Hi"}],
            "max_tokens": 5,
            "service_tier": "auto"
        },
        validator=validate_openai_chat_completion_response
    ))

    # verbosity: 冗长程度
    cases.append(TestCase(
        desc="verbosity: low",
        method="POST",
        url=chat_url,
        headers=headers,
        body={
            "model": model,
            "messages": [{"role": "user", "content": "介绍一下Python"}],
            "max_tokens": 50,
            "verbosity": "low"
        },
        validator=validate_openai_chat_completion_response
    ))

    # ---- 执行测试 ----
    flags = []
    if args.vision:
        flags.append("vision")
    if args.stream:
        flags.append("stream")
    if args.tools:
        flags.append("tools")
    if args.logprobs:
        flags.append("logprobs")
    if args.json_schema:
        flags.append("json-schema")

    run_test_suite(
        cases=cases,
        ssl_ctx=ssl_ctx,
        title="OpenAI 兼容性测试",
        base_url=base_url,
        model=model,
        flags=flags
    )


if __name__ == "__main__":
    main()