Gemini 2.5 Flash

Chat Completions

gemini-2.5-flash

Google|Created Jun 17, 2025|1.0M context

Chat Completions

Gemini 2.5 Flash is Google’s high-performance workhorse model, specifically designed for advanced reasoning, coding, mathematics, and scientific tasks. Includes built-in "thinking" capabilities and is configurable through a "max tokens for reasoning" parameter for fine-tuned performance.

Overview Specifications Activity Performance Uptime Examples API Reference

Compare

Pricing-50%

Pay-as-you-go rates for this model. More details can be found here.

Input Tokens (1M)

$0.15

Output Tokens (1M)

$1.25

Capabilities

Input Modalities

TextImageFileAudio

Supported Parameters

Available parameters for API requests

Max Completion TokensReasoning EffortResponse FormatStopTemperatureTool ChoiceToolsTop PWeb Search Options

Usage Analytics

Token usage of this model on our platform

Throughput

Time-To-First-Token (TTFT)

Code Example

Example code for using this model through our API with Python (OpenAI SDK) or cURL. Replace placeholders with your API key and model ID.

Basic request example. Ensure API key permissions. For more details, see our documentation.

from openai import OpenAI

client = OpenAI(
    base_url="https://api.naga.ac/v1",
    api_key="YOUR_API_KEY",
)

resp = client.chat.completions.create(
    model="gemini-2.5-flash",
    messages=[
        {"role": "user", "content": "What's 2+2?"}
    ],
    temperature=0.2,
)
print(resp.choices[0].message.content)

Gemini 2.5 Flash

Input Tokens (1M)

Output Tokens (1M)

Input Modalities

Gemini 2.5 Flash

Input Tokens (1M)

Output Tokens (1M)

Input Modalities

Output Modalities