API 快速入门

用最短路径完成第一次 Gemini API 调用,快速了解认证、模型选择和基本示例代码。

1

获取 API Key

先访问 Google AI Studio,使用 Google 账号登录后创建新的 API Key。这个密钥是调用 Gemini API 的核心凭证,应保存在服务端或安全环境变量中,不要直接暴露在前端代码里。

2

安装 SDK

根据项目语言安装官方 SDK。Python 可安装 `google-generativeai`,Node.js 可安装 `@google/generative-ai`。如果你不打算使用 SDK,也可以直接调用 REST API。

3

编写代码

初始化客户端后选择一个模型,例如 `gemini-2.5-flash`,再调用生成接口发送提示词。你还可以按需配置 temperature、maxOutputTokens 等参数,用来控制风格、长度和稳定性。

4

发送请求

运行代码后即可拿到 Gemini 的返回结果。你可以从最简单的文本输入开始,后续再逐步接入图像、多模态、流式输出和函数调用等能力。

完整示例代码 (Python)

import google.generativeai as genai

# 配置 API Key
genai.configure(api_key="YOUR_API_KEY")

# 选择模型
model = genai.GenerativeModel('gemini-2.5-flash')

# 生成内容
response = model.generate_content(
    "请用中文介绍一下 Gemini AI",
    generation_config=genai.types.GenerationConfig(
        temperature=0.7,
        max_output_tokens=2048,
    )
)

print(response.text)

完整示例代码 (Node.js)

const { GoogleGenerativeAI } = require("@google/generative-ai");

const genAI = new GoogleGenerativeAI("YOUR_API_KEY");
const model = genAI.getGenerativeModel({ model: "gemini-2.5-flash" });

async function main() {
  const result = await model.generateContent(
    "请用中文介绍一下 Gemini AI"
  );
  console.log(result.response.text());
}

main();

推荐模型选择

gemini-2.5-flash

推荐的主力模型,速度快、成本低、适合大多数应用。

gemini-2.5-pro

高阶推理模型,适合复杂任务和高质量内容输出。

gemini-3.1-flash

适合多模态与更丰富的实时交互场景。

gemini-3.1-flash-lite

更轻量的模型,适合简单任务和低延迟需求。

关于 Gemini API 的进一步说明

Gemini API 是把 Gemini 能力接入自有产品、脚本和系统的核心方式。无论你是在做聊天应用、内容生成、知识问答、 多模态分析还是自动化流程,API 都是最直接的接入入口。

初次接入时,建议先从 `gemini-2.5-flash` 开始,因为它在速度、成本和能力之间更平衡。等你已经确认需求稳定, 再逐步引入更高阶模型或更多能力,例如多模态输入、流式输出、函数调用和长上下文处理。

对新手来说,最重要的不是一次用尽所有功能,而是先把“认证、模型、请求、返回结果”这条链路跑通。只要第一次调用成功, 后续就可以围绕你的业务目标持续扩展。

第一次接入最容易踩的坑

很多人第一次调用失败,并不是因为模型本身,而是因为认证、模型名、环境变量或请求格式出了问题。最常见的几类情况包括:把 API Key 直接写到前端、模型名写错、没有正确读取环境变量、请求字段和 SDK 版本不匹配,或者一开始就把多模态、流式和复杂参数同时加进去导致排查困难。

更稳的方式是先用最小示例跑通一条纯文本请求,再逐步加入温度、长度限制、多模态输入和流式响应。这样当问题出现时,你更容易判断是认证问题、参数问题,还是业务代码本身的问题。

推荐接入顺序

  • 1. 先获取密钥并本地验证最小示例。
  • 2. 选一个主力模型,例如 `gemini-2.5-flash`。
  • 3. 把调用封装成独立函数或服务层。
  • 4. 再补错误处理、日志、重试和流式输出。
  • 5. 最后再接图像、函数调用和复杂工作流。

适合先做的项目类型

  • 聊天问答和知识库检索原型。
  • 文章摘要、内容生成和文档整理工具。
  • 客服辅助、内部助手和自动化脚本。
  • 研发辅助、代码分析和工作流接口服务。
  • 图文理解、简单多模态输入实验。

API 价格参考

2.5 Flash 输入
$0.15/1M
2.5 Flash 输出
$0.60/1M
2.5 Pro 输入
$1.25/1M
2.5 Pro 输出
$10.00/1M
免费额度
15 RPM
开发说明

API 快速入门 在 Gemini 接入流程中的作用

API 快速入门 更适合放在完整接入链路中去理解,而不是孤立阅读。对于 Gemini API 来说,开发者通常不会只靠一页文档完成所有工作,而是需要在快速入门、认证、模型选择、错误处理、安全控制和计费规则之间不断来回对照。

当前页面所覆盖的内容,更多是在帮助你补齐某一个关键环节。用最短路径完成第一次 Gemini API 调用,快速了解认证、模型选择和基本示例代码。 如果这部分理解不够充分,前期也许能跑通,但到了业务扩容、多人协作和生产环境阶段,问题往往会逐渐放大。

阅读这类页面时,最好同时思考自己的项目状态:你是处于试验阶段、正式接入阶段,还是正在做稳定性补强。不同阶段关注的重点不同,页面里的同一段内容,在不同时间点的价值也会不同。

如果你希望当前页面的内容真正服务实际开发,建议边读边确认自己的模型、语言、部署环境和权限策略。这样再回看相关链接时,会更容易形成可执行的开发方案,而不是停留在概念层。

阅读重点

  • 单页文档更适合放回完整接入链路里理解。
  • 开发文档应服务实际项目而不是只解释名词。
  • 上线前建议把认证、异常、成本和安全一起检查。

阅读 API 快速入门 时可以顺手确认的细节

很多技术主题看起来像局部问题,但一旦进入真实项目,就会和模型选择、日志记录、部署环境和调用成本产生连锁关系。因此,单页文档越是基础,越值得结合整体流程去看。

如果当前主题涉及 SDK、接口格式、异常状态或鉴权方式,最好马上用自己的项目场景试着对应一遍。这样可以更快发现还有哪些缺口需要回到其他文档补齐。

对于正式商用场景,建议把文档中的默认用法进一步改造成符合自己环境的实现,例如更明确的重试策略、密钥隔离和监控记录。这样更接近长期可维护的接入方式。

看上下游关系

当前页面通常只是开发链路中的一个节点,前后内容往往同样关键。

看实际环境

浏览器试验、服务端接入和企业环境,对同一主题的要求并不完全相同。

看后续维护

越早把异常处理和权限边界想清楚,后面越容易稳定扩展。