如果你是开发者、AI 工具作者、个人站长,可能已经关注到:Google 推出的 Gemini 不仅是聊天助手,它也开放了开发者 API,可以像调用 OpenAI 的 GPT-4 一样调用 Gemini 模型。
但很多中文用户还不太清楚 Gemini 的 API 怎么用、能干嘛、用起来和 OpenAI 有啥区别、需要哪些前置条件。
这篇文章就来讲清楚:
Gemini 开发者 API 怎么用?怎么申请?怎么调用?
一、Gemini API 能做什么?
Gemini API 是 Google 为开发者开放的大模型接口,核心是对接 Gemini 1.5 Pro 模型。
你可以用它来做:
- 多轮对话 AI(类 ChatGPT)
- 文件问答(上传 PDF、Word、TXT 等)
- 图像识别、多模态输入
- 编写代码、解释代码、调试脚本
- 智能摘要、信息提取、结构化数据生成
适合场景包括客服系统、AI 内容生成、自动化工具、教育类产品、编程辅助等。
二、Gemini API 官方地址和文档
Gemini API 是 Google 的 Vertex AI 服务的一部分。
- 官方入口:https://ai.google.dev
- API 文档地址:https://ai.google.dev/docs
- 支持语言:Python、Node.js、Go、REST、gRPC 等
- 免费额度:目前每个账号都有免费试用配额,适合先跑 demo
三、使用 Gemini API 的前置条件
想调用 Gemini 模型,你需要具备以下几点:
- 一个 Google 账号(设置为美区最佳)
- 启用 Google Cloud 项目
- 开通 Vertex AI API
- 绑定有效的付款方式(国外信用卡或虚拟 Visa 卡)
- 获取 API Key 或设置服务账户凭证
- 获取 API Key 充值入口
四、快速开始:Gemini API Python 示例
- 安装 SDK:
pip install google-generativeai
- 初始化 API:
import google.generativeai as genai
genai.configure(api_key="你的 API KEY")
model = genai.GenerativeModel('gemini-pro')
response = model.generate_content("帮我总结一下量子计算的核心概念")
print(response.text)
- 上传文件进行问答(需要 gemini-pro-vision):
model = genai.GenerativeModel('gemini-pro-vision')
with open("example.png", "rb") as img:
image_data = img.read()
response = model.generate_content(
["这张图有什么内容?", {"mime_type": "image/png", "data": image_data}]
)
print(response.text)
- 支持多轮对话上下文:
chat = model.start_chat()
chat.send_message("你能写一个快速排序吗?")
chat.send_message("那能用 Python 改写吗?")
五、费用说明
Gemini API 定价(以 Gemini 1.5 Pro 为例):
- 输入 tokens:约 $0.000125 / 1000 tokens
- 输出 tokens:约 $0.000375 / 1000 tokens
- 长上下文窗口(1M tokens)非常适合大文档处理
免费额度:注册后默认可用部分免费 tokens,适合测试、开发。