Agent常用搜索引擎Tavily使用学习

发布于:2025-07-30 ⋅ 阅读:(18) ⋅ 点赞:(0)

Agent常用搜索引擎Tavily

Tavily简介

  • Tavily作为一款专为智能体检索与推理需求量身打造的工具,Tavily不仅提供了高度可编程的API接口,还具备显著优于传统搜索引擎的上下文相关性理解能力。Tavily能够以结构化、可解析的形式返回搜索结果,便于Agent将检索到的信息直接用于后续的推理、生成或任务执行流程。
  • - Tavily官网:https://www.tavily.com/【注意tavily访问需要使用魔法环境,否则出现登录页面访问失败】
    在这里插入图片描述
  • tavily官方说明文档
  • Tavily Expert: Tavily Expert是Tavily团队在智能检索领域推出的增强型专业知识提取服务,旨在为开发者和企业提供一种更精准、更高价值的信息获取方式。相较于基础的Web搜索功能,Tavily Expert在检索策略、知识库整合和结果可信度方面进行了全方位的优化,尤其适用于需要深度事实核查和权威来源支持的场景。
  • Tavily Expert并非仅仅对互联网上的通用内容进行抓取,而是通过与精选的专业数据库、优质出版物和可靠文献资源对接,构建出一套具备更高可信度和领域针对性的检索体系。开发者可以通过API接口,向Tavily Expert提交自然语言查询,随后得到经过多层次筛选和关联的答案集,其中包含详细的来源引用和内容摘要,便于在智能体工作流中进行验证或引用。

Tavily SDK 使用指南

# pip install tavily-python
from tavily import TavilyClient
tavily_client= TavilyClient("tvly-YOUR_API_KEY")
# Tavily SDK支持通过代理服务器转发请求,便于在受限网络环境下使用
'''
from tavily import TavilyClient
proxies = {
  "http": "<your HTTP proxy>",
  "https": "<your HTTPS proxy>",
}
tavily_client= TavilyClient("tvly-YOUR_API_KEY", proxies=proxies)
'''
# 执行搜索
response = tavily_client.search(
    "2025年7月中国IT行业最近一周的最新消息,请简单列举10条消息",
    include_images=True,
    include_image_descriptions=True
)
# 输出结果
print(response)
{
  "query": "2025年7月中国IT行业最近一周的最新消息,请简单列举10条消息",
  "follow_up_questions": null,
  "answer": null,
  "images": [
    {
      "url": "https: //imagecn.gasgoo.com/moblogo/News/160_110//2025/7/2207132339.jpg",
      "title": "盖世汽车",
      "description": "Agroupofpeopleisstandingonastageinfrontofalargedigitalscreendisplayingthetext\"AI赋能 安全领航\"and\"2025第八届智能辅助驾驶大会,\"indicatingtheyareattendingthe8thIntelligentAssistedDrivingConference2025organizedbyGasgoo."
    },
    {
      "url": "https: //i.weather.com.cn/images/cn/video/lssj/2025/06/26/034EDBA76BDE914BE61084B50E06409B.jpg",
      "title": "2025年7月发布会-中国气象网",
      "description": "AweatherforecastgraphicindicatesthatsouthwesternChina,\n            includingthesouthernregion,\n            isexpectedtoexperienceheavyrainfallwithdetailedpredictionsonwaterdroppatterns."
    },
    {
      "url": "https: //q1.itc.cn/q_70/images03/20250626/6b2077a744824a3baeedfcf41e060c00.png",
      "title": "7月3日~6日,2025中国—东盟图书文化周即将开启!_主题_活动_专区",
      "description": "A colorful promotional poster for the 2025 China-ASEAN Book Fair, held at Nanning International Convention and Exhibition Center from July 3 to July 6, 2025, featuring the event's name, dates, location, and organizer details."
    },
    {
      "url": "https: //img3.qianzhan.com/news/202505/26/20250526-fad57e608c83588b.png",
      "title": "重磅!2025年中国及部分省市多模态大模型行业政策汇总及解读(全)政策...",
      "description": null
    },
    {
      "url": "https: //img-cms.pchome.net/article/1k9/k2/4t/svmnri-1tfq-ori.png?imageView2/2/w/720/q/100",
      "title": "7月127款国产网络游戏获批:腾讯、网易等大厂无新游",
      "description": "The image displays a table listing the latest news about China's internet gaming industry in July 2025, including company names, categories, publisher information, operation units, approval documents, ISBN numbers, and approval dates."
    }
  ],
  "results": [
    {
      "url": "https://ustr.gov/sites/default/files/2023%20USTR%20Report%20on%20China's%20WTO%20Compliance_CN.pdf",
      "title": "[\n                PDF\n            ]2023年中国世界贸易组织合规情况报告-USTR",
      "content": "该议定书还建立.了一个独特的10年期审查机制,旨在监督中国.在履行其众多WTO承诺方面的进展,并确保.获得有关中国实施产业规划的最新信息。中国WTO合规记录.正如之前的",
      "score": 0.041264866,
      "raw_content": null
    },
    {
      "url": "https: //hai.stanford.edu/assets/files/hai_ai_index_report_2025_chinese_version_061325.pdf",
      "title": "[\n                PDF\n            ]2025年人工智能指数报告-StanfordHAI",
      "content": "今年的报告新增了对人工智能硬件发展状况.的深入分析、对推理成本的新估算,以及对人工智能论文发表和专利申请趋势的新分析。我们还首次披露了企业采用负",
      "score": 0.041033678,
      "raw_content": null
    },
    {
      "url": "https: //www.smmusd.org/site/Default.aspx?PageType=6&SiteID=23&SearchString=%E5%B1%B1%E8%A5%BF%E7%9C%81%E5%B1%8F%E8%94%BD%E8%82%A1%E7%A5%A8%E2%9C%88%EF%B8%8F@kaiban",
      "title": "山西省屏蔽股票✈@kaibanSearchResults-smmusd.org",
      "content": "MAPIT·WebCommunityManager.QuestionsorFeedback?WebCommunityManagerPrivacyPolicy(Updated).Copyright©2025Finalsite-allrightsreserved.",
      "score": 0.039941143,
      "raw_content": null
    },
    {
      "url": "http: //www.mofcom.gov.cn/dl/gbdqzn/upload/bolan.pdf",
      "title": "[\n                PDF\n            ]波兰-商务部",
      "content": "EmiliiPlater53,\n            Warsaw,\n            Poland电话:0048-22-5288807(11)长飞光纤光缆(波兰)公司地址:PL,\n            Opoczyńska8B,\n            96-200RawaMazowiecka电话:+48500129999(12)埃斯创卢森堡(波兰)公司地址:MaciejaWilczka1,41-807ZabrzePoland电话:+48532693032【在波中资企业商会】波兰中国总商会总商会秘书处地址:Ul.Królewska18,\n            00-103Warsaw,\n            Poland电话:0048-22-2556853电邮:biuro@sinocham.pl网址:sinocham.pl/cn【主要在波华人社团】(1)波兰华侨华人协会,会长赵德金电话:0048-530170222(2)波兰华人商会:会长石立仁电话:0048-60-3485599(3)波兰福建商会会长:黄天庆电话:0048-666881881(4)波兰华人青年联合会会长:叶怀毅电话:0048-539959999(5)波兰华人妇女联合会会长:南爱玉电话:0048-881920087(6)波兰青田同乡会会长:邱琼电话:0048-78866699978787878波兰(2024年版)附录4能够为中国企业提供投资合作咨询的机构1中国驻波兰大使馆经济商务处地址:Ul.Bonifraterska1,\n            00-203Warsaw,\n            Poland电话:0048-22-8313861,\n            传真:0048-22-6358079电邮:pl@mofcom.gov.cn网址:pl.mofcom.gov.cn2波兰中国总商会总商会秘书处地址:Ul.Królewska18,\n            00-103Warsaw,\n            Poland电话:0048-22-2556853电邮:biuro@sinocham.pl网址:sinocham.pl/cn3波兰驻中国大使馆地址:北京市朝阳区建国门外日坛路1号,100600电话:010-65321235、65323567(领事处)传真:010-65321745电邮:polska@public2.bta.net.cnpolska@public2.bta.net.cn,pekin.amb.sekretariat@msz.gov.pl网址:www.PolandEmbassyChina.net或-2556853www.pekin.msz.gov.pl波兰驻上海总领馆地址:上海市建国西路618号,200031电话:021-64339288、64334735传真:021-64330417电邮:cgpl@polandshanghai.org,commoff@uninet.com.cn网址:www.polandshanghai.org或www.szanghaj.msz.gov.pl79797979波兰(2024年版)波兰驻广州总领馆地址:广东省广州市沙面大街63号,510130电话:020-81219994、81219993传真:020-81219995电邮:plcgeca@pub.guangzhou.gd.cn或kanton.kg.sekretariat@msz.gov.pl网址:www.kanton.msz.gov.pl波兰驻成都总领馆地址:四川省成都市锦江区东御街18号,610016电话:028-84592585/2581/2582/8459传真:028-84592586电邮:chengdu.kg.sekretariat@msz.gov.pl网址:www.chengdu.msz.gov.pl预约:www.e-konsulat.gov.pl/波兰驻香港总领馆地址:香港皇后大道东183号25楼2506室电话:00852-28400779、00852-93663262传真:00852-25960062电邮:hongkong.kg.info@msz.gov.pl网址:www.hongkong.msz.gov.pl4波兰投资促进机构波兰投资和贸易局(PolishInvestmentandTradeAgency),该局与中国商务部投资促进局签署了《投资促进合作协议》。地址:KruczaStreet50,00-025Warsaw电话: 0048-22-3349800、0048-22-3349875电邮:invest@paih.gov.pl网址:www.paih.gov.pl80808080波兰(2024年版)办公时间:每周一到周五,09: 00-17: 00波兰投资和贸易局驻上海办事处地址:上海市南京西路993号锦江向阳大厦1406室电话:021-22111586传真:021-62727355电邮:china@paih.gov.pl波兰国家商会地址:00-074Warszawa,ul.",
      "score": 0.03107619,
      "raw_content": null
    }
  ],
  "response_time": 5.1
}

  • search方法说明
参数 类型 说明 默认值
query (必填) str 待搜索的查询内容
auto_parameters bool 自动根据查询内容智能配置搜索参数。include_answer, include_raw_content, max_results始终需手动设置;如自动设置 search_depth 为 advanced,会产生额外消耗(2 API credits)。 False
search_depth str 搜索深度,可选 “basic” 或 “advanced”,高级模式会返回更相关的内容片段和来源 “basic”
topic str 搜索主题(分类),支持 “general” 和 “news” “general”
days int 针对新闻主题,查询结果包含从当前日期往前推几天内的内容 7
time_range str 时间范围,支持 “day”, “week”, “month”, “year”(“d”, “w”, “m”, “y”)
max_results int 返回结果最大数量(0~20) 5
chunks_per_source int 每个来源返回多少内容片段(仅search_depth="advanced"有效) 3
include_images bool 是否返回与查询相关的图片列表 False
include_image_descriptions bool 是否返回图片及其自动生成的描述
include_answer bool或str 返回基于搜索结果生成的答案.“basic”/True为简要答案,"advanced"为详细答案 False
include_raw_content bool或str 返回解析的原始HTML内容,"markdown"或True为Markdown格式,"text"为纯文本 False
include_domains list[str] 指定要包含的域名 []
exclude_domains list[str] 指定要排除的域名 []
country str 优先返回来自指定国家的内容(仅 general 主题可用)
timeout int API请求超时时间(秒) 60
include_favicon bool 返回每个结果对应的 favicon URL False

  • 返回格式:一次搜索请求将返回一个字典对象
字段 类型 说明
query str 您的原始查询内容
results list[Result] 排序后的搜索结果列表
response_time float 搜索用时(秒)
answer str(可选) 基于搜索结果生成的答案(需开启 include_answer)
images list[str] 或 list[ImageResult](可选) 图片URL或包含描述的对象列表(需开启图片参数)
  • Result对象字段
字段 类型 说明
title str 搜索结果标题
url str 搜索结果URL
content str 最相关的内容摘要
score float 相关性得分
raw_content str(可选) 原始HTML内容(需开启 include_raw_content)
published_date str(可选) 来源发布时间(news 主题下可用)
favicon str(可选) favicon URL

Tavily Extract 功能

  • Tavily SDK 还提供了网页内容提取(Extract)接口,支持从指定 URL 抓取清洗后的正文、图片和元数据,特别适用于批量获取网页内容、构建知识库或进行后续分析。
  • 通过 extract() 方法向 Tavily 提交单个或批量 URL,自动提取结构化内容
from tavily import TavilyClient

# 初始化客户端
tavily_client = TavilyClient("tvly-XXX")

# 定义需要提取内容的URL列表
urls = [
    "https://yuanyou.blog.csdn.net"
]

# 执行提取请求
response = tavily_client.extract(
    urls=urls,
    include_images=True
)

# 输出提取结果
print(response)

Tavily Crawl 功能

  • Tavily Crawl 是专为智能体开发设计的网页爬取功能,支持从一个基础 URL 自动递归抓取网页内容,构建丰富的上下文数据。
  • 通过 crawl() 方法即可启动一个爬取任务,并自动获取抓取结果。
from tavily import TavilyClient

# 初始化客户端
tavily_client = TavilyClient(api_key="tvly-YOUR_API_KEY")

# 定义起始URL
url = "https://docs.tavily.com"

# 执行爬取
response = tavily_client.crawl(
    url,
    instructions="请帮我整理Python SDK相关信息"
)

# 输出结果
print(response)

网站公告

今日签到

点亮在社区的每一天
去签到