AI MCP 系列

AgentGPT-01-入门介绍

Browser-use 是连接你的AI代理与浏览器的最简单方式

AI MCP(大模型上下文)-01-入门介绍

AI MCP(大模型上下文)-02-awesome-mcp-servers 精选的 MCP 服务器

AI MCP(大模型上下文)-03-open webui 介绍 是一个可扩展、功能丰富且用户友好的本地部署 AI 平台,支持完全离线运行。

AI MCP(大模型上下文)-04-n8n 为技术团队打造的安全工作流自动化平台

AI MCP(大模型上下文)-05-anything-llm AnythingLLM 您一直在寻找的全方位AI应用程序

AI MCP(大模型上下文)-06-maxkb 强大易用的企业级 AI 助手

AI MCP(大模型上下文)-07-dify 入门介绍

AI MCP(大模型上下文)-08-分享一些好用的 Dify DSL 工作流程

AI MCP(大模型上下文)-09-基于Dify自主创建的AI应用DSL工作流

AI MCP(大模型上下文)-10-Activepieces 一个开源的 Zapier 替代方案

AI MCP(大模型上下文)-11-微软 Playwright MCP server

AI MCP(大模型上下文)-12-AWS MCP

AI MCP(大模型上下文)-13-github MCP

启用AI控制你的浏览器 🤖

🌐 Browser-use 是将AI代理与浏览器连接的最简单方式。

💡 查看别人正在构建的内容,并在我们的 Discord 上分享你的项目!想要周边?看看我们的 Merch商店

🌤️ 跳过设置 —— 试试我们的托管版本,即时浏览器自动化!试试云端 ☁︎


快速开始

使用pip(Python >=3.11):

pip install browser-use

安装Playwright:

playwright install chromium

启动你的代理:

from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
from dotenv import load_dotenv
load_dotenv()

async def main():
    agent = Agent(
        task="比较gpt-4o和DeepSeek-V3的价格",
        llm=ChatOpenAI(model="gpt-4o"),
    )
    await agent.run()

asyncio.run(main())

将你想使用的提供商的API密钥添加到.env文件中。

OPENAI_API_KEY=  
ANTHROPIC_API_KEY=  
AZURE_ENDPOINT=  
AZURE_OPENAI_API_KEY=  
GEMINI_API_KEY=  
DEEPSEEK_API_KEY=  

有关其他设置、模型等,请查阅 文档 📕


UI测试

你可以测试 browser-use的UI仓库

或者简单地运行gradio示例:

pip install gradio
python examples/ui/gradio_demo.py

演示

任务添加杂货到购物车并结账

AI买了我的杂货


提示:将我最新的LinkedIn关注者添加到Salesforce中的潜在客户列表。

LinkedIn到Salesforce


提示阅读我的简历并寻找机器学习工作,将它们保存到文件中,然后开始在新标签页中申请,如果需要帮助,问我

示例


提示在Google Docs中写一封信给我爸爸,感谢他的一切,并将文件保存为PDF

给爸爸的信


提示查找具有cc-by-sa-4.0许可证的模型,并按最受欢迎排序,保存前5个到文件

文件


更多示例

欲了解更多示例,请查看examples文件夹或加入Discord,展示你的项目。


愿景

告诉你的计算机做什么,它就会完成。


路线图

代理
  • [ ] 改进代理记忆(总结、压缩、RAG等)
  • [ ] 增强规划能力(加载特定网站的上下文)
  • [ ] 减少token消耗(系统提示、DOM状态)
DOM提取
  • [ ] 改进日期选择器、下拉框、特殊元素的提取
  • [ ] 改进UI元素的状态表示
任务重跑
  • [ ] 使用LLM作为回退
  • [ ] 简化工作流模板定义,其中LLM填写详细信息
  • [ ] 从代理返回playwright脚本
数据集
  • [ ] 创建复杂任务的数据集
  • [ ] 对不同模型进行基准测试
  • [ ] 针对特定任务微调模型
用户体验
  • [ ] 人工干预执行
  • [ ] 改进生成的GIF质量
  • [ ] 创建各种演示以进行教程执行、职位申请、QA测试、社交媒体等。

老马啸西风
191 声望34 粉丝