Sponsored by Deepsite.site

PhoneMcp - Android Phone Control via ADB

Created By
kengerlwla month ago
Control your Android phone via ADB using AI assistants. Supports both zero-config Skill mode (CatPaw/Claude Code) and standard MCP server mode (Claude Desktop/Cursor). Features: screen capture, tap/swipe gestures, text input, app management, file transfer, shell commands, and more.
Overview

📱 PhoneMCP — Let AI Control Your Phone

让 AI 助手直接操控你的 Android 手机 —— 支持 Skill 和 MCP 两种接入方式

Release License Stars Python

📺 完整演示视频 · 🎬 快速上手教程


🎬 演示

用自然语言让 AI 帮你操作手机 —— 打开 App、发消息、搜索商品,一句话搞定。

演示视频

▶️ 点击观看完整演示视频 | 31 秒快速上手


💡 这是什么?

PhoneMCP 是一个 AI 手机操控工具,通过 ADB 让 AI 助手能够直接看到你的手机屏幕、点击按钮、输入文字、打开 App —— 就像一个真正的助手在帮你操作手机。

提供两种接入方式,适配不同的 AI 客户端生态:

方式适合场景是否需要配置
⭐ Skill 模式(推荐)CatPaw、Claude Code 等支持 Skill 的客户端零配置,下载解压即用
MCP 模式Claude Desktop、Cursor 等 MCP 客户端需要配置 MCP 服务器地址

🏗️ 工作原理

┌─────────────────────────────────────────────────────────┐
│                      你的电脑                            │
│                                                         │
│  ┌──────────────┐              ┌──────────────────┐    │
│  │  AI 助手      │  Skill/CLI  │   PhoneMCP       │    │
│  │              │ ──────────► │                  │    │
│  │ · CatPaw    │   或 MCP     │  截图 / 点击      │    │
│  │ · Claude    │              │  输入 / 滑动      │    │
│  │ · Cursor    │              │  启动App / ...    │    │
│  │ · ...       │              │                  │    │
│  └──────────────┘              └────────┬─────────┘    │
│                                         │ ADB          │
└─────────────────────────────────────────┼───────────────┘
                                   USB / WiFi
                                ┌─────────▼─────────┐
                                │   Android 手机     │
                                │                   │
                                │  📱 屏幕截图       │
                                │  👆 触控操作       │
                                │  ⌨️ 文本输入       │
                                │  📦 应用管理       │
                                └───────────────────┘

✨ 功能特性

  • 📸 截图 — 获取手机实时屏幕截图
  • 👆 触控 — 点击、双击、滑动
  • ⌨️ 输入 — 输入文本(完美支持中文),清除文本
  • 🏠 按键 — 返回、主页、音量、电源等系统按键
  • 📱 应用 — 启动应用、搜索已安装应用、获取当前应用
  • 🎯 UI 元素识别 — 智能获取屏幕 UI 元素列表,通过索引/文本精准点击(推荐)
  • 🔍 OCR 模式 — 针对 WebView / 游戏 / Flutter 等场景,支持 OCR 文字识别
  • 📡 多设备 — 支持 USB 和 WiFi 连接,可同时管理多台设备

🚀 快速开始

前置要求

  1. Android 手机通过 USB 连接电脑(或通过 WiFi 连接)
  2. 手机开启 USB 调试(见下方教程)

💡 使用可执行文件时无需安装 ADB,已内嵌。

📱 手机端开启 USB 调试教程(点击展开)

第一步:开启开发者选项

  1. 打开手机 设置
  2. 进入 关于手机(部分手机在「设置 > 系统 > 关于手机」)
  3. 连续点击 版本号 7 次,直到出现「您已进入开发者模式」的提示

💡 不同品牌的路径可能略有差异:

  • 小米/红米:设置 → 我的设备 → 全部参数与信息 → 连续点击「MIUI 版本」
  • 华为/荣耀:设置 → 关于手机 → 连续点击「版本号」
  • OPPO/realme:设置 → 关于手机 → 连续点击「版本号」
  • vivo/iQOO:设置 → 关于手机 → 连续点击「软件版本号」
  • 三星:设置 → 关于手机 → 软件信息 → 连续点击「编译编号」
  • 一加:设置 → 关于本机 → 连续点击「版本号」

第二步:开启 USB 调试

  1. 返回 设置 主页
  2. 进入 系统开发者选项(部分手机直接在设置列表底部)
  3. 打开 USB 调试 开关
  4. 如果有 USB 安装USB 调试(安全设置),也一并打开

第三步:连接电脑并授权

  1. 用 USB 数据线连接手机和电脑
  2. 手机上会弹出「允许 USB 调试吗?」的对话框
  3. 勾选「始终允许使用这台计算机进行调试
  4. 点击 确定/允许

⚠️ 注意事项

  • 请使用支持数据传输的 USB 线(非纯充电线)
  • 如果没有弹出授权对话框,尝试拔插 USB 或在终端运行 adb devices 触发
  • 部分手机需要在 USB 连接方式中选择「文件传输 (MTP)」模式

⭐ 方式一:Skill 模式(推荐,零配置)

最简单的方式:下载 Skill 压缩包,解压到 AI 客户端的 Skill 目录,即刻可用。

1. 下载

Releases 页面 下载对应平台的 Skill 压缩包

平台下载文件
🍎 macOS (Apple Silicon)phone-mcp-skill-macos-arm64.zip
🐧 Linuxphone-mcp-skill-linux-amd64.zip
🪟 Windowsphone-mcp-skill-windows-amd64.zip

2. 解压到 Skill 目录

# CatPaw
unzip phone-mcp-skill-macos-arm64.zip -d ~/.catpaw/skills/phone-mcp/

# Claude Code
unzip phone-mcp-skill-macos-arm64.zip -d ~/.claude/skills/phone-mcp/

解压后的目录结构:

phone-mcp/
├── SKILL.md      # AI 操作指南(AI 自动读取)
└── phone-mcp     # 可执行文件(内嵌 ADB)

3. 开始使用

连接手机后,直接对 AI 说:

  • "帮我打开微信,给张三发一条消息说'明天见'"
  • "截个屏看看手机现在的界面"
  • "打开淘宝搜索 iPhone 手机壳"

AI 会自动读取 SKILL.md,通过 CLI 调用可执行文件来操控你的手机。无需任何额外配置。

CLI 用法

Skill 模式下 AI 会自动调用这些命令,你也可以手动使用:

# 检测连接的设备
./phone-mcp run '{"action":"list_devices"}'

# 截图
./phone-mcp run '{"action":"screenshot"}'

# 获取屏幕元素
./phone-mcp run '{"action":"get_ui_elements"}'

# 点击元素
./phone-mcp run '{"action":"tap_element","text":"微信"}'

# 输入文本
./phone-mcp run '{"action":"type_text","text":"你好"}'

# 批量执行
./phone-mcp run '[{"action":"launch_app","name":"微信"},{"action":"wait","seconds":2},{"action":"get_ui_elements"}]'

🔧 方式二:MCP 服务器模式

适用于 Claude Desktop、Cursor 等支持 MCP 协议的客户端。需要先启动服务器,再在客户端中配置连接。

下载

Releases 页面 下载独立可执行文件:

平台文件
🐧 Linuxphone-mcp-linux-amd64
🪟 Windowsphone-mcp-windows-amd64.exe
🍎 macOS (Apple Silicon)phone-mcp-macos-arm64

SSE 模式(默认,推荐)

# 启动服务器
./phone-mcp-macos-arm64 serve
# 默认监听 http://0.0.0.0:8009

在 MCP 客户端配置中添加:

{
  "mcpServers": {
    "phone-mcp": {
      "url": "http://localhost:8009/Phone/sse"
    }
  }
}

STDIO 模式

适用于 Claude Desktop 等直接调用可执行文件的场景:

{
  "mcpServers": {
    "phone-mcp": {
      "command": "/path/to/phone-mcp-macos-arm64",
      "args": ["serve", "--transport", "stdio"]
    }
  }
}

从源码运行

git clone https://github.com/kengerlwl/phoneMcp.git
cd phoneMcp
pip install -r requirements.txt
python main.py serve

命令行参数

phone-mcp serve [选项]

选项:
  -t, --transport TYPE   传输模式: sse 或 stdio(默认: sse)
  -H, --host HOST        监听地址(默认: 0.0.0.0)
  -p, --port PORT        监听端口(默认: 8009)
  --path PATH            MCP 路径(默认: /Phone)
  --guide                显示详细使用指南

🛠️ 支持的操作

操作CLI actionMCP Tool说明
列出设备list_deviceslist_devices列出已连接的 Android 设备
连接设备connectconnect_device连接远程设备(WiFi/TCP)
断开设备disconnectdisconnect_device断开设备连接
截图screenshotget_screenshot获取屏幕截图
获取元素get_ui_elementsget_ui_elements获取 UI 元素列表 ⭐
点击元素tap_elementtap_element通过索引/文本/ID 点击 ⭐
坐标点击tap点击指定坐标
双击double_tap双击指定坐标
滑动swipeswipe滑动屏幕
输入文本type_texttype_text输入文本(支持中文)
清除文本clear_textclear_text清除输入框文本
返回键backpress_back按返回键
主页键homepress_home按主页键
按键keypress_key发送任意按键事件
启动应用launch_applaunch_app通过名称或包名启动应用
当前应用current_appget_current_app获取当前前台应用
搜索应用search_appssearch_apps搜索已安装应用
等待waitwait等待指定时间

💡 推荐工作流:先调用 get_ui_elements 获取屏幕元素,再用 tap_element 精准点击,比直接使用坐标更可靠。

💬 使用示例

连接好手机后,你可以在 AI 助手中直接用自然语言操作手机:

  • "帮我打开微信,给张三发一条消息说'明天见'"
  • "截个屏看看手机现在的界面"
  • "打开设置,把 WiFi 关掉"
  • "打开淘宝搜索 iPhone 手机壳"
  • "帮我看看手机上装了哪些应用"

AI 助手会自动调用 PhoneMCP 的工具来完成这些操作。

⭐ 支持项目

如果 PhoneMCP 对你有帮助,请给个 Star ⭐ 支持一下!

Star History Chart

📄 License

MIT

Recommend Servers
TraeBuild with Free GPT-4.1 & Claude 3.7. Fully MCP-Ready.
Zhipu Web SearchZhipu Web Search MCP Server is a search engine specifically designed for large models. It integrates four search engines, allowing users to flexibly compare and switch between them. Building upon the web crawling and ranking capabilities of traditional search engines, it enhances intent recognition capabilities, returning results more suitable for large model processing (such as webpage titles, URLs, summaries, site names, site icons, etc.). This helps AI applications achieve "dynamic knowledge acquisition" and "precise scenario adaptation" capabilities.
DeepChatYour AI Partner on Desktop
BlenderBlenderMCP connects Blender to Claude AI through the Model Context Protocol (MCP), allowing Claude to directly interact with and control Blender. This integration enables prompt assisted 3D modeling, scene creation, and manipulation.
AiimagemultistyleA Model Context Protocol (MCP) server for image generation and manipulation using fal.ai's Stable Diffusion model.
Baidu Map百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。
Y GuiA web-based graphical interface for AI chat interactions with support for multiple AI models and MCP (Model Context Protocol) servers.
WindsurfThe new purpose-built IDE to harness magic
EdgeOne Pages MCPAn MCP service designed for deploying HTML content to EdgeOne Pages and obtaining an accessible public URL.
Visual Studio Code - Open Source ("Code - OSS")Visual Studio Code
Serper MCP ServerA Serper MCP Server
RedisA Model Context Protocol server that provides access to Redis databases. This server enables LLMs to interact with Redis key-value stores through a set of standardized tools.
Howtocook Mcp基于Anduin2017 / HowToCook (程序员在家做饭指南)的mcp server,帮你推荐菜谱、规划膳食,解决“今天吃什么“的世纪难题; Based on Anduin2017/HowToCook (Programmer's Guide to Cooking at Home), MCP Server helps you recommend recipes, plan meals, and solve the century old problem of "what to eat today"
MCP AdvisorMCP Advisor & Installation - Use the right MCP server for your needs
Amap Maps高德地图官方 MCP Server
CursorThe AI Code Editor
MiniMax MCPOfficial MiniMax Model Context Protocol (MCP) server that enables interaction with powerful Text to Speech, image generation and video generation APIs.
Playwright McpPlaywright MCP server
ChatWiseThe second fastest AI chatbot™
Jina AI MCP ToolsA Model Context Protocol (MCP) server that integrates with Jina AI Search Foundation APIs.
Tavily Mcp