What【项目定位】

  • OpenAkita 是一款开源的一站式 AI 助手,区别于仅提供对话功能的传统 AI 工具,其核心定位是“可落地执行任务的多智能体协作系统”。它通过多 AI 智能体协同工作,覆盖从任务拆解、跨工具执行到多端响应的全流程,旨在为个人和团队提供“能把事情做完”的 AI 解决方案,而非仅停留在对话交互层面。

  • 该项目面向有高效任务处理、跨场景 AI 应用需求的用户(个人开发者、企业团队等),支持 Windows/macOS/Linux 多系统,且全程无需命令行操作,5 分钟即可完成可视化部署,降低了 AI 工具的使用门槛。

 

What【整体架构】

OpenAkita 围绕“多智能体协作 + 任务执行 + 多端适配”核心设计,整体架构可分为四层:

1. 交互层(Multi-Platform Access)

对接 6 类主流即时通讯(IM)平台(Telegram / Slack / 钉钉 / 飞书 / QQ / OneBot),同时支持桌面端、Web 端、移动端访问,实现“在日常聊天工具中调用 AI”的轻量化交互;此外提供语音识别、智能群聊等能力,适配不同交互场景。

 

2. 核心引擎层

  • 多智能体协作引擎:具备专业技能的智能体并行工作,支持任务自动拆解、跨智能体交接、故障自动切换,搭配实时可视化仪表盘监控协作状态;

  • ReAct 推理引擎:遵循“思考→行动→观察”三阶推理逻辑,内置检查点/回滚机制,任务失败时自动切换策略重试;

  • 计划模式引擎:将复杂任务自动分解为分步计划,支持实时进度追踪、失败自动回滚,UI 层提供浮动进度条可视化任务状态;

  • 长效记忆引擎:三层记忆体系(工作记忆 + 核心记忆 + 动态检索),结合 AI 提取技术,持久化记忆用户偏好、使用习惯、任务历史。

 

3. 工具与能力层

  • 内置工具集:覆盖 16 大类、89+ 实用工具,包括网页搜索、桌面自动化、文件管理、浏览器自动化、定时任务、MCP 扩展等,实现“AI 直接操作执行”;

  • 技能市场:支持技能检索/一键安装、从 GitHub 直接安装、AI 实时生成新技能,扩展工具能力边界;

  • LLM 适配层:兼容 30+ 大模型服务商(DeepSeek / 通义千问 / Kimi / Claude / GPT / Gemini 等),具备智能故障切换能力,某一服务商不可用时自动切换至备选模型。

 

4. 部署与配置层

  • 全 GUI 化配置中心,提供引导式安装向导,无需命令行操作;支持跨系统(Windows/macOS/Linux)打包部署,通过版本化管理(GitHub Releases)提供标准化安装包。

 

What【核心技术栈】

1. 开发语言与基础框架

  • 核心开发语言:Python 3.11+(项目标注最低兼容 3.11 版本);

  • 构建配置:使用 pyproject.toml 管理项目依赖,requirements.txt 定义基础依赖项;

  • 工程化:基于 GitHub Actions 实现 CI/CD 自动化构建,遵循 Apache 2.0 开源协议。

 

2. 关键技术组件

  • 智能体协作:基于多进程/多线程的并行任务调度框架,实现智能体间的任务分发与状态同步;

  • 推理与记忆:ReAct 推理范式落地实现、向量数据库(或结构化存储)支撑长效记忆检索;

  • 工具集成:桌面自动化(如 PyAutoGUI)、浏览器自动化(如 Selenium/Playwright)、IM 平台 API 对接封装;

  • 可视化:GUI 配置界面(推测基于 PyQt/Tkinter 或 Electron 跨端框架)、实时仪表盘前端组件;

  • 故障容错:LLM 服务商健康检测、智能切换策略、任务执行回滚机制。

 

3. 工程结构(基于代码库目录)

openakita/                  
├── .github/          # GitHub 配置(CI/CD 工作流、PR/ISSUE 模板) 
├── apps/             # 应用层(如配置中心)                  
├── auth_api/         # 认证相关 API                  
├── channels/         # IM 渠道对接层                  
├── cloud/            # 云端能力适配                  
├── data/             # 数据存储(记忆、任务记录等)               
├── docs/             # 文档与静态资源(logo、资产)               
├── examples/         # 使用示例                  
├── identity/         # 身份与 persona 管理(8 类预设角色)        
├── mcps/             # MCP 扩展能力                  
├── plugins/          # 插件/工具扩展                  
├── prompts/          # 大模型提示词工程                  
├── research/         # 研发相关(算法/策略验证)                  
├── scripts/          # 辅助脚本                  
├── skills/           # 技能市场核心代码                  
├── specs/            # 规格与协议定义                  
├── src/              # 核心源码                  
├── tests/            # 测试用例                  
├── tools/            # 内置工具实现                  
└── 配置文件          # pyproject.toml、requirements.txt 等

 

Why use【核心功能与应用场景】

1. 核心功能清单

功能分类

具体能力

多智能体协作

专业智能体并行工作、自动任务交接、故障切换、实时可视化仪表盘

任务计划

自动任务拆解、分步进度追踪、失败回滚、UI 进度可视化

推理执行

ReAct 三阶推理、检查点/回滚、循环检测、策略自动切换

工具能力

89+ 内置工具(文件/桌面/浏览器/搜索/定时等)、技能市场扩展

大模型适配

30+ LLM 服务商、智能故障切换

多端交互

6 类 IM 平台对接、桌面/Web/移动端、语音识别、智能群聊

记忆能力

三层记忆体系、7 类记忆类型、AI 驱动的记忆提取/回顾

角色定制

8 类预设 persona(技术专家/伴侣/Jarvis/管家/商务/家庭等)

主动交互

智能问候、任务跟进、闲聊天、晚安提醒等,根据用户反馈适配交互频率

 

2. 典型应用场景

  • 个人效率提升:通过 AI 自动整理文件、执行定时任务、浏览器自动化完成网页操作、跨平台快速检索信息;

  • 团队协作:在飞书/钉钉群中调用多智能体,“一句话触发”—— 编码智能体写代码、写作智能体写文档、测试智能体验证,并行完成团队任务;

  • 跨场景任务执行:例如“生成一份产品周报”,AI 自动拆解为“网页搜索行业数据→桌面调取本地销售表格→写作智能体整合内容→文件保存并发送至钉钉群”全流程;

  • 个性化服务:基于长效记忆,AI 适配用户沟通风格(如商务/生活化),长期提供符合用户习惯的定制化响应。

 

How to【安装部署】

OpenAkita 主打“5 分钟零命令行部署”,核心部署方式为可视化安装,具体步骤如下:

1. 环境要求

  • 操作系统:Windows / macOS / Linux(均提供对应安装包);

  • 依赖:Python 3.11+(若手动部署需提前安装,可视化安装包已内置);

  • 网络:可访问 GitHub(下载安装包)、对应 LLM 服务商 API(需配置 API Key)。

 

2. 可视化一键部署(推荐)

  • 下载安装包:访问 GitHub Releases,选择对应系统的安装包(Windows 为 exe、macOS 为 dmg、Linux 为 deb/rpm);

  • 安装向导:双击安装包,跟随 GUI 引导完成安装,全程无需命令行操作;

  • 初始化配置:安装完成后启动程序,在引导页输入 LLM 服务商的 API Key(支持多服务商配置);

  • 启用交互渠道:在配置界面选择需要对接的 IM 平台(如钉钉/飞书),完成平台授权后,即可在对应聊天工具中调用 AI;

  • 启动使用:配置完成后,直接在桌面端/IM 工具中发送指令,即可触发多智能体协作执行任务。

 

3. 手动部署(开发者/定制化场景)

  • 克隆代码库:

git clone https://github.com/openakita/openakita.git         
cd openakita

  • 安装依赖:

pip install -r requirements.txt

  • 配置环境:通过 apps/setup-center/ 下的 GUI 配置工具,完成 LLM API Key、IM 渠道、工具权限等配置;

  • 启动核心服务:

python src/main.py

  • 验证部署:访问本地 Web 界面或在配置的 IM 平台发送测试指令,确认多智能体、工具调用功能正常。

 

Why【总结】

  • OpenAkita 突破了传统对话式 AI 的边界,以“多智能体协作 + 落地执行 + 多端适配”为核心,将 AI 从“聊天工具”升级为“能完成复杂任务的协作团队”。其零门槛的可视化部署、丰富的工具集、灵活的多端交互能力,使其适配个人效率提升、团队协作等多场景,是一款兼顾易用性与功能性的开源 AI 助手解决方案。

 

* 官方代码仓库:https://github.com/openakita/openakita