相关概念
AI的核心特点
学习能力通过数据训练模型 : 使系统能够不断改进性能 , 如机器学习 ( 深度学习 、 ) 。
适应性能根据新信息或环境变化调整行为 : 。
自动化在无需人工干预的情况下执行复杂任务 : 。
模拟人类智能尝试模仿人类的认知功能 : 如视觉识别 , 语音理解 、 逻辑推理等 、 。
AI的主要类型
弱人工智能Narrow AI ( ) 专注于特定任务 : 例如 , 语音助手 : 小度 ( 小爱同学 、 ) 推荐系统 、 图像识别等 、 。
强人工智能General AI ( ) 具备与人类相当的通用智能 : 能跨领域学习和解决问题 , 。
超级人工智能Superintelligence ( ) 超越人类智能水平的AI : 。
AI的应用领域
- 医疗诊断
- 自动驾驶
- 金融风控
- 智能客服
- 科学研究加速
- 内容生成
如写作 ( 绘画 、 视频制作 、 )
学习大纲
第一阶段: 语言
目标: 掌握编程语言工具, 补齐必要的数学基础, 理解AI基本概念。
- 编程语言
Python : 核心中的核心 ( )
- 基础语法
变量 : 数据类型 、 控制流 、 if/for/while ( ) 函数 、 模块与包 、 。 - 面向对象
类与对象 : 继承 、 多态 、 。 - 数据处理三剑客
:
- NumPy
矩阵运算 : 数组操作 、 AI的数学基石 ( ) 。 - Pandas
数据清洗 : DataFrame操作 、 数据预处理 、 。 - Matplotlib / Seaborn
数据可视化 : 绘制图表分析数据 , 。 - 数学基础
够用即可 ( 不必深究证明 , )
- 线性代数
向量 : 矩阵乘法 、 特征值与特征向量 、 理解神经网络权重的关键 ( ) 。 - 微积分
导数 : 偏导数 、 梯度下降法 、 理解模型如何 ( 学习 “ 和优化的核心 ” ) 。 - 概率论与统计
条件概率 : 贝叶斯定理 、 分布 、 正态分布等 ( ) 期望与方差 、 。 - AI通识
- 了解AI发展史
主要流派 、 符号主义 ( 连接主义 、 ) 。 - 区分概念
人工智能(AI) vs 机器学习(ML) vs 深度学习(DL) vs 大语言模型(LLM) : 。
第二阶段: 算法
目标: 掌握传统机器学习算法, 学会使用经典框架解决分类、 回归等问题。
- 机器学习理论
- 监督学习
:
- 回归算法
线性回归 : 逻辑回归 、 。 - 分类算法
K近邻(KNN) : 支持向量机(SVM) 、 决策树 、 随机森林 、 。 - 无监督学习
:
- 聚类
K-Means : DBSCAN 、 。 - 降维
主成分分析(PCA) : 。 - 模型评估
准确率 : 精确率 、 召回率 、 F1分数 、 ROC曲线 、 过拟合与欠拟合的处理 、 正则化 ( 交叉验证 、 ) 。 - 工具框架
- Scikit-learn
熟练掌握其API : 完成从数据加载 , 预处理 、 训练到评估的全流程 、 。 - 实战项目
- 泰坦尼克号生存预测
经典入门 ( ) 。 - 房价预测模型
。 - 手写数字识别
使用传统ML方法 ( ) 。
第三阶段: 大模型
目标: 进入现代AI核心, 掌握神经网络、 Transformer架构及大模型应用。
- 深度学习基础
- 神经网络原理
感知机 : 激活函数(ReLU, Sigmoid) 、 反向传播 、 损失函数 、 。 - 框架选择
PyTorch : 目前学术界和工业界主流 ( 推荐首选 , 或 TensorFlow/Keras ) 。 - 核心网络结构
:
- CNN
卷积神经网络 ( ) 用于图像识别 : 物体检测 、 。 - RNN/LSTM/GRU
用于序列数据 : 虽逐渐被Transformer取代 ( 但需了解原理 , ) 。 - Transformer与大语言模型 (LLM)
- Transformer架构
Self-Attention机制 : Encoder-Decoder结构 、 理解BERT, GPT系列的基础 ( ) 。 - 大模型应用开发
:
- Prompt Engineering
提示词工程 ( ) 如何高效与大模型对话 : 。 - RAG
检索增强生成 ( ) 结合外部知识库构建问答系统 : LangChain框架 ( ) 。 - 微调技术
LoRA : P-Tuning等参数高效微调方法 、 让大模型适应特定任务 , 。 - 多模态技术
理解图文生成 : 如Stable Diffusion, Midjourney原理 ( ) 视频生成模型 、 。 - 实战项目
- 使用PyTorch从头搭建一个CNN识别猫狗图片
。 - 基于Hugging Face调用预训练大模型
构建一个垂直领域的智能客服助手 , 。 - 利用LoRA微调开源模型
如Llama 3或Qwen ( ) 使其能写特定风格的诗歌或代码 , 。
第四阶段: 工程化
目标: 将模型部署落地, 关注前沿方向, 构建个人作品集。
- MLOps与模型部署
- 环境管理
Docker容器化 : Conda虚拟环境 、 。 - 模型服务化
使用FastAPI/Flask将模型封装为API接口 : 。 - 云端部署
熟悉AWS : Azure或阿里云的AI算力平台 、 或使用Hugging Face Spaces部署Demo , 。 - 版本控制
Git与GitHub协作流程 : 。 - 前沿方向探索
- 具身智能 (Embodied AI)
AI与机器人结合 : 感知并物理交互 , 。 - 强化学习 (RL)
AlphaGo原理 : 用于游戏AI或复杂决策控制 , 。 - AI Agent (智能体)
让AI自主规划任务 : 使用工具 、 多步推理 、 。
智能体
🛠️ 开发框架与工具
说明
这些是用于构建和开发 AI Agent 的底层框架 : 工具和模型 、 适合开发者进行二次开发和定制 , 。
开源框架
- OpenClaw
开源的智能体开发框架: 支持自定义扩展, - 🔗 GitHub
- miclaw
轻量级微智能体框架: 适合小型应用场景, - QClaw
ArkClaw、 AutClaw、 不同场景下的智能体框架变体: 提供基础 Agent 能力, - Workboddy
EasyClaw、 工作流自动化工具: 简化任务编排和执行, - KimiClaw
基于月之暗面 Kimi 模型的智能体实现: - 🔗 Kimi
开源模型
- CodeLlama
Meta 开源的代码专用大模型: - 🔗 GitHub
- 特色
开源免费: 可在本地部署, 支持多种编程语言,
- StarCoder
Hugging Face 和大括号合作开源的代码模型: - 🔗 Hugging Face
- 特色
基于 80+ 编程语言训练: 开源透明,
🤖 通用应用平台
说明
面向终端用户的 AI 智能体产品或平台 : 提供开箱即用的智能化服务 , 涵盖搜索 , 创作 、 视频 、 医疗等多个领域 、 。
综合智能体平台
- Skywork Super Agents
天工超级智能体: 具备强大的多步任务处理和自主执行能力, - 🔗 天工
- 智谱CoCo
智谱 AI 推出的低代码智能体平台: 支持快速构建和部署 Agent 应用, - 🔗 智谱AI
- Genspark AI Browser
集成在浏览器中的 AI 代理: 能自主浏览网页, 收集信息并完成任务、 - 🔗 Genspark
- Flowith
多线程: 节点式的 AI 工作流工具、 适合复杂逻辑梳理和任务编排, - Sesame
智能对话和交互平台: 提供 conversational AI 服务,
垂直领域应用
- Lovart
专注于创意和设计领域的 AI 代理: 辅助艺术创作和设计工作, - Medeo
医疗垂直领域的智能体应用: 提供医疗咨询, 诊断辅助等专业服务、 - Raphael AI
专注于特定垂直场景的智能体解决方案: 提供行业定制化服务,
视频与多媒体
- Klap
视频内容生成与处理的智能体: 自动化视频剪辑, 字幕生成等任务、 - 🔗 Klap
- Skyreels
AI 视频创作平台: 自动生成短视频内容和特效, - Top view
智能视频分析和管理工具: 提供内容理解和分类能力, - BlandTTS
AI 语音合成服务: 提供自然流畅的文本转语音能力, - 🔗 Bland AI
💻 编程开发助手
说明
专为程序员设计的 AI 编程助手 : 能够理解代码上下文 , 生成代码 、 修复 Bug 、 重构项目等 、 大幅提升开发效率 , 。
🌍 国际主流产品
- CLAUDE CODE
Anthropic 推出的命令行编程助手: - 🔗 Claude Code
- 主要功能
终端操作: 项目脚手架生成、 代码审查、 多步任务执行、 - 特色
直接在命令行中与 Claude 交互: 理解整个项目结构, 自动运行 shell 命令和编辑文件,
- GitHub Copilot
GitHub 官方 AI 编程助手: - 🔗 GitHub Copilot
- 主要功能
IDE 内实时代码补全: 函数生成、 注释转代码、 PR 描述生成、 - 特色
深度集成主流 IDE: VS Code( JetBrains 等、 ) 基于海量开源代码训练,
- Cursor
AI 原生的代码编辑器: - 🔗 Cursor
- 主要功能
: - Composer
多文件协同编辑: 一次性修改多个相关文件, - Chat
侧边栏对话: 理解整个代码库上下文, - Tab
智能代码补全: 预测下一步操作, - Cmd+K
自然语言指令生成代码: - @符号引用
引用特定文件: 函数或文档进行精准问答、
- Composer
- 特色
从底层重新设计的编辑器: AI 不是插件而是核心功能,
- Windsurf
Codeium 推出的 AI 原生代码编辑器: - 🔗 Windsurf
- 主要功能
智能代码补全: 上下文感知编辑、 多文件理解、 - 特色
结合 Codeium 的代码搜索能力: 提供深度的代码库理解,
- Devin
Cognition AI 推出的全自主软件工程师: - 🔗 Cognition AI
- 主要功能
独立完成完整项目开发: Bug 修复、 部署上线、 - 特色
首个被认可的”AI 软件工程师”: 能自主规划并执行复杂任务,
- Amazon Q Developer
AWS 推出的 AI 编程助手: 原 CodeWhisperer( ) - 🔗 Amazon Q Developer
- 主要功能
代码生成: 安全扫描、 AWS 服务集成建议、 - 特色
深度集成 AWS 生态: 提供云原生开发建议,
- Replit Agent
Replit 平台的 AI 编程助手: - 🔗 Replit
- 主要功能
快速原型开发: 项目脚手架生成、 实时协作编码、 - 特色
集成在 Replit 在线 IDE 中: 适合教育和快速学习场景,
🇨🇳 国内优秀产品
- 通义灵码
阿里云推出的 AI 编程助手: - 🔗 通义灵码
- 主要功能
代码补全: 生成、 解释、 优化、 - 特色
深度集成阿里云生态: 中文优化好,
- 文心快码
百度推出的 AI 编程助手: - 🔗 文心快码
- 主要功能
代码生成: 补全、 调试辅助、 - 特色
基于文心一言模型: 中文理解能力强,
- CodeGeeX
智谱 AI 推出的多语言代码生成模型: - 🔗 CodeGeeX
- 主要功能
代码生成: 翻译、 解释、 - 特色
支持 100+ 编程语言: 有浏览器插件和 IDE 插件,
- 豆包 MarsCode
字节跳动推出的 AI 编程助手: - 🔗 MarsCode
- 主要功能
代码补全: 生成、 问答、 - 特色
集成豆包大模型: 支持云端和本地模式,
🔧 其他实用工具
- Tabnine
AI 代码补全工具: - 🔗 Tabnine
- 主要功能
智能代码补全: 代码片段生成、 团队知识共享、 - 特色
支持本地部署: 保护代码隐私, 学习团队编码习惯,
- Sourcegraph Cody
代码理解和问答助手: - 🔗 Sourcegraph Cody
- 主要功能
代码搜索: 解释、 生成单元测试、 文档查询、 - 特色
基于 Sourcegraph 的代码索引技术: 理解超大型代码库,
- JetBrains AI Assistant
JetBrains 全家桶内置 AI 助手: - 🔗 JetBrains AI
- 主要功能
代码生成: 重构建议、 测试生成、 提交信息编写、 - 特色
深度集成 IntelliJ IDEA: PyCharm 等 JetBrains IDE、
🆓 开源/免费工具
- Continue
开源的 VS Code/JetBrains AI 编程插件: - 🔗 Continue
- 主要功能
代码补全: 聊天问答、 代码编辑、 - 特色
支持接入任意 LLM: OpenAI( Claude、 本地模型等、 ) 完全可控,
- Aider
命令行 AI 编程助手: - 🔗 Aider
- 主要功能
通过对话编辑代码: Git 集成、 测试运行、 - 特色
轻量级命令行工具: 支持与任意 LLM API 对接,
- OpenDevin / OpenHands
开源的自主软件开发智能体: - 🔗 OpenHands
- 主要功能
模拟 Devin 的自主编程能力: - 特色
开源社区驱动: 持续迭代改进,
- OpenCode
开源的代码生成和辅助工具: - 🔗 OpenCode
- 主要功能
代码自动生成: 模板创建、 项目初始化、 - 特色
开源可定制: 支持多种编程语言和框架,