相关概念

AI的核心特点


学习能力通过数据训练模型使系统能够不断改进性能如机器学习深度学习
适应性能根据新信息或环境变化调整行为
自动化在无需人工干预的情况下执行复杂任务
模拟人类智能尝试模仿人类的认知功能如视觉识别语音理解逻辑推理等

AI的主要类型


弱人工智能Narrow AI专注于特定任务例如语音助手小度小爱同学推荐系统图像识别等
强人工智能General AI具备与人类相当的通用智能能跨领域学习和解决问题
超级人工智能Superintelligence超越人类智能水平的AI

AI的应用领域

  • 医疗诊断
  • 自动驾驶
  • 金融风控
  • 智能客服
  • 科学研究加速
  • 内容生成如写作绘画视频制作

学习大纲

第一阶段语言

目标掌握编程语言工具补齐必要的数学基础理解AI基本概念

  1. 编程语言Python核心中的核心
    • 基础语法变量数据类型控制流if/for/while函数模块与包
    • 面向对象类与对象继承多态
    • 数据处理三剑客
      • NumPy矩阵运算数组操作AI的数学基石
      • Pandas数据清洗DataFrame操作数据预处理
      • Matplotlib / Seaborn数据可视化绘制图表分析数据
  2. 数学基础够用即可不必深究证明
    • 线性代数向量矩阵乘法特征值与特征向量理解神经网络权重的关键
    • 微积分导数偏导数梯度下降法理解模型如何学习和优化的核心
    • 概率论与统计条件概率贝叶斯定理分布正态分布等期望与方差
  3. AI通识
    • 了解AI发展史主要流派符号主义连接主义
    • 区分概念人工智能(AI) vs 机器学习(ML) vs 深度学习(DL) vs 大语言模型(LLM)

第二阶段算法

目标掌握传统机器学习算法学会使用经典框架解决分类回归等问题

  1. 机器学习理论
    • 监督学习
      • 回归算法线性回归逻辑回归
      • 分类算法K近邻(KNN)支持向量机(SVM)决策树随机森林
    • 无监督学习
      • 聚类K-MeansDBSCAN
      • 降维主成分分析(PCA)
      • 模型评估准确率精确率召回率F1分数ROC曲线过拟合与欠拟合的处理正则化交叉验证
  2. 工具框架
    • Scikit-learn熟练掌握其API完成从数据加载预处理训练到评估的全流程
  3. 实战项目
    • 泰坦尼克号生存预测经典入门
    • 房价预测模型
    • 手写数字识别使用传统ML方法

第三阶段大模型

目标进入现代AI核心掌握神经网络Transformer架构及大模型应用

  1. 深度学习基础
    • 神经网络原理感知机激活函数(ReLU, Sigmoid)反向传播损失函数
    • 框架选择PyTorch目前学术界和工业界主流推荐首选或 TensorFlow/Keras
    • 核心网络结构
      • CNN卷积神经网络用于图像识别物体检测
      • RNN/LSTM/GRU用于序列数据虽逐渐被Transformer取代但需了解原理
  2. Transformer与大语言模型 (LLM)
    • Transformer架构Self-Attention机制Encoder-Decoder结构理解BERT, GPT系列的基础
    • 大模型应用开发
      • Prompt Engineering提示词工程如何高效与大模型对话
      • RAG检索增强生成结合外部知识库构建问答系统LangChain框架
      • 微调技术LoRAP-Tuning等参数高效微调方法让大模型适应特定任务
      • 多模态技术理解图文生成如Stable Diffusion, Midjourney原理视频生成模型
  3. 实战项目
    • 使用PyTorch从头搭建一个CNN识别猫狗图片
    • 基于Hugging Face调用预训练大模型构建一个垂直领域的智能客服助手
    • 利用LoRA微调开源模型如Llama 3或Qwen使其能写特定风格的诗歌或代码

第四阶段工程化

目标将模型部署落地关注前沿方向构建个人作品集

  1. MLOps与模型部署
    • 环境管理Docker容器化Conda虚拟环境
    • 模型服务化使用FastAPI/Flask将模型封装为API接口
    • 云端部署熟悉AWSAzure或阿里云的AI算力平台或使用Hugging Face Spaces部署Demo
    • 版本控制Git与GitHub协作流程
  2. 前沿方向探索
    • 具身智能 (Embodied AI)AI与机器人结合感知并物理交互
    • 强化学习 (RL)AlphaGo原理用于游戏AI或复杂决策控制
    • AI Agent (智能体)让AI自主规划任务使用工具多步推理

智能体

🛠️ 开发框架与工具

说明这些是用于构建和开发 AI Agent 的底层框架工具和模型适合开发者进行二次开发和定制

开源框架

  1. OpenClaw开源的智能体开发框架支持自定义扩展
  2. miclaw轻量级微智能体框架适合小型应用场景
  3. QClawArkClawAutClaw不同场景下的智能体框架变体提供基础 Agent 能力
  4. WorkboddyEasyClaw工作流自动化工具简化任务编排和执行
  5. KimiClaw基于月之暗面 Kimi 模型的智能体实现

开源模型

  1. CodeLlamaMeta 开源的代码专用大模型
    • 🔗 GitHub
    • 特色开源免费可在本地部署支持多种编程语言
  2. StarCoderHugging Face 和大括号合作开源的代码模型
    • 🔗 Hugging Face
    • 特色基于 80+ 编程语言训练开源透明

🤖 通用应用平台

说明面向终端用户的 AI 智能体产品或平台提供开箱即用的智能化服务涵盖搜索创作视频医疗等多个领域

综合智能体平台

  1. Skywork Super Agents天工超级智能体具备强大的多步任务处理和自主执行能力
  2. 智谱CoCo智谱 AI 推出的低代码智能体平台支持快速构建和部署 Agent 应用
  3. Genspark AI Browser集成在浏览器中的 AI 代理能自主浏览网页收集信息并完成任务
  4. Flowith多线程节点式的 AI 工作流工具适合复杂逻辑梳理和任务编排
  5. Sesame智能对话和交互平台提供 conversational AI 服务

垂直领域应用

  1. Lovart专注于创意和设计领域的 AI 代理辅助艺术创作和设计工作
  2. Medeo医疗垂直领域的智能体应用提供医疗咨询诊断辅助等专业服务
  3. Raphael AI专注于特定垂直场景的智能体解决方案提供行业定制化服务

视频与多媒体

  1. Klap视频内容生成与处理的智能体自动化视频剪辑字幕生成等任务
  2. SkyreelsAI 视频创作平台自动生成短视频内容和特效
  3. Top view智能视频分析和管理工具提供内容理解和分类能力
  4. BlandTTSAI 语音合成服务提供自然流畅的文本转语音能力

💻 编程开发助手

说明专为程序员设计的 AI 编程助手能够理解代码上下文生成代码修复 Bug重构项目等大幅提升开发效率

🌍 国际主流产品

  1. CLAUDE CODEAnthropic 推出的命令行编程助手
    • 🔗 Claude Code
    • 主要功能终端操作项目脚手架生成代码审查多步任务执行
    • 特色直接在命令行中与 Claude 交互理解整个项目结构自动运行 shell 命令和编辑文件
  2. GitHub CopilotGitHub 官方 AI 编程助手
    • 🔗 GitHub Copilot
    • 主要功能IDE 内实时代码补全函数生成注释转代码PR 描述生成
    • 特色深度集成主流 IDEVS CodeJetBrains 等基于海量开源代码训练
  3. CursorAI 原生的代码编辑器
    • 🔗 Cursor
    • 主要功能
      • Composer多文件协同编辑一次性修改多个相关文件
      • Chat侧边栏对话理解整个代码库上下文
      • Tab智能代码补全预测下一步操作
      • Cmd+K自然语言指令生成代码
      • @符号引用引用特定文件函数或文档进行精准问答
    • 特色从底层重新设计的编辑器AI 不是插件而是核心功能
  4. WindsurfCodeium 推出的 AI 原生代码编辑器
    • 🔗 Windsurf
    • 主要功能智能代码补全上下文感知编辑多文件理解
    • 特色结合 Codeium 的代码搜索能力提供深度的代码库理解
  5. DevinCognition AI 推出的全自主软件工程师
    • 🔗 Cognition AI
    • 主要功能独立完成完整项目开发Bug 修复部署上线
    • 特色首个被认可的”AI 软件工程师”能自主规划并执行复杂任务
  6. Amazon Q DeveloperAWS 推出的 AI 编程助手原 CodeWhisperer
    • 🔗 Amazon Q Developer
    • 主要功能代码生成安全扫描AWS 服务集成建议
    • 特色深度集成 AWS 生态提供云原生开发建议
  7. Replit AgentReplit 平台的 AI 编程助手
    • 🔗 Replit
    • 主要功能快速原型开发项目脚手架生成实时协作编码
    • 特色集成在 Replit 在线 IDE 中适合教育和快速学习场景

🇨🇳 国内优秀产品

  1. 通义灵码阿里云推出的 AI 编程助手
    • 🔗 通义灵码
    • 主要功能代码补全生成解释优化
    • 特色深度集成阿里云生态中文优化好
  2. 文心快码百度推出的 AI 编程助手
    • 🔗 文心快码
    • 主要功能代码生成补全调试辅助
    • 特色基于文心一言模型中文理解能力强
  3. CodeGeeX智谱 AI 推出的多语言代码生成模型
    • 🔗 CodeGeeX
    • 主要功能代码生成翻译解释
    • 特色支持 100+ 编程语言有浏览器插件和 IDE 插件
  4. 豆包 MarsCode字节跳动推出的 AI 编程助手
    • 🔗 MarsCode
    • 主要功能代码补全生成问答
    • 特色集成豆包大模型支持云端和本地模式

🔧 其他实用工具

  1. TabnineAI 代码补全工具
    • 🔗 Tabnine
    • 主要功能智能代码补全代码片段生成团队知识共享
    • 特色支持本地部署保护代码隐私学习团队编码习惯
  2. Sourcegraph Cody代码理解和问答助手
    • 🔗 Sourcegraph Cody
    • 主要功能代码搜索解释生成单元测试文档查询
    • 特色基于 Sourcegraph 的代码索引技术理解超大型代码库
  3. JetBrains AI AssistantJetBrains 全家桶内置 AI 助手
    • 🔗 JetBrains AI
    • 主要功能代码生成重构建议测试生成提交信息编写
    • 特色深度集成 IntelliJ IDEAPyCharm 等 JetBrains IDE

🆓 开源/免费工具

  1. Continue开源的 VS Code/JetBrains AI 编程插件
    • 🔗 Continue
    • 主要功能代码补全聊天问答代码编辑
    • 特色支持接入任意 LLMOpenAIClaude本地模型等完全可控
  2. Aider命令行 AI 编程助手
    • 🔗 Aider
    • 主要功能通过对话编辑代码Git 集成测试运行
    • 特色轻量级命令行工具支持与任意 LLM API 对接
  3. OpenDevin / OpenHands开源的自主软件开发智能体
    • 🔗 OpenHands
    • 主要功能模拟 Devin 的自主编程能力
    • 特色开源社区驱动持续迭代改进
  4. OpenCode开源的代码生成和辅助工具
    • 🔗 OpenCode
    • 主要功能代码自动生成模板创建项目初始化
    • 特色开源可定制支持多种编程语言和框架