编辑
2026-02-10
技术漫谈
00

目录

📂 2026 个人 AI 学习笔记
1. 核心大模型 (LLM) - AI 的大脑
2. AI 绘图 (Image Gen) - 视觉创意
3. AI 视频 (Video Gen) - 动态影像
4. AI 音频 (Audio & TTS) - 听觉交互
5. AI 编程与辅助开发 (Coding)
6. AI Agent 与 自动化工作流 (Workflow)
7. 硬件与环境配置 (Infrastructure)

Gemini_Generated_Image_7jkgrj7jkgrj7jkg.png

📂 2026 个人 AI 学习笔记

1. 核心大模型 (LLM) - AI 的大脑

这是所有应用的基础,记录对话、写作、逻辑推理的心得。

  • 在线平台 (闭源/商业)

  • ChatGPT (OpenAI) / Claude (Anthropic) / Gemini (Google)

  • Grok (xAI)

  • 本地部署 (开源/隐私)

  • Qwen (通义千问)

  • Llama 系列 / Mistral

  • 部署工具: Ollama / LM Studio / vLLM

2. AI 绘图 (Image Gen) - 视觉创意

  • 在线平台

  • Midjourney - 艺术性标杆

  • DALL-E 3 / Imagen

  • Nova ai

  • 本地部署

  • Stable Diffusion (WebUI / ComfyUI) - ComfyUI 是进阶必修

  • Flux 系列 - 如果是2026年的主流开源模型

3. AI 视频 (Video Gen) - 动态影像

  • 文生视频 / 图生视频

  • Sora (OpenAI)

  • Grok (xAI) - 备注:尺度与创意方向

  • Runway Gen 系列 / Pika / Luma Dream Machine

  • 视频转绘/风格化 (Video-to-Video)

  • Senddance 2.0 - 你提到的工具,专注于舞蹈/动作迁移?

  • Domod (本地重绘流程)

4. AI 音频 (Audio & TTS) - 听觉交互

  • 语音合成 (TTS - Text to Speech)

  • 在线: ElevenLabs (拟真度标杆) / OpenAI Voice

  • 本地:

  • GPT-SoVITS - 少量样本克隆,效果极佳

  • CosyVoice / ChatTTS

  • 音乐与音效生成 (Music Gen)

  • Suno / Udio - 生成完整歌曲

  • Stable Audio - 生成背景音效

5. AI 编程与辅助开发 (Coding)

  • IDE 插件: Cursor / GitHub Copilot
  • 辅助构建: 用 AI 写 Python 脚本处理 Excel、批量重命名文件等。

6. AI Agent 与 自动化工作流 (Workflow)

  • RAG (知识库): 怎么把个人文档喂给 AI?(AnythingLLM / Dify)
  • 自动化: Coze (扣子) / Dify - 搭建自己的 AI 机器人

7. 硬件与环境配置 (Infrastructure)

  • 硬件记录: 显卡(GPU)性能测试、Mac/Win 兼容性对比、NAS 部署心得。
  • 环境搭建: Python 环境管理 (Conda)、Docker 容器化部署 AI 服务。

本文作者:小转圈

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!