![Gemini_Generated_Image_7jkgrj7jkgrj7jkg.png](/static/img/1d4d5f8a9a2344a72ab0a4cace77c98d.Gemini_Generated_Image_7jkgrj7jkgrj7jkg.webp)

这篇是 2026 年的 AI 学习杂记，不追求一次写完。平时对对话、工具链、本地模型和写作方式有新理解，就往这里补一点，慢慢攒成自己的路线图。



### 📂 2026 个人 AI 学习笔记

#### 1. 核心大模型 (LLM) - AI 的大脑

> *这是所有应用的基础，记录对话、写作、逻辑推理的心得。*

* **在线平台 (闭源/商业)**
* ChatGPT (OpenAI) / Claude (Anthropic) / Gemini (Google)
* Grok (xAI) 


* **本地部署 (开源/隐私)**

* **Qwen (通义千问)** 
* Llama 系列 / Mistral
* **部署工具：** Ollama / LM Studio / vLLM



#### 2. AI 绘图 (Image Gen) - 视觉创意

* **在线平台**
* Midjourney - *艺术性标杆*
* DALL-E 3 / Imagen
* Nova ai


* **本地部署**
* Stable Diffusion (WebUI / **ComfyUI**) - *ComfyUI 是进阶必修*
* Flux 系列 - *如果是2026年的主流开源模型*


#### 3. AI 视频 (Video Gen) - 动态影像


* **文生视频 / 图生视频**
* **Sora** (OpenAI)
* **Grok** (xAI) - *备注：尺度与创意方向*
* Runway Gen 系列 / Pika / Luma Dream Machine


* **视频转绘/风格化 (Video-to-Video)**
* **Senddance 2.0** - *你提到的工具，专注于舞蹈/动作迁移？*
* Domod (本地重绘流程)



#### 4. AI 音频 (Audio & TTS) - 听觉交互


* **语音合成 (TTS - Text to Speech)**
* **在线：** ElevenLabs (拟真度标杆) / OpenAI Voice
* **本地：**
* GPT-SoVITS - *少量样本克隆，效果极佳*
* CosyVoice / ChatTTS


* **音乐与音效生成 (Music Gen)**
* Suno / Udio - *生成完整歌曲*
* Stable Audio - *生成背景音效*



#### 5. AI 编程与辅助开发 (Coding)


* **IDE 插件：** Cursor / GitHub Copilot
* **辅助构建：** 用 AI 写 Python 脚本处理 Excel、批量重命名文件等。

#### 6. AI Agent 与 自动化工作流 (Workflow)

* **RAG (知识库)：** 怎么把个人文档喂给 AI？(AnythingLLM / Dify)
* **自动化：** Coze (扣子) / Dify - *搭建自己的 AI 机器人*

#### 7. 硬件与环境配置 (Infrastructure)

* **硬件记录：** 显卡(GPU)性能测试、Mac/Win 兼容性对比、NAS 部署心得。
* **环境搭建：** Python 环境管理 (Conda)、Docker 容器化部署 AI 服务。

【长期更新】2026年AI学习笔记

首页

按标签

目录

📂 2026 个人 AI 学习笔记

1. 核心大模型 (LLM) - AI 的大脑

2. AI 绘图 (Image Gen) - 视觉创意

3. AI 视频 (Video Gen) - 动态影像

4. AI 音频 (Audio & TTS) - 听觉交互

5. AI 编程与辅助开发 (Coding)

6. AI Agent 与自动化工作流 (Workflow)

7. 硬件与环境配置 (Infrastructure)

目录