
这是所有应用的基础,记录对话、写作、逻辑推理的心得。
在线平台 (闭源/商业)
ChatGPT (OpenAI) / Claude (Anthropic) / Gemini (Google)
Grok (xAI)
本地部署 (开源/隐私)
Qwen (通义千问)
Llama 系列 / Mistral
部署工具: Ollama / LM Studio / vLLM
在线平台
Midjourney - 艺术性标杆
DALL-E 3 / Imagen
Nova ai
本地部署
Stable Diffusion (WebUI / ComfyUI) - ComfyUI 是进阶必修
Flux 系列 - 如果是2026年的主流开源模型
文生视频 / 图生视频
Sora (OpenAI)
Grok (xAI) - 备注:尺度与创意方向
Runway Gen 系列 / Pika / Luma Dream Machine
视频转绘/风格化 (Video-to-Video)
Senddance 2.0 - 你提到的工具,专注于舞蹈/动作迁移?
Domod (本地重绘流程)
语音合成 (TTS - Text to Speech)
在线: ElevenLabs (拟真度标杆) / OpenAI Voice
本地:
GPT-SoVITS - 少量样本克隆,效果极佳
CosyVoice / ChatTTS
音乐与音效生成 (Music Gen)
Suno / Udio - 生成完整歌曲
Stable Audio - 生成背景音效
本文作者:小转圈
本文链接:
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!