- 本集音频在小宇宙首发于2024-4-17,请留意内容时效性。
- 文字整理稿请见站内
这是一期录完就打脸的播客?!
1张参考图让AI听懂“我想要的风格”,IP Adapter是一份送给AI造梦者的礼物。全球贡献者太活跃,连作者想沉寂都被打脸,总被社区的更新折服,IP Adapter也是一份全球开发者带着爱的礼物。
这个项目真的是一个人肝出来的吗?它为什么是艺术家阿文的心头好,甚至带它上了春晚?本期继续延续技术+创作的双视角对话,讲述了这个开源走向全世界的故事。

本期人物
- 叶虎:IP Adapter作者,腾讯AI算法工程师
- 阿文:AbleSlide创始人、PPT设计师,AIGC/Blender知名KOL
- 宙宙Jo:建设Diffuseum中,前AI投资,热爱生成式图像和开源
时间线
- 00:51: 叶虎的个人背景与研究兴趣
- 04:23 阿文的如何作为设计师,将diffusion用于自己的工作流
- 06:30 开发者和设计师各自理解的IP Adapter
- 09:18 本项目开发的出发点和3个阶段
- 16:34 阿文如何从开源社区里关注到了这个项目
- 23:26 社区的有趣应用案例
- 25:23 阿文作为设计师的使用体验
- 27:20 IP Adapter的开发团队、开源初衷、训练成本
- 32:40 AI视频的未来工作流,端到端 vs 组件化?
- 41:11 过去一年Diffusion领域最重要的时刻
- 51:41 对未来6-12个月的期待:Sora?SD3?
- 56:04 对开源与商业的平衡的讨论
相关链接
- IP Adapter:https://github.com/tencent-ailab/IP-Adapter
- Simon阿文:https://weibo.com/n/Simon_阿文
- Disco Diffusion:https://github.com/alembics/disco-diffusion
- MidJourney Image Prompts:https://docs.midjourney.com/docs/image-prompts
- IP Adapter ComfyUI插件和新节点的知名开发者Matteo Spinellie(cubiq):https://github.com/cubiq
- 创作者Karen用IP Adapter制作的折纸动画:https://twitter.com/karenxcheng/status/1760353191538172133
- 社区大神Inner Reflections:https://twitter.com/InnerRefle11312
- 阿文和海辛的春晚视频案例:https://mp.weixin.qq.com/s/uU3W8wA0AtoazJTgxmcNmg
- X上最新的IP Adapter案例:https://twitter.com/search?q=IPadapter&src=recent_search_click&f=live
联系我们
Diffuseum 是一个对生成式图像、开源人工智能感兴趣的社区,这档播客记录我们关注的一线开发者的故事。
- X: jojodecayz
- WeChat: Jozhangsh
- 公众号:Latent Cat
- https://latentbox.com/en/diffuseum