【AI动画技术研究】日志更新(271)

2024-2-27 15:21 (+0)
今日工作总结 1. 了解python中的协程Coroutine,学习Coroutine的基本语法, yeild/send型协程和await/async def等,特别是和与多线程的区别,顺带复习了multi-processing, multi-threading之间的联系 ... (more)

【AI动画技术研究】日志更新(270)

2024-2-26 15:40 (+0)
今日工作总结 1. 昨日的SVD视频生成的测试结果简单做了一个记录,见链接: https://www.bilibili.com/read/cv32048081/ 2. Mistral, LLama2, Qwen, InternLM, deci, chatGLM等LLM的本地部署。对 ... (more)

【AI动画技术研究】日志更新(269)

2024-2-26 05:03 (+0)
今日工作总结 1. Stability近期released了SVD1.1,去初步测试了一下视频生成的效果。明天简单地写一个测试结果。 (more)

【AI动画技术研究】日志更新(268)

2024-2-25 02:30 (+0)
今日工作总结 1. 完成了字幕模块的代码部署和性能测试,测试了几个比较热门的repo,最后选择了准确率最高但是速度最慢的那个。 2. 完成了两个SOTA LLMs的部署和性能测试。这算是目前为止遇到的最 ... (more)

【AI动画技术研究】日志更新(267)

2024-2-23 14:47 (+0)
今日工作总结 1. 阅读论文LAVE: LLM-Powered Agent Assistance and Language Augmentation for Video Editing. 这篇的论文概念上有意思的,使用AI完成视频的自动剪辑。阅读论文后发现这篇的思路 ... (more)

【AI动画技术研究】日志更新(266)

2024-2-22 14:33 (+0)
今日工作总结 今天肚子有点疼,每个月总有那么一两天(男娘发言) 1. 了解最近的LLM模型。看了Llama2,这个需要申请token,不知道部署后效果如何。查看了ChatGPT的API接口,以及tansformer开放的模型,需要 ... (more)

【AI动画技术研究】日志更新(265)

2024-2-21 15:39 (+0)
今日工作总结 1. 阅读论文Control Color: Multimodal Diffusion-based Interactive Image Colorization. 上周五S-Lab新放出的一篇文章,和之前喵喵发的那篇[1](还没读)有一点像,做的都是自然图像的 ... (more)

【AI动画技术研究】日志更新(264)

2024-2-20 16:02 (+0)
今日工作总结 1. 阅读Stable Cascade的论文Wuerstchen: An Efficient Architecture for Large-Scale Text-to-Image Diffusion Models。 根据github项目的描述,这篇论文的核心思想是将LDM的Late ... (more)

【AI动画技术研究】日志更新(263)

2024-2-19 16:34 (+0)
今天摸鱼,明天正式回归工作! 最近堆了一些论文和想尝试看看的新技术,OpenAI和Sora发布后很多东西也需要重新思考。最近这几天因为放假的缘故不在状态,果然还是不适合过节... 近期工作安排 (1) 清空 ... (more)

【AI动画技术研究】日志更新(262)

2024-2-18 16:06 (+0)
今日工作总结 1. 阅读论文MM-ReAct MM-ReAct: Prompting ChatGPT for Multimodal Reasoning and Action 这篇论文提出了一种利用ChatGPT做多模态理解的pipeline,能够利用ChatGPT将用户quest转化 ... (more)