🖼️ 利用编码器和模型进行音乐和图像理解,用户可编辑音乐、调整乐器和速度。
迪士尼旧版米老鼠版权过期,AI开发者推出基于Stable-Diffusion-xl的Mickey-1928SD模型,用于生成符合1928年设计风格的米老鼠、米妮和皮特的图像。
2024年将是AI视频之年@英伟达高级科学家 Jim Fan
悉尼科技大学的科研人员,通过大语言模型、EEG(大脑活动检测工具)、脑机接口等技术,开发了一个可自动读取人类想法,并转化成文本的AI大模型——DeWave。
研究团队提出了一种考虑遮挡的场景参数化方法,将整个场景分解为遮挡、人物和背景三个部分。此外,我们设计了广泛的客观函数,以帮助强化人物与遮挡、背景的分离,并确保对人物模型的完整性。我们通过在野外视频上进行实验证明了我们方法的有效性。