关注并星标
从此不迷路
公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式
计算机视觉研究院专栏
作者:Edison_G
本周论文包括2D 图像脑补 3D 人体;亚马逊发布超越 GPT 3.5 的小模型等研究。 
转自《机器之心》
- 
Structure and Content-Guided Video Synthesis with Diffusion Models 
 - 
EVA3D: Compositional 3D Human Generation from 2D Image Collections 
 - 
Multimodal Chain-of-Thought Reasoning in Language Models 
 - 
Is ChatGPT a General-Purpose Natural Language Processing Task Solver? 
 - 
Toolformer: Language Models Can Teach Themselves to Use Tools 
 - 
Looped Transformers as Programmable Computers 
 - 
AudioLDM: Text-to-Audio Generation with Latent Diffusion Models 
 
- 
作者:Patrick Esser 、 Johnathan Chiu 等 
 - 
论文地址:https://arxiv.org/pdf/2302.03011.pdf 
 
- 
作者:Fangzhou Hong 等 
 - 
论文地址:https://arxiv.org/abs/2210.04888 
 
- 
作者:Zhuosheng Zhang 等 
 - 
论文地址:https://arxiv.org/abs/2302.00923 
 
- 
作者:Chengwei Qin 等 
 - 
论文地址:https://arxiv.org/pdf/2302.06476.pdf 
 
- 
作者:Timo Schick 等 
 - 
论文地址:https://arxiv.org/pdf/2302.04761v1.pdf 
 
- 
作者:Angeliki Giannou 等 
 - 
论文地址:https://arxiv.org/pdf/2301.13196.pdf 
 
- 
作者:Haohe Liu 等 
 - 
论文地址:https://arxiv.org/abs/2301.12503 
 
转载请联系本公众号获得授权
计算机视觉研究院学习群等你加入!
扫码关注
计算机视觉研究院
公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式
往期推荐
🔗
本文来自微信公众号“计算机视觉研究院”(ID:ComputerVisionGzq)。大作社经授权转载,该文观点仅代表作者本人,大作社平台仅提供信息存储空间服务。

    
        








