关注并星标
从此不迷路
公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式
计算机视觉研究院专栏
作者:Edison_G
本周论文包括2D 图像脑补 3D 人体;亚马逊发布超越 GPT 3.5 的小模型等研究。
转自《机器之心》
-
Structure and Content-Guided Video Synthesis with Diffusion Models
-
EVA3D: Compositional 3D Human Generation from 2D Image Collections
-
Multimodal Chain-of-Thought Reasoning in Language Models
-
Is ChatGPT a General-Purpose Natural Language Processing Task Solver?
-
Toolformer: Language Models Can Teach Themselves to Use Tools
-
Looped Transformers as Programmable Computers
-
AudioLDM: Text-to-Audio Generation with Latent Diffusion Models
-
作者:Patrick Esser 、 Johnathan Chiu 等
-
论文地址:https://arxiv.org/pdf/2302.03011.pdf
-
作者:Fangzhou Hong 等
-
论文地址:https://arxiv.org/abs/2210.04888
-
作者:Zhuosheng Zhang 等
-
论文地址:https://arxiv.org/abs/2302.00923
-
作者:Chengwei Qin 等
-
论文地址:https://arxiv.org/pdf/2302.06476.pdf
-
作者:Timo Schick 等
-
论文地址:https://arxiv.org/pdf/2302.04761v1.pdf
-
作者:Angeliki Giannou 等
-
论文地址:https://arxiv.org/pdf/2301.13196.pdf
-
作者:Haohe Liu 等
-
论文地址:https://arxiv.org/abs/2301.12503
转载请联系本公众号获得授权
计算机视觉研究院学习群等你加入!
扫码关注
计算机视觉研究院
公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式
往期推荐
🔗
本文来自微信公众号“计算机视觉研究院”(ID:ComputerVisionGzq)。大作社经授权转载,该文观点仅代表作者本人,大作社平台仅提供信息存储空间服务。