好消息!微博支持 Apple Vision Pro 了!在 Vision Pro 的 App Store 里可以直接把 iPadOS 版更新为 visionOS 版[赢牛奶]功能都还挺完善的,支持分屏,还第一次有了 Apple Vision Pro 的小尾巴~看这条微博是不是来自 Apple Vision Pro?[doge]
而坏消息是,一周过去了,重启了无数次,甚至更新了visionOS 1.1.1 新固件,我 Vision Pro 的扬声器还是坏的,看来是硬件问题了……只能等有机会再去美国修了[裂开]
而坏消息是,一周过去了,重启了无数次,甚至更新了visionOS 1.1.1 新固件,我 Vision Pro 的扬声器还是坏的,看来是硬件问题了……只能等有机会再去美国修了[裂开]
【全面超越#ViT#,美团、浙大等提出视觉任务统一架构#VisionLLAMA#】
半年多来,Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功(训练稳定、容易做 scaling)。
沿袭 ViT 的研究思路,我们能否借助创新性的 #LLaMA# 架构,真正实现语言和图像的架构统一?
在这一命题上,最近的一项研究 VisionLLaMA 取得了进展。VisionLLaMA 在图像生成(包含 Sora 依赖的底层的 DIT)和理解(分类、分割、检测、自监督)等多个主流任务上相较于原 ViT 类方法提升显著。
该研究在统一图像和语言架构方面的尝试,可以复用 LLM 社区在 LLaMA 上的训练(稳定且有效的 scaling)、部署等一系列成果。
论文标题:VisionLLaMA: A Unified LLaMA Interface for Vision Tasks
论文地址:https://t.cn/A6Y3W6GF
代码地址:https://t.cn/A6Y3W6Gs
详细报道:https://t.cn/A6Y3W0U2
半年多来,Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功(训练稳定、容易做 scaling)。
沿袭 ViT 的研究思路,我们能否借助创新性的 #LLaMA# 架构,真正实现语言和图像的架构统一?
在这一命题上,最近的一项研究 VisionLLaMA 取得了进展。VisionLLaMA 在图像生成(包含 Sora 依赖的底层的 DIT)和理解(分类、分割、检测、自监督)等多个主流任务上相较于原 ViT 类方法提升显著。
该研究在统一图像和语言架构方面的尝试,可以复用 LLM 社区在 LLaMA 上的训练(稳定且有效的 scaling)、部署等一系列成果。
论文标题:VisionLLaMA: A Unified LLaMA Interface for Vision Tasks
论文地址:https://t.cn/A6Y3W6GF
代码地址:https://t.cn/A6Y3W6Gs
详细报道:https://t.cn/A6Y3W0U2
#差评说数码# 没想到 PICO 的系统竟然还能有大更新,我哭死。。。这次多了个 PC/Mac 互联,并增强了手势识别精度。上次 Vision Pro 发布之后,我就把自己的 Pico 拿出来了,想找一个扩展桌面的 App,结果发现体验很糟糕,现在官方终于出手了。另外希望 Pico 的 MR 透传模式搞快点吧,咱就不说对标 Vision Pro 了,赶紧对标下 Quest 3 行不行?
✋热门推荐