
在2024年6月6日的重大科技日,北京智源人工智能研究院震撼揭晓了其“悟界”系列创新大模型,其中囊括了两个全球首发的突破性成果:“悟界・Emu3”和“悟界・见微 Brainμ”。
智源研究院的此次发布,不仅限于单一模型,而是带来了一系列的智能体,包括全球首个能实现跨本体大小脑协作的悟界・RoboOS 2.0、悟界・RoboBrain 2.0具身大脑大模型,以及全原子微观生命模型悟界・OpenComplex2,共同构筑了一个全方位的智能生态。
回顾去年10月,智源研究院曾推出原生多模态世界模型Emu3,该模型以其前瞻性技术独树一帜,仅需预测下一个token,就能无缝处理文本、图像和视频三种模态数据。官方豪言壮语,实现了图像、文本、视频的“大一统”。Emu3不仅支持多模态输入和输出,其端到端映射的强大能力,更是为跨模态交互提供了坚实的科技支撑。
基于Emu3的底层架构,见微 Brainμ进一步将fMRI、EEG、双光子等脑科学信号统一token化,通过预训练模型的多模态对齐优势,实现了脑信号与文本、图像等模态的精准映射,并能够在多种神经科学任务中,以单一模型完成复杂的多向建模。
延伸阅读:
《智源发布原生多模态世界模型 Emu3,宣称实现图像、文本、视频大一统》
广告声明:本文包含的链接和信息仅供参考,旨在传递更多信息,节省甄选时间,具体结果请以实际情况为准。