哈希游戏- 哈希游戏官方网站- APP下载新浪新闻探索大会丨彭绍亮:多模态大数据驱动下的开源 AI 大模型
2025-11-11哈希游戏,哈希游戏官方网站,哈希游戏APP下载
通用人工智能与多模态技术已成为当前热点。当我们还在专注于大语言模型时,行业已向多模态跃迁,整合多维世界数据;当我们探讨多模态时,AIoT(人工智能物联网)已悄然兴起。大模型驱动的无人机、无人车、无人艇,以及能够调用各类工具的智能体(Agent),正逐步模拟人类操作,实现多样化任务。约四五年前提出的 AIoT,如今已进一步演进为具备自学习、自我反思与创新能力的系统,模仿人类的思维链、长程思考及创新能力,覆盖剧本创作、科学发现、文化艺术等多个领域。
多模态数据涵盖语言、文字、音频、视频,甚至超越人类感知的高维向量与矩阵。人类通过感官所能感知的数据仅占自然界总量的约 0.1%。人类通过发明望远镜、显微镜、测序仪等工具,探索感官无法直接获取的数据,然而这些数据总和仍不足物理世界信息量的 10%。因此,我们期望利用大模型技术,实现对这类数据的采集、挖掘、分析乃至生成。大模型在处理高维向量与矩阵,尤其是维度在 100 至 200 之间时,展现出卓越能力,即所谓的“智能涌现”。我们正探究大模型在处理高维数据方面超越人脑的机制,并尝试将其应用于无人机、无人车、无人艇等智能体的自主学习。
我们聚焦于生物医药等垂直领域,研发了一系列开源国产大模型,覆盖从 DNA、RNA 序列到分子结构、蛋白质、单细胞、电子病历、医学影像及人群队列等生命科学数据。我们构建了多个应用平台,包括调控因子识别、药物反应预测、新药研发、肿瘤预测与诊疗方案生成等。这些成果均由我们团队主导,并坚持开源策略,以引领全球开源潮流。例如,我们研发了全球首个药物大模型“神农 GPT”,以及蛋白质语言大模型等。我们的开源举措也推动了国际同行的跟进。在蛋白质与 DNA 结合领域,我们仅用三个月便完成模型开发并开源,相关成果发表于《Nature》子刊。
最后,谈谈我们与国际领先水平的差距。主要挑战在于国际竞争激烈,尤其是来自美国的压力。对方于 2 月 27 日发布的 4.5 版本在写作与编程方面表现卓越,幻觉率极低,但价格昂贵。5.0 版本虽解决部分问题并实行免费策略,却不向中国开放。其编程能力与低幻觉率使其在通用大模型领域一骑绝尘。我们评估其水平约相当于硕士一二年级,尚未达到博士专家级别。该模型采用统一架构,具备路由机制、持久记忆等创新功能,展现出全面优势。我们正深入分析其技术特点,思考如何在多模态能力、通用路由、验证机制及实时学习等方面实现突破。


