《 江南论坛 》欢迎您!   2026-03-05 星期四   加入收藏 | 设为主页 联系电话:0510—80908055
长三角发展论坛 首页 >

江苏加快发展生物大模型研究

作者:薛晓明 沈瑾秋 陆丽娜   文章来源:本站   点击数:96   发布日期:2026-1-8

摘  要  当前,生物大模型正重塑生命科学研究生产方式,深刻改变未来医疗产业形态。江苏发展生物大模型兼具产业应用需求端和技术创新供给端的双重优势,但仍面临一些挑战。江苏应顺应“AI+生命科学”融合发展趋势,优化生物大模型发展要素支撑、加强关键技术协同攻关、强化企业创新主体地位、加快打造生物大模型训练数据库,为全省高质量发展注入新动能。

关键词  生物大模型;人工智能技术;生物医药产业;江苏

党的二十届四中全会审议通过的《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》提出,“全面实施‘人工智能+’行动,以人工智能引领科研范式变革,加强人工智能同产业发展、文化建设、民生保障、社会治理相结合,抢占人工智能产业应用制高点,全方位赋能千行百业”。生物大模型是指以生物数据为基础、以人工智能技术为核心,用于解决生物学领域复杂问题的大规模预训练模型。当前,生物大模型正以前所未有的技术迭代速度与跨尺度整合能力,重塑生命科学研究生产方式,深刻改变未来医疗产业形态。江苏应顺应“AI+生命科学”融合发展趋势,加快布局生物大模型研发创新应用,推动人工智能创新链和生物医药产业链无缝对接,为全省高质量发展注入新动能。

一、发展生物大模型的重要意义

(一)颠覆传统生命科学研究范式

传统的生命科学研究通过开展生物学实验,实现从特定尺度对有限数量的样本的观察研究,而生物大模型作为人工智能驱动科学研究的典型案例,能够通过分子层面的模拟来演绎识别生物结构和规律,解读复杂的生命语言,从而预测多种生物实体的结构与功能,[1]并基于核酸序列、蛋白质结构、单细胞组学等生物数据发现新的生物学知识。如AlphaFold基于对现有蛋白质数据的深度学习,实现几乎全部已知蛋白质结构预测,准确率达90%以上、与实验室水平相当,其升级版更是能够预测蛋白质相互作用,帮助科研人员在数秒内完成以往需耗费数月时间和近十万美元才能实现的单个蛋白质结构解析。

(二)赋能打破传统药物研发困境

传统新药研发风险大、周期长、成本高,通常需要超过十年时间、十亿美元的成本,且研发成功率仅10%左右。生物大模型能够高效预测药物靶点作用、加速新药筛选、助力抗体药物和小分子药物设计,[2]精准匹配患者数据、提高临床试验效率。例如,华为云研发的盘古药物分子大模型,将先导药的研发周期从数年缩短至一个月,研发成本降低70%左右。通过提升生物大模型能力与规模,能够打造具备更高自主性和决策能力的生命科学智能体,针对特定问题自主开展研究。例如,斯坦福大学的VitualLab多智能体系统,已成功设计92种突变纳米抗体。

(三)推动医疗由治疗为主向预防为主转变

传统医疗手段只能在疾病发作后展开治疗,而生物大模型通过分析大量的细菌与人类的基因蛋白质信息,能够精准识别基因突变与疾病之间的关联,进而预测特定疾病的潜在风险。例如,复旦大学基于人类健康与疾病蛋白质组图谱,研发疾病预测与诊断模型,只需通过简单的血浆蛋白质组学检测,就能提前十余年预测阿尔茨海默病等上百种疾病的患病风险。围绕肿瘤、神经科学、心血管等专科领域,生物大模型正拓展形成具备更精准专科能力的细分领域大模型。例如,哈佛医学院研究打造病理学基础模型CHIEF,在癌症检测、诊断、预测、治疗评估等方面展现出优异性能。

(四)基于智能诊断与临床决策支持重构传统医疗模式

生物大模型通过介入分诊导诊、筛查诊断、临床决策等医疗环节,提高准确性与便捷性。在筛查诊断环节中,通过图像切割、特征提取等方式,生物大模型能够精准识别病变位置,在医学影像识别中已达较高水平。在医疗问诊咨询、个人健康监测、精神情绪管理及术后康复管理等应用场景中,生物大模型能够提供专业的诊后管理和康复指导,并将服务链延伸至医院外。[3]此外,生物大模型通过与机器人技术结合,能够产生性能强大的医疗机器人,实现疾病自主诊断、高难度手术自动化执行。

二、江苏发展生物大模型的优势基础

(一)医药产业基础雄厚

江苏生物医药已形成雄厚的产业基础和圈层效应,产业链创新链较为完备。数据显示,2024年,全省生物医药集群实现营业收入超4543.9亿元,实现利润总额730.4亿元,分别占全国15.1%、17.9%,创新药获批上市数量约占全国1/3,均居全国第一。江苏加快发展并积极运用生物大模型,促进生物医药产业智能创新、提质增效、控本降耗,赋能提升产业规模。江苏生物医药产业在新药研发、临床试验、生产制造等环节积累了大量的医疗数据,经过加工处理并形成高质量数据集后,有力支撑生物大模型训练优化,稳步提升模型研究的精准性和可靠性。

(二)研发创新实力强劲

江苏在人工智能和生命科学领域均拥有较强的研发创新能力,具备融合拓展、加速研发生物大模型的实力与潜力。在人工智能领域,江苏正积极布局建设中科工业人工智能研究院,牵头组建省级数据产业创新联合体,开展人工智能技术赋能产业创新研究,重点突破具身智能大模型、数字孪生优化等关键技术,这对于发展生物大模型具有一定的溢出带动效应。在生命科学领域,江苏兼具原始创新与产业创新能力,南京大学、南京医科大学等高校生命科学相关学科上榜软科世界一流学科排名,拥有国家生物药技术创新中心、数字医学工程全国重点实验室等战略科技力量以及亚洲规模最大的基因测序矩阵和质谱组学检测平台等,形成涵盖药物筛选、创新药研发、临床试验、材料测试等较为完备的研发服务链条,具备利用AI技术赋能研发创新、集成打造生物大模型的优势基础。

(三)平台赋能布局扎实

江苏积极推进生物医药产业创新发展,并依托科技计划项目、研发创新平台开展生物大模型研发创新探索。例如,江苏省科技厅“前沿引领技术基础研究专项”资助东南大学研发全球首个人体器官芯片医药大模型,该模型在新药先导化合物发现、精准医疗等方面具备应用潜力。江苏省人工智能生物医药技术产业研究院与华为合作打造“金陵·女娲”核酸基础大模型,为药物研发提供通用技术支持。苏州、南京等地依托自身发展特色,开展生物大模型差异化布局。苏州以“IT+BT”融合为重点方向,吸引百图生科等生物大模型头部企业设立研发中心,开展模型研发赋能生物医药产业发展研究。南京依托南京大学等高校资源打造“AI+生物医药”融合创新平台,加速生物大模型算法研究。

(四)企业创新意愿强烈

江苏拥有恒瑞医药、药明康德、正大天晴等一批生物医药知名企业,在药物设计、新药研发等方面创新意愿强烈,具备集成打造生物大模型的优势。首先,围绕“AI+新药研发”,江苏重点药企积极开展研发布局。比如,恒瑞医药构建AI辅助药物设计平台,基于AI技术开展靶点研究、小分子药物设计、合成路线预测等药物研发流程优化。其次,生命科学领域高校与企业积极开展融通创新,顺应“AI+生物医药”发展趋势,成立智能药学产教融合发展共同体,推动校企合作项目签约和产学研合作项目落地。最后,聚焦企业高端复合人才需求,加强生物大模型人才队伍建设。江苏积极开展专业学科建设与产创人才培养,支持南京大学、中国药科大学等高校开展“AI+生命科学”交叉学科建设,探索以产业需求为导向、项目式教学为核心培育一批创新创业人才。

三、江苏发展生物大模型面临的挑战

(一)必备要素协同供给不足

江苏大模型特别是垂直领域大模型缺乏专项政策支持,在模型研发、算力供给、数据支持、场景应用、准入监管等全链条布局上急需“路线图”指引,对生物医药产业的融合赋能有待加强。江苏缺乏针对生物大模型开发的检测监管和评估制度,模型应用场景和实现路径有待进一步挖掘,算力供给能力亟待提升。

(二)垂直模型数质尚需提升

江苏现有大模型数量较少、知名度不高。目前,全国共有439款大模型在国家网信办完成备案,江苏仅28个,约占6.4%,低于北京(132个)、上海(82个)、广东(66个)、浙江(34个),缺乏诸如DeepSeek、文心一言等具备影响力的通用大模型。江苏现有大模型对生物医药领域垂直穿透不足,具备前景的生物大模型数量不多。据不完全统计,江苏布局的高价值生物大模型及专利仅9项,低于北京(37项)、上海(25项)、广东(22项)等地。

(三)模型优化迭代存在堵点

生物大模型训练需要海量的临床试验、药物研发、文献知识等数据资源,数据质量将直接影响模型训练的准确性。江苏尚未建设生物医药领域行业可信数据空间,企业间数据流通困难、存在“数据孤岛”现象,开展模型训练优化仅能使用单一企业内部数据或购买公共数据来进行训练,数据类型质量参差不齐,生物大模型面临知识不足、准确度受限、模型幻觉等技术挑战和局限。

四、江苏发展生物大模型的路径

(一)协同优化生物大模型政策要素供给

上海积极打造基于大模型的生物学研究范式,统筹政策、标准、场景、基础设施等要素支撑,加强共性算法、AI药物设计等重点领域方向研发布局,推动生物大模型快速发展。江苏应借鉴上海经验做法,加强生物大模型发展的必备要素供给,推动大模型与生物医药产业融合互促。一是制定出台支持生物大模型发展的政策,加大资金支持及要素保障,支持苏州充分发挥“人工智能+”创新发展试验区作用,探索建设生物大模型开源社区,推广模型训练、微调和优化工具。二是研究制定生物大模型准入标准,规范产品分类界定和备案管理机制,组织医疗机构和医疗数据治理能力突出的重点企业开展数据标准化治理,根据大模型的预期用途和风险等级进行监管。三是支持生物大模型在药械研发、医学教学和医学科研、医疗服务、医院管理、养老托育服务、医用机器人等应用研发和标杆场景打造,鼓励各级医院嵌入大模型技术的医疗软件,推动大模型赋能医疗共同体建设,提升普惠医疗水平。

(二)统筹加强生物大模型关键技术研发

浙江以之江实验室为引领,整合浙江大学、华大生命科学研究院等高校院所、医疗机构、龙头企业资源,组建生命组学大数据创新联合体,以研发项目为牵引协同推动生物大模型技术创新与产业应用。江苏应学习浙江做法,发挥现有创新平台优势,推动生物大模型关键技术协同攻关和融合运用。一是发挥中科工业人工智能研究院等人工智能领域创新平台作用,加强AI“根”技术和大模型“底座”技术研发,推动AI大模型与具身智能机器人融合运用,为生物大模型算法优化、模型拓展奠定基础。二是发挥东南大学数字医学工程全国重点实验室等平台作用,围绕临床诊断辅助、创新药物研发等重点领域,加强数据采集融合、医学人工智能、智能数字诊疗研发布局,为生物大模型的数据供给和模型优化提供支撑。三是发挥江苏省人工智能生物医药技术产业研究院等医工交叉创新平台作用,面向生物医药产业“人工智能+”应用需求,采取资助研发或合作研发模式,加强关键技术节点突破,加快形成具备自主知识产权的生物大模型。

(三)培育壮大生物大模型创新企业集群

北京作为我国“大模型第一都”,大力推动生物大模型企业向生物医药等垂直领域融合拓展,培育孵化出水木分子、百图生科等生物大模型骨干企业。江苏应学习北京做法,加大大模型企业引进培育支持力度,壮大生物大模型企业集群。一是支持苏州、南京、无锡等地积极引进华为、阿里、腾讯、百度等互联网平台型企业设立总部基地或建设创新平台,支持南京大学、南京医科大学等高校与人工智能领域高新技术企业合作,积极参与生物大模型研发。二是鼓励思必驰、硅基智能等省内人工智能头部企业加强AI大模型研发布局,突破数据合成、高效训练和推理等研发投入大、周期长的关键共性技术,支持现有大模型企业加快向生命科学等垂直领域拓展,培育形成细分领域模型加速运用。鼓励百图生科等生物大模型行业领军企业加快开展生物大模型研发,加快形成智能体平台、集成“工具包”,赋能生物医药企业应用。三是加快建立健全省内高校、创新平台与省内生物医药头部企业联合选题、协同攻关机制,聚焦企业发展需求,开展生物大模型开发,通过模型“手拉手”研发、数据“点对点”投喂,推动龙头药企提早介入模型研发训练过程,缩短模型优化与应用周期。

(四)加快打造生物大模型训练数据库

广东依托国家技术创新中心及人工智能领域龙头企业,打造生命科学融通数据库,推动医疗数字资源合作共享。江苏应参考广东经验做法,加快数据整合清洗与投喂优化,将生物医药产业链数据优势转化为模型开发胜势。一是加快构建全省生物医药行业可信数据空间,整合高校院所、医疗机构、大型药企掌握的科学研究、临床医疗、产业链数据,协同建立生物样本库、医学数据共享平台等,形成高质量的公共训练数据集。二是配套建立分级分类、安全规范的数据管理和脱密授权使用机制,在数据库本地部署训练研发的生物大模型,确保数据使用安全可靠。三是探索医疗数据收集和使用的合规要求,推动医疗数据泛知情同意,按照尽职免责原则实现数据出院。强化全省一体化算力调度平台建设运营,探索配置可信计算环境,制定差异化“算力券”等扶持政策,降低大模型企业算力使用成本。

参考文献:

[1]倪圣焜,李雄文,郭哲韬,等.大模型在生物学中的应用[J].人工智能,2024(05):81-92.

[2]何欣恒,高斯涵,李俊睿,等.人工智能驱动药物研发进展[J].科技导报,2025,43(12):29-37.

[3]马傲,葛小玲.人工智能大模型在医疗健康领域应用的研究[J].中国现代医生,2024,62(33):89-95.

本文系江苏省软科学研究战略研究项目“江苏省‘十五五’科技创新规划基本思路研究”(编号BR2024001)的阶段性成果。

(作者单位:江苏省科学技术情报研究所)

【责任编辑:方晓红】

社科

最新期刊

第二期

江南论坛期刊2026年

在线预览

电话:0510—80908055  0510-80908053   邮编:214000   地址:无锡市滨湖区雪浪街道南象山路2号
备案号:苏ICP备20019952号-2 推荐使用IE9及以上浏览器 技术支持:无锡跨度数据科技有限公司  0510-85749979