欢迎来到合成化学产业资源聚合服务平台化学加!客服热线 020-29116151、29116152

AI4Science领域被严重低估的“数据炼金师”与未来超级AI科学家奠基者

来源:首席信息官CIO      2025-11-20
导读:作为一名在化学与生物医药研发及数智化领域耕耘超过十年的从业者,我先后在睿智化学、扬子江药业、和记黄埔等公司从事实验室药物研发工作;这些公司采购的电子实验记录本都是上海鹰谷信息的InELN。

image.png

鹰谷产品总览InELN截图

在我看来,鹰谷信息很可能是当前中国乃至全球在AI for Science”赛道中最被低估的潜在巨头。其价值不在于它现在有多大的营收,而在于它正以一种独特且难以复制的路径,构筑起未来“超级AI科学家”的核心基础设施[1]。以下是支撑我这一判断的四个核心理由。

一、内部数据金矿:ELN是捕获科研“暗数据”的关键枢纽

任何AI模型的效能,都取决于其训练数据的质量与规模。在科学研究中,最具价值的不仅是成功的实验数据,那些未被发表的“失败数据”同样至关重要——它们告诉AI哪些路径走不通,极大地缩小了搜索空间,提高了研发效率[2, 3]

鹰谷InELN电子实验记录本,正是捕获这些内部数据流的枢纽。与我们曾经使用的纸质记录或零散的Excel文件不同,InELN实现了实验过程的全面数字化和结构化。从化学合成路线、生物测序结果到反应条件、失败原因,所有细节都被系统性地记录和沉淀下来。

事实依据:

  • 鹰谷已服务600多家全球客户,包括扬子江、和记黄埔、晶泰科技、华为等头部企业,覆盖生物医药、化工、新材料等多个研发密集型领域。这意味着庞大且持续增长的、高质量的私有科研数据库正在鹰谷平台上形成。

  • 国际上的趋势已印证了这一价值。Anthropic的Claude模型已与Benchling ELN达成深度合作,目的就是获取这些经过授权的结构化的实验数据来打造更专业科学AI模型[4]。鹰谷在中国市场扮演着类似的角色。

二、外部知识熔炉:InPaper让人类科研遗产“活过来”

除了内部产生的数据,人类数百年来积累的海量科学文献(专利、论文)是另一个知识宝库。然而,这些数据大多以PDF、图片等非结构化形式存在,无法被机器直接理解和处理[5]

这项将人类科研数据结构化、自动化提取的工作,一直是世界难题[6-10],很多学术团队和企业,纷纷投入这个领域,但都不像鹰谷,已经推出了可商业化的产品InPaper

image.png

鹰谷产品总览InPaper截图,窗口左侧是原文及标记,右侧是提取到的数据

image.png

鹰谷官方公众号InPaper介绍的Gif动图1,识别和提取化学名称

image.png

鹰谷官方公众号InPaper介绍的Gif动图2,识别和提取结构

鹰谷的InPaper文献结构化工具决了这一核心痛点。它利用自研的AI图像识别、IUPAC命名和大型语言模型技术,能自动、精准地从PDF文献中提取化学结构式、反应式、生物序列、活性数据和物性数据等[11-15]

事实依据:

  • 根据鹰谷资料,InPaper能批量识别文献中的化学结构和反应式图片,并将其转化为可编辑、可计算的格式。它甚至能将文本的中文化学名称智能转化为结构式将描述化学反应的投料操作文字转化为可计算机处理的反应式。

  • 这一能力,使得将“人类历史上所有的科研数据”整理成高质量、结构化的机器可读数据集成为可能。这样的数据集,正是训练垂直领域科学AI大模型 的优质燃料,其价值不可估量。

三、超级AI科学家雏形:内外数据融合,驱动科研智能体

单独的内部数据和外部数据都已极具价值,但鹰谷最具想象力的地方在于,它正在将二者融合,打造一个不断进化的“科研大脑”。

鹰谷的InAI科研大模型正是这个大脑的核心。它全面接入DeepSeek等通用大模型,并深度融合了鹰谷自研的知识图谱。这使得InAI不仅能基于企业内部知识库进行问答,还能综合利用全人类的公开文献数据,生成实验方案、优化建议,甚至自动撰写周报、专利和CTD申报资料[16]

image.png

鹰谷产品总览InAI截图,使用方式与DeepSeekAI相同

未来图景:

1. 数据飞轮:内部ELN数据(含失败数据)与外部文献数据共同构成训练数据集,让这个科研大模型越来越懂科学、越来越精准。

2. 智能体生态:模型不仅是聊天机器人,而是能调用各种科研工具的智能体。鹰谷已发布贝叶斯优化智能体,未来完全可以集成量子化学计算、分子动力学模拟等专业软件。未来科研人员将不再学习这些高深软件如何使用,而是通过AI智能体操控,直接用出专家的水平。

3. 超级AI科学家:一旦这个大脑成熟,再结合正在快速发展的具身机器人技术(如特斯拉、小鹏机器人),为其装上“手、脚”和“眼、耳、鼻”。那么,一个能够自主设计实验、配制试剂、操作仪器、分析数据并进行科学发现“超级AI科学家”将不再是科幻。

鹰谷提出的“打造超级AI科学家”的愿景,正是基于这条清晰的技术路径

四、时代与国家战略:鹰谷是科技竞争中的关键基础设施

我们正处在一个科技决定国运的时代。国家间的竞争,本质上是科技创新速度的竞争。化学、生物、材料等领域是关乎国家安全与发展的关键基础学科。谁能率先在这些领域实现研发的智能化、自动化,谁就能赢得未来。

鹰谷已经在这些关键领域服务了众多头部客户,建立了深厚的行业认知和数据壁垒。一旦它成功整合上述三大能力——即内部数据抓取、外部知识提取和智能体调度——鹰谷将不再仅仅是一家软件公司,而会成为中国AI4Science领域不可或缺的基础设施和核心引擎

结论:看好鹰谷AI驱动的科学未来

回顾我的职业生涯,从睿智化学的早期研究,到在扬子江、和记黄埔推动数字化转型,我深知高质量研发数据的管理与分析是何等困难,又何等重要。鹰谷的解决方案,是我们在实践中验证过的、能真正为研发赋能的有力工具。

综上所述,鹰谷信息构筑了三重核心壁垒:高质量内部研发数据、自动化处理外部文献的能力、以及融合内外数据打造科研智能体的平台愿景。在AI重塑一切的时代,鹰谷所做的事情,正是在为未来的科学研究铺设“信息高速公路”。

它或许现在看起来只是一家提供实验室管理软件的“小巨人”,但其在AI4Science领域的战略卡位、技术积累和数据潜力,使其成为一颗极具合作价值的璞玉。我相信,鹰谷信息正是那个最被低估的、拥有定义未来科研范式潜力的AI4S公司

参考资料

1. 上海鹰谷信息科技有限公司官方产品手册. 2025

2. Yield-predicting AI needs chemists to stop ignoring failed experiments.

https://www.chemistryworld.com/news/yield-predicting-ai-needs-chemists-to-stop-ignoring-failed-experiments/4015662.article

3. 盘点:药物研发中最好用的16款电子实验记录本ELN. 

4. 从写代码到设计药物,Claude for Life Sciences 让AI成为科学家的新搭档. 

5. Foundation models for materials discovery – current state and future directions. npj Comput Mater 11, 61 (2025). 

https://www.nature.com/articles/s41524-025-01538-0

6. From text to insight: large language models for chemical data extraction. Chem Soc Rev. 2025 Feb 3;54(3):1125-1150. 

https://pubmed.ncbi.nlm.nih.gov/39703015/

7. ChemDataExtractor 2.0: Autopopulated Ontologies for Materials Science. J Chem Inf Model. 2021 Sep 27;61(9):4280-4289. 

https://pubmed.ncbi.nlm.nih.gov/34529432/

8. A universal system for digitization and automatic execution of the chemical synthesis literature. Science. 2020 Oct 2;370(6512):101-108. 

https://pubmed.ncbi.nlm.nih.gov/33004517/

9. Automated Chemical Reaction Extraction from Scientific Literature. J. Chem. Inf. Model., 2021, 62 , 2035

https://pubmed.ncbi.nlm.nih.gov/34115937/

10. Reconstructing the materials tetrahedron: challenges in materials information extraction. Digital Discovery, 2024, 3 , 1021 —1037 RSC .

https://pubs.rsc.org/en/content/articlelanding/2024/dd/d4dd00032c

11. 让AI理解文献中的化学:从"读懂"分子到"设计"新药.

12. AI制药转折点出现,AI为您一键导出文献中的构效关系数据表.

13. 自己电脑里的专利和论文,可以结构式搜索和全文搜索了?

14. 分析专利好方便!鼠标悬停就显示化学名称的结构图.

https://blog.csdn.net/2401_85099221/article/details/140644516

15. 智能批量采集专利和期刊论文中的化学结构、生物活性和SAR数据,InPaper成功上线.

16. 鹰谷科研项目管理系统-构建企业AI知识库.


声明:化学加刊发或者转载此文只是出于传递、分享更多信息之目的,并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。 电话:18676881059,邮箱:gongjian@huaxuejia.cn