
Gilead 利用 AWS 上的机器学习加速企业搜索工具开发
2022 年
生物科技公司 Gilead Sciences Inc. (Gilead)希望提高员工生产效率,并简化其药物研发和制造(PDM)业务部门的内部数据管理流程,以便快速推出更多治疗方法,救助患有致命疾病的患者。为实现这一目标,该公司希望构建一款使用人工智能(AI)和机器学习(ML)的可扩展企业搜索工具,以提供预测分析,并在一个集中的位置搜索重要的文档、知识和数据。为确保该工具能针对每个自然语言查询一致地生成相关的结果,该公司需要一套解决方案来整合多达九个企业系统中的结构化与非结构化数据,以及知识存储库中的文档。
为加快项目进度,Gilead 的 PDM 团队选择了 亚马逊云科技(AWS),并采用由机器学习提供支持的高度准确的智能搜索服务 Amazon Kendra。在 AWS 的支持下,PDM 团队在 9 个月内便构建了数据湖,随后仅用 3 个月时间便构建了搜索工具,最终在预计的 3 年时间内圆满完成项目。自该款企业搜索工具问世以来,需 PDM 用户手动完成的数据管理任务数量及搜索信息所需的时间均大幅减少近 50%,这有助于研究、实验和制药工作实现新突破。


“Amazon Kendra 是一款一站式 AI 解决方案,如果配置正确,它能涵盖组织中的每个领域,并且简便易行。”
Jeremy Zhang
Gilead Sciences Inc. 数据科学和知识管理总监
从 Amazon Machine Learning Solutions Lab 获取支持
Gilead 总部位于加利福尼亚州福斯特市,专门从事抗病毒技术和药品的研究和开发,包括可能的 HIV 和病毒性肝炎治疗方法。2021 年 4 月,Gilead 制造业务部门的数据科学团队提出了 Morpheus 的构思,这是一款企业搜索工具,可使用人工智能和机器学习,从约 25 万份文档和 1 TB 的非结构化数据中快速提取相关信息及见解。PDM 内部成立了一支由数据科学家和工程师组成的项目团队,致力于将这一想法付诸实践,以便其研究人员和科学家能够从监管、合规、供应链和制造数据中获得更深入的见解,从而提高其为患者提供能够拯救生命的药物的能力。
不过,Morpheus 团队面临着一个巨大挑战,即如何整合多个企业系统中的数据,以应用单一的人工智能和机器学习策略进行知识探寻。Gilead 数据科学和知识管理总监 Jeremy Zhang 表示,“我们意识到,通过设计与实施基础设施来帮助我们整合构建大规模 AI 搜索所需的数据、知识和信息,有机会实现 Gilead 在 AI 知识领域的创新。”
为开发企业搜索工具,Morpheus 工作组与 Amazon Machine Learning Solutions Lab 合作,该实验室让其团队与机器学习专家开展合作,以帮助确定并构建机器学习解决方案,使该组织可以充分把握机会,最大程度提高投资回报率。通过与 Amazon ML Solutions Lab 团队合作,工作组加深了对云技术最佳实践的理解,并学习了如何设计和运行概念验证。工作组还了解了 Amazon Kendra。Zhang 表示,“Amazon Kendra 是一款一站式 AI 解决方案,如果配置正确,它能涵盖组织中的每个领域,并且简便易行。”在 4 周内,该团队便决定继续将 AWS 作为开发企业搜索工具的唯一平台。
构建 Morpheus 应用程序以推动企业变革
Gilead 的 PDM 团队使用 Amazon Simple Storage Service(Amazon S3)来构建数据湖,由此启动了 Morpheus 项目,该对象存储服务可提供行业领先的可扩展性、数据可用性、安全性和性能。该数据湖可用作集中式存储库,存储所有 PDM 的非结构化数据,无论数据规模如何。“要在 AWS 上构建一款企业搜索工具,我们必须对其进行强大的数据管理,”Zhang 说。“因此,我们在 AWS 上构建了一个数据湖,许多人认为这需要耗费数年时间才能实现,而我们只用了 9 个月。” 该公司不仅将数据湖作为其人工智能和机器学习的基础,还使用数据湖运行分析,并从开发和制造领域的数据中获得深入见解。此前,Gilead 的团队必须向其信息技术团队提交工单才能进行分析,在某些情况下,可能需要长达 1 年的时间才能完成申请。现在,该公司在几个工作日内即可提供分析和人工智能推理。
接下来,PDM 团队专注于使用 Amazon SageMaker 为其文档工具填充缺失或不完整的元数据,从而完善其搜索,Amazon SageMaker 可帮助用户为使用完全托管式基础设施、工具和工作流的几乎任何使用案例构建、训练和部署机器学习模型。通过使用此解决方案,Gilead 的研究人员仅需几个关键词就能更轻松地搜索相关信息。该公司还使用 Amazon Textract,这是一项机器学习服务,可从扫描文档中自动提取文本、手写内容和数据。Gilead 借助 Amazon Textract 检测其文档中的相关信息,与之前的光学字符识别解决方案相比,每次操作的相关成本呈数量级缩减。“Amazon Textract 非常不错,不仅因为它能够节省实际成本,并且具有优秀的信息提取技术能力,”Zhang 说。
该团队还使用 Amazon Kendra 及其应用程序从其数据湖中搜索结果。如此一来,Gilead 将跨系统搜索相关信息所需的时间减少约 50%,从而提高了员工生产效率并简化了团队工作流程。Zhang 表示,“使用 Amazon Kendra 可以大幅提高效率。有了它,我们的团队减少了为查找正确信息而需要访问的位置数量。”
2021 年 11 月,这支由 5 名员工组成的核心团队得以推出 Morpheus 应用程序,从而顺利完成了项目的第一阶段任务。自那时起,该应用程序便不断推动企业变革。在推出后的 3 个月内,使用企业搜索工具的员工超过 100 名。“Morpheus 让我们摆脱了必须通过图书馆学或本体论进行知识整合与查找的想法,”Zhang 说。“它已成为一种向高层领导展示人工智能和机器学习价值的简单方式。”
从人工智能和机器学习技术中获取更多价值
Gilead 的内部研发和制造团队目前正致力于改进其数据湖以实现 GxP 合规性(包括符合药品生产管理规范),并预计将在 2022 年 6 月完成数据湖重组。该公司还计划构建更多的人工智能和机器学习技术,以提供预测元数据、个性化人工智能和知识图谱。“Morpheus 让我们意识到,使用如此大规模的工具能够让整个企业受益,”Zhang 说道,“这确实有助于我们了解 Gilead 如何使用数据科学来推动下一波价值浪潮,而 AWS 上的人工智能和机器学习为我们提供了这些价值。”
关于 Gilead Sciences
生物科技公司 Gilead 总部位于加利福尼亚州福斯特市,专门从事抗病毒技术和药品的研究和开发,包括可能的 HIV、病毒性肝炎和 COVID-19 治疗方法。
AWS 的优势
- 在不到 1 年的时间内构建一款使用人工智能和机器学习的企业搜索工具
- 创建一个可充当九个不同企业系统存储库的数据湖
- 减少与数据管理相关的手动任务
- 将搜索时间缩短约 50%
- 简化内部工作流程,提高员工生产效率
- 在几天内获得深入的分析与见解
- 增加成本节约
- 推动企业变革
使用的 AWS 服务
Amazon Kendra
Amazon Kendra 是一种由机器学习提供支持的智能搜索服务。Kendra 重新构想您的网站和应用程序的企业搜索,这样您的员工和客户就可以轻松地找到他们要查找的内容,即使这些内容分散在您组织内的多个位置和内容存储库中。
Amazon SageMaker
Amazon SageMaker 通过整合专门为机器学习 (ML) 构建的广泛功能集,帮助数据科学家和开发人员快速准备、构建、训练和部署高质量的机器学习模型。
Amazon Textract
Amazon Textract 是一项机器学习服务,可以从扫描的文档中自动提取文本、手写字和数据。它不是简单的光学字符识别 (OCR),而是可以识别、理解和提取表单和表格中的数据。
Amazon Simple Storage Service (Amazon S3)
Amazon Simple Storage Service(Amazon S3)是一种对象存储服务,提供行业领先的可扩展性、数据可用性、安全性和性能。
开始使用
不同行业和规模的企业都在使用 AWS 对其业务进行转型,以实现自身愿景。联系我们的专家,立即踏上您的 AWS 之旅。