加利福尼亚州坎贝尔,2022 年 5 月 19 日 (GLOBE NEWSWIRE ) –分析驱动的非结构化数据管理和移动领域的领导者 Komprise 今天宣布推出 Komprise 智能数据工作流程,这是一个跨云、边缘发现相关文件和对象数据的系统流程和本地数据中心,并将本机格式的数据提供给 AI 和机器学习 (ML) 工具和数据湖。
行业分析师预测,到 2025 年,全球至少 80% 的数据将是非结构化数据。这些数据对于 AI 和 ML 驱动的应用程序和洞察力至关重要,但其中大部分被锁在不同的数据存储孤岛中。这会造成非结构化数据盲点,导致错失数十亿美元的大数据机会。
Komprise 扩展了Deep Analytics Actions以包括基于Deep Analytics查询的复制和限制操作,增加了执行外部功能的能力,例如通过 API 运行自然语言处理功能,并扩展了全局标记和搜索以支持这些工作流。Komprise 智能数据工作流允许您定义和执行流程,其中包含以任何顺序所需的尽可能多的这些步骤,包括边缘、数据中心或云中的外部功能。Komprise全球文件索引和智能数据工作流共同将查找、丰富和移动正确的非结构化数据所需的时间减少了高达 80%。
PacBio 信息技术高级总监 Jay Smestad 说:“Komprise 提供了一种快速方法来可视化我们的 PB 级仪器数据,然后自动执行分层和删除等流程以实现最佳节省。” “现在,自动化工作流程的能力使我们可以在更精细的级别进一步定义这些数据,然后将其输入分析工具以帮助满足我们科学家的需求,这将改变游戏规则。”
Komprise 智能数据工作流与许多部门相关。以下是制药行业的一个例子:
1) 搜索:跨本地、边缘和云数据孤岛定义和执行自定义查询,以使用 Komprise Deep Analytics 和 Komprise 全球文件索引查找 Project X 的所有数据。
2) Execute & Enrich:对 Project X 数据执行外部函数,以查找特定 DNA 序列的突变并将此类数据标记为“Mutation XYZ”。
3) Cull & Mobilize:使用 Komprise Deep Analytics Actions 进行中央处理,仅将带有“Mutation XYZ”标签的 Project X 数据移动到云端。
4) 管理数据生命周期:一旦分析完成,将数据移动到较低的存储层以节省成本。
其他智能数据工作流用例包括:
- 合法资产剥离:查找并标记与资产剥离项目相关的所有文件,并将敏感数据移动到对象锁定的存储桶中,并将其余数据移动到可写桶中。
- 自动驾驶汽车:查找与特定车型突然停止相关的碰撞测试数据,并将这些数据复制到云端进行进一步分析。使用 Reason = Abrupt Stop 执行外部函数来识别和标记数据,并仅将相关数据移动到云数据湖库,以减少与移动和分析无关数据相关的时间和成本。
“无论是海量的基因组学数据、监控数据、物联网、GDPR 还是整个企业的用户共享,Komprise 智能数据工作流都会在云中协调这些数据的信息生命周期,以有效地查找、丰富和移动分析项目所需的数据,”Komprise 的首席执行官 Kumar Goswami 说。“我们很高兴能够进入产品旅程的下一阶段,这使得管理和调动大量非结构化数据变得更加容易,从而降低成本、合规性和商业价值。”