大数跨境

高性能存储实践| 10 大行业 AI 存储案例大放送

高性能存储实践| 10 大行业 AI 存储案例大放送 焱融科技
2023-11-28
27
导读:焱融存储解决方案十大泛 AI 领域场景全覆盖

随着大模型时代的到来,人工智能在各行各业的应用具有重要的意义和优势,极大地推动了业务的创新和发展,使得各行业能够更好地满足不断变化的需求,降本增效的同时改善了用户体验。有 AI 的地方就有数据,有数据的地方就有数据存储。新场景、新应用、新模型不断涌现,高性能存储已然成为 AI 发展的必选题。


焱融科技专注于软件定义存储技术及数据服务的高新技术企业,凭借多年来在分布式存储领域的关键技术积累与突破,先后为知名政企、科研机构及世界 500 强企业打造高性能存储底座,助力其业务遥遥领先。


服务客户覆盖生信医疗、AI+ 科研、智能制造、大模型、能源、金融量化、智能汽车、影视渲染、GIS 地理测绘等应用场景及行业,积累了丰富的客户资源和实践经验。此篇,我们将以 AI 应用场景及行业为维度,分享 10 大热门行业 AI 存储案例,为更多加入泛 AI 场景业务赛道的企业提供借鉴和帮助。


生信医疗

在生物医疗行业,人工智能技术的应用涉及多个方面,包括医学影像分析、基因组学、药物研发等。生物医疗数据呈现爆炸式增长,处理和分析这些海量数据对于疾病研究、精准医疗、智慧医院建设等方面具有至关重要的意义,高性能存储能够确保数据的安全、可靠和高效访问,以支持快速、准确地分析和解读数据,从而推动医疗科研和临床治疗的创新与发展。针对生信医疗,焱融科技服务基因测序、智慧医疗,拓展更多行业应用场景。


 智慧医疗 

智慧医疗业务面临着诸多挑战:系统涉及大量医疗设备和数据,需要确保无缝协同工作;随着越来越多医疗机构、医生和患者接入系统,并发访问要求高;出现单点故障,医疗服务的连续性将受到严重影响;此外,随着医疗业务的开展,各类影像、病历、检测数据会迅速积累,数据量增长极快;最后,在医疗场景下,每一秒都可能关乎生命,因此要求系统能在最短时间内响应各种数据请求和操作。


案例解析

打造三级综合性中医医院智慧 PACS 存储系统

推进全球领先医疗设备制造厂商精准部署存储解决方案


 基因测序 

基因测序全链路数据流分为样本采集、样本处理、高通量测序、下机数据拆分、拆分数据生物学分析和可视化报告这几个场景:



数据从测序仪下机开始到数据拆分再到拆分数据做生物学分析,不同阶段业务场景所面临的数据规模和存储需求存在差异:测序仪每天产生数据量约 10TB 以上,多为图片类型非结构化数据;数据下机质检拆分,增加以小文件为主的数据描述文件,需满足海量小文件高并发要求;数据分析阶段,约生成 5 倍过程样本数据量,需存储满足高性能读写,并且支持计算层高性能计算集群的高并发访问。



案例解析

为极智基因打造高性能生物医学平台

YRCloudFile 分布式存储加速基因测序


AI for Science

AI for Science 是一种将人工智能技术应用于科学研究领域的趋势,利用机器学习和深度学习算法,AI 可以帮助科学家加速科学发现和创新。


例如:在基因组学领域,AI技术可以快速分析基因数据并预测疾病风险;在材料科学中,AI 可以优化材料设计并加速新材料的开发。


科研过程中,从数据采集、分析、模型训练到结果验证等环节,每个环节都对存储有着不同的需求,涉及多维度数据流动:处理大规模的数据,包括材料的实验数据、模拟数据、文献数据等;数据的可视化和统计分析,帮助研究人员更好地理解材料数据的特征和趋势;提供高效智能的信息检索功能,帮助研究人员快速获取所需的材料信息。


焱融科技为 AI+ 科学研究领域打造典范数据存储解决方案:针对实验环节的 HPC 计算,提供大数据组件对接,支持大规模数据的高速读写和并行计算;针对 AI 平台,采用独特的 IO 流程优化和并发 IO 处理,支持持久化容器数据存储;满足 AI 调度平台无缝对接需求,提供完善的权限控制及资源控制功能。



案例分享

浙大材料学院高性能存储实践

北邮构建高性能智能医学研究平台

为中科院大气物理研究所打造海量高性能存储

国家级的网络通信领域新型科研机构存储实践


智能制造

智能化、高端化是我国制造业重点发力方向,成为制造企业提振活力、提升效益的必行之道,企业积极借助大数据、云计算、人工智能、物联网等技术,搭建并完善企业智能制造体系。


制造过程中产生的数据量急剧增加,包括传感器数据、设备运行日志、产品质检信息等,需要高性能、高可靠性的存储设备来确保数据的快速存取和安全保存;智能家居中大量用户数据、设备配置、语音指令、智能家居场景等信息,需要快速读取及分析,以提供顺畅、智能的用户体验。另外,企业上过程中需要将大量制造数据、设计图纸、工艺流程等信息上传到云平台,同时存储设备需具备可扩展性和灵活性,以适应制造业企业不断增长的数据存储需求。


焱融科技在服务世界 500强制造企业美的的项目中,旗下明星产品焱融全闪分布式文件存储完成国内制造业首个双 200Gb 网络聚合分布式文件存储集群部署,实现 AI 计算平台破千万 IOPS 性能


实现 AI 计算平台破千万 IOPS 性能


通过焱融 F8000X 全闪分布式文件存储系统构建的 AI 计算共享存储平台,实现大规模 GPU 计算集群的高并发数据访问,并且根据计算集群规模保持同步线性地扩展性能和容量,帮助美的突破存储性能瓶颈,充分释放了 GPU 计算潜力,轻松应对各种数据密集型工作负载性能要求。


案例解析

实现美的集团破千万 IOPS 性能

助力海尔集团上云 加速“智能制造”进程


大模型

大模型计算量庞大,计算复杂度高,参与计算的数据规模巨大,大模型越成熟所需数据越丰富,而海量数据需要更强悍的存储性能。因此在大模型的推动下,数据存储已成为AI大模型的关键基础设施,贯穿大模型全流程:


超大规模数据的存储和预处理阶段,海量数据的持续扩展、持久化存储及高并发访问;模型设计阶段,数据存储可靠性、可共享、POSIX兼容性;模型训练、参数调优及评估阶段,高IOPS、高吞吐、高带宽减少训练中断时间;模型部署阶段,既要求高并发、高吞吐,又要求整个流程尽量简单高效。


焱融高性能存储在大模型应用场景具有独到的产品能力,通过与大模型企业深度合作,夯实焱融科技大模型存储方案,适配百亿级数据规模,向计算集群提供高性能低时延的存储服务能力。


案例解析

助力智谱AI打造大模型训练加速之道

跨越大模型训练数据障碍:焱融四大优化策略

存储实践:某认知大模型开发应用

全闪存储加速大模型训练,获业界共识


能源行业

在能源行业中,需要对勘探、开发和生产过程中产生海量数据进行实时处理和分析;对如电力、气象等领域进行实时数据进行监测和预测;高效建模和模拟环节需要对数据进行快速的读写操作;随着可再生能源的发展,还需要关注存储设备的能源效率和环保性能,以降低能源消耗和碳排放。


本次介绍的是国内省级统一规划运行国家电网项目,省中心及下辖 13 个地市数据中心,承载的业务系统包括“数字孪生”、“人工智能中控平台”、“电力设备设计系统”、“输变电工程监控系统”等专业业务系统和通用办公系统。


焱融高性能存储系统与计算采用融合部署模式,硬件平台选用标准服务器硬件,大大降低运维后端备件压力,确保业务长期稳定运行。同比传统方案,硬件支出成本降低 40%,耗电和机房空间降低 50% 以上,通过融合部署极大的压缩了用户成本支出


案例解析

为国家电网打造存算一体的融合基础架构 


智能驾驶

随着自动驾驶技术的不断进步,无人配送车、无人出租车、无人巴士等智驾场景逐步落地深入,越来越多的雷达、摄像头等传感器被部署在车辆里,一天生成的数据量可达到 3-8 TB 左右。



如果要实时处理和分析大量这些传感器数据、地图信息、驾驶行为模型等,需要求存储设备具有极高的读写速度和低延迟,确保智能驾驶系统的迅速响应和决策,提升行驶安全性与乘客体验。同时,为了确保行车安全和系统稳定性,存储方案必须提供高可靠性和数据持久性,防止任何情况下的数据丢失;数据规模将持续增长,存储方案还需具备良好的扩展性。


焱融科技聚焦智能驾驶场景,分享 YRCloudFile 在自动驾驶训练场景下针对 IO 模型、容器化部署、性能提升、智能分层方面的实践经验和启发,希望能给相关从业者解决类似问题时提供一些参考和帮助。


智能驾驶解决方案架构图


案例解析

无人驾驶科技公司:跨云多源数据管理,直击自动驾驶痛点

飞步科技 x YRCloudFile:开启智驾新纪元

YRCloudFile 引领自动驾驶存储技术新趋势

混合云存储点燃万亿自动驾驶市场

自动驾驶训练,网络带宽跟不上怎么破?


金融行业

金融行业中,量化交易、数据分析、风险评估等关键场景对高性能存储有迫切需求。量化交易需毫秒级的响应时间来捕获市场机会,而高性能存储能确保快速读写和数据处理。同时,金融大数据分析和风险评估依赖于海量数据的快速处理与存储,以提供准确的业务洞察和决策支持。


我们以量化场景为例,包括市场的量价数据、基本面数据和另类数据,涉及交易所量价数据、上市公司公告、公司财报、个股新闻等。


量化数据量规模大、数据类型多、干扰数据多、衍生数据复杂,量化环节涉及划分数据集、数据标注、找因子、缺失数据处理、模型训练、回测验证等。焱融科技深度剖析百亿私募客户量化业务场景,提供了针对海量数据支撑、存储性能以及建设成本三者都可兼顾的解决方案


案例解析

焱融全闪存储轻松构建百亿私募量化投研平台

YRCloudFile 助力北部湾保险存储架构升级


影视渲染

在超高清产业发展中,渲染一直是吃算力的“老虎”,各种高性能的算力设备已经不能满足其消耗。在计算、网络、存储三足鼎立的关系中,存储一直是木桶效应中的短板,业界亟需一款能适用于超高清影视制作的高性能文件存储,在素材共享的基准业务要求下,满足更多“原子级”操作的存储系统。



在影视制作过程中,无论是合成、渲染、动画、模拟、后期制作、色彩校正、VFX 或虚拟现实,需要处理大量的高清视频、音频和特效数据,这要求存储设备具备高性能和大容量;为了保证渲染速度和效率,低延迟和高带宽的存储访问也至关重要。此外,还需要确保数据的完整保存和快速恢复。


焱融科技为超高清行业提供全栈存储技术服务,让超高清视频在速度、质量和性能之间取得最优平衡。


案例解析

万亿级超高清产业变奏,分布式存储支撑关键应用落地


实景三维

实景三维(3D Real Scene)是通过多种技术手段,将现实世界的地理地貌全数据集的采集、分类、加工、展现于一体的技术流程,旨在建造一个与现实无差别的虚拟世界,实现在任何空间都可以调取和应用的数据。大量用在国土资源管理、农林水利、资源矿产、城市规划服务、应急救灾等领域


随着实景三维对于精细度要求越来越高,地理信息数据量逐渐变得越来越大,使用的存储从小容量、小并发的通用型存储,逐渐发展成为海量数据、高并发的专业型存储,也从支持十几台计算并发访问的规模,增长为支持几十到几百台计算的高并发存储,数据量也从几十 TB 增长到数百 TB 乃至 PB 级别。同时,为了保证数据的可靠性、安全性和高效性,存储方案需要具备数据备份、恢复、容灾等功能。


案例解析

助力工业化设计,提升变电站三维设计效率

“实景三维业务发展瓶颈在哪里”和“御医良方”


写到最后

AI 在各行各业的应用已经渗透到了我们生活的方方面面,从医疗、金融、制造、交通、教育到娱乐等各个领域,都可以通过 AI 技术来提高效率、降低成本、优化决策、提升用户体验等,为我们创造更便捷、更智能的未来。焱融科技致力于打造 AIGC 时代的高性能存储系统,助力各行业构建具备高性能特性的数据中心,加速业务创新。

本次我们分享了部分焱融高性能存储的场景及行业落地,不仅源于存储技术的创新研发及对市场趋势的敏锐洞察,更得益于与客户的认可和合作伙伴的紧密合作。未来,焱融科技也期待与更多的合作伙伴携手前行,共同推动泛 AI 领域的技术创新和应用拓展。




👆码上产品试用👆

【声明】内容源于网络
0
0
焱融科技
1234
内容 399
粉丝 0
焱融科技 1234
总阅读2.5k
粉丝0
内容399