登录注册
论坛
一粒金砂(中级)
5
0
书中提到,在处理大模型的训练时,需要大量的数据支持,分布式存储系统(如Ceph、HDFS、Lustre)是常见的解决方案。针对不同的数据访问模式(如随机读取和顺序读取),怎么去选择合适的存储架构以及优化其性能?Ceph和HDFS更适合大规模数据存储,但对于低延迟需求足够吗?
扫一扫,分享给好友
五彩晶圆(高级)
7608
2
看情况吧,重计算负载的系统,一般不会迁移数据,数据太大,所以一般会迁移计算,把硬件和算法就近部署到数据附近。
默认摸鱼,再摸鱼。2022、9、28
发表回复 回帖后跳转到最后一页
EEWorld Datasheet 技术支持
查看 »