数据传输方法

本地向思源一号传输

Windows 用户

Windows 用户可以使用 WinSCP 在集群和您自己的计算机之间传输文件。可至 WinSCP 官网下载。

如下图所示,填写思源一号节点的地址,SSH 端口,SSH 用户名,SSH 密码,然后点击 Login 进行连接。 使用 WinSCP 的方法类似于使用 FTP 客户端 GUI,如下图所示:

winscp example

登录后即可看见左右两栏文件。左侧是本地文件,右侧是集群上的文件。点击需要传输的文件进行拖动即可传输。

Linux/Unix/Mac用户

Linux/Unix/Mac用户可通过在终端中使用scp或rsync等命令传输。

1.如果传输的对象为少量大文件,且目标环境上没有数据的历史版本,所有需要传输的文件都是首次传输,可以使用scp直接拷贝文件。

$ scp -r [源文件路径] [目标路径]

2.如果需要传输的对象为包含大量文件的目录,或者目标环境上已经存在差异较小的历史版本,建议使用rsync拷贝数据,rsync会对比源地址和目标地址的内容差异,然后进行增量传输。

$ rsync --archive --partial --progress [源文件路径] [目标路径]

如果[源文件路径]或[目标路径]位于思源一号集群上,则路径需使用以下格式:

[用户名]@sydata.hpc.sjtu.edu.cn:[思源一号上的路径]

如果[源文件路径]或[目标路径]位于本地,则不需要加[用户名]@主机名,可直接写文件路径。

# 假设用户expuser01在思源一号平台上个人目录为/dssg/home/acct-exp/expuser01
# 本地个人目录为/home/local_user/(个人目录可以用~代替)

# 示例1:将本地目录~/data的全部数据上传至思源一号dssg目录下
$ scp -r /home/local_user/data/ expuser01@sydata.hpc.sjtu.edu.cn:/dssg/home/acct-exp/expuser01/

# 示例2:将dssg目录中的~/math.dat文件下载到本地个人目录
$ scp expuser01@sydata.hpc.sjtu.edu.cn:/dssg/home/acct-exp/expuser01/math.dat /home/local_user/

# 示例3:将dssg目录~/data的数据下载到本地~/download目录,请注意rsync不支持双远端传输,必须在目标主机(这里即为本地)上操作
$ rsync --archive --partial --progress expuser01@data.hpc.sjtu.edu.cn:/dssg/home/acct-exp/expuser01/data/ /home/local_user/download/

本地向π 2.0/AI/ARM集群传输

Windows 用户

使用 WinSCP,方法和本地向思源一号传输类似,只需要将节点地址改成data.hpc.sjtu.edu.cn。

Linux/Unix/Mac用户

方法和本地向思源一号传输类似。

# 假设用户expuser01在π 2.0集群上个人目录为/lustre/home/acct-exp/expuser01

# 示例4:将本地目录~/data的全部数据上传至lustre目录下
$ scp -r /home/local_user/data/ expuser01@data.hpc.sjtu.edu.cn:/lustre/home/acct-exp/expuser01/

# 示例5:将lustre目录~/data的数据下载到本地~/download目录,请注意rsync不支持双远端传输,必须在目标主机上操作
$ rsync --archive --partial --progress expuser01@data.hpc.sjtu.edu.cn:/lustre/home/acct-exp/expuser01/data/ /home/local_user/download/

思源一号与π 2.0/AI/ARM集群互传

要提高集群之间互传数据的效率,需要选择合适的传输节点。

  • 如果需要在Pi超算和思源一号互传数据,需要选择data或者sydata节点发起传输

  • 如果需要从Pi超算向冷存储搬运数据,需要选择data节点发起传输

  • 如果需要从思源一号向冷存储搬运数据,需要选择sydata节点发起传输

例如通过登录π2.0集群数据传输节点data.hpc.sjtu.edu.cn,使用scp或rsync命令进行传输:

$ scp -r [源文件路径] [目标路径]

$ rsync -avr --progress [源文件路径] [目标路径]

此时因为已经登录到了π2.0集群,π集群上的文件路径不用加前缀,而思源一号上的文件路径需要加前缀[用户名]@sydata.hpc.sjtu.edu.cn。

# 示例6: 该用户在data节点上将lustre个人目录下的数据~/data搬运到dssg个人目录~/data下
$ ssh expuser01@data.hpc.sjtu.edu.cn
$ cp -r /lustre/home/acct-exp/expuser01/data/ /dssg/home/acct-exp/expuser01/data/

# 示例7:该用户在sydata节点上将lustre个人目录~/data下的数据搬运到dssg个人目录~/data下
$ ssh expuser01@sydata.hpc.sjtu.edu.cn
$ scp -r expuser01@sydata.hpc.sjtu.edu.cn:/lustre/home/acct-exp/expuser01/data/ /dssg/home/acct-exp/expuser01/data/

从Pi超算和思源一号向冷存储搬运数据的具体操作请参考:科学数据平台(冷存储系统)数据使用指南


最后更新: 2024 年 11 月 22 日