fastdfs存储原理

标签ad报错：该广告ID(7)不存在。

本文主要介绍fastdfs客户端的上传下载原理以及以及服务端的网络io模型；主要介绍storage，不涉及tracker；storage和tracker使用的网络io模型是一样的。

1.协议格式

FastDFS采用二进制TCP通信协议。一个数据包由包头（header）和包体（body）组成。client、tacker、storage之间通信的消息格式，都是这样的。

包头只有10个字节，格式如下：

@ pkg_len：8字节整数，body长度，不包含header，只是body的长度

@ cmd：1字节整数，命令码; 比如上传，下载等；不同的命令，对应的body内容不同

@ status：1字节整数，状态码，0表示成功，非0失败（UNIX错误码）

// tracker\tracker_proto.h TrackerHeadertypedef struct{    char pkg_len[FDFS_PROTO_PKG_LEN_SIZE];  //body length, not including header    char cmd;    //command code    char status; //status code for response} TrackerHeader;

以STORAGE_PROTO_CMD_UPLOAD_FILE，上传普通文件为例，数据包定义如下：

2.客户端上传原理

fastdfs提供命令进行上传文件操作：

fdfs_upload_file <config_file> <local_filename> [storage_ip:port] [store_path_index]

客户端上传文件流程如下：

stat获取文件的状态、大小等

上传文件，肯定是要判断是否是一个常规文件；并且需要获取文件的大小的。通过linux系统提供的stat函数就可以得到，跟使用stat命令是一样的。

storage_do_upload_file

发送静态资源文件的时候，需要先将文件读入内存，再将内存中的数据send到相应的网络fd。通过使用sendfile完成文件的发送，不再需要两步操作。

sendfile使用mmap，实现零拷贝；

零拷贝，使用的是mmap方式，本质是DMA的方式，不需要CPU参与。普通copy，从磁盘copy数据到内存，需要CPU的move指令。

在进程中有一块区域叫内存分配区，当调用mmap的时候，会把文件映射到对应的区域，操作文件就跟操作内存一样。

fastdfs提供的客户端fdfs_upload_file是通过文件的方式上传，其实fastdfs也可以支持内存方式上传；我们在云盘项目中，就自己参考fastdfs的协议，实现了内存方式上传，减少了保存本地磁盘文件的过程。

发送完文件后，等待服务端返回响应；包含group_name, remote_file_name。

3.断点续传

fastdfs支持断点续传

先使用命令操作

echo hello > test1.txtecho world > test2.txtecho cong > test3.txt# 先使用fdfs_upload_appender上传 test1.txtfdfs_upload_appender /etc/fdfs/client.conf test1.txt得到：group1/M00/00/00/CqgWMGIgcUiEPsHJAAAAADY6MCA314.txt ，在fdfs_append_file的时候需要# 接着续传 test2.txtfdfs_append_file /etc/fdfs/client.conf group1/M00/00/00/CqgWMGIgcUiEPsHJAAAAADY6MCA314.txt test2.txt# 接着续传 test3.txtfdfs_append_file /etc/fdfs/client.conf group1/M00/00/00/CqgWMGIgcUiEPsHJAAAAADY6MCA314.txt test3.txt# 在服务器相应的目录下查找对应的文件，用cat读取文件内容。root@4af22fda6f4b:/home/fastdfs/storage/data/00/00# cat CqgWMGIgcUiEPsHJAAAAADY6MCA314.txthelloworldcong

断点续传文件分为两个阶段：