sumit singh, 软件工程师, ibm
2006 年 4 月 10 日
使用用户空间的文件系统(fuse),您无需理解文件系统的内幕,也不用学习内核模块编程的知识,就可以开发用户空间的文件系统框架。本文是一篇简单的逐步介绍的指南,内容包括安装、定制和启用 fuse 和 afs,这样您就可以在 linux® 的用户空间中创建自己的功能完备的文件系统了。
文件系统是一种用来存储和组织计算机文件、目录及其包含的数据的方法,它使文件、目录以及数据的查找和访问得到简化。如果您正在使用一台计算机,很可能使用了多个文件系统。文件系统能提供丰富的扩展能力。它可以编写成底层文件系统的一个封装程序,从而对其中的数据进行管理,并提供一个增强的、具有丰富特性的文件系统(例如 cvsfs-fuse,它为 cvs 提供了一个文件系统的接口;或 wayback 文件系统,它提供了一种用于保留原始数据文件的文件备份机制)。
在用户空间的文件系统出现之前,文件系统的开发曾是内核开发人员的工作。创建文件系统需要了解内核编程和内核技术(例如 vfs)方面的知识。调试则需要 c 和 c++ 方面的专业技能。但是其他开发人员需要熟练地操作文件系统以添加个性化特性(例如添加历史记录或转发缓存)及对其改进。
fuse 简介
使用 fuse 您可以开发功能完备的文件系统:其具有简单的 api 库,可以被非特权用户访问,并可以安全的实施。更重要的是,fuse 以往的表现充分证明了其稳定性。
使用 fuse,您可以像可执行二进制文件一样来开发文件系统,它们需要链接到 fuse 库上 —— 换言之,这个文件系统框架并不需要您了解文件系统的内幕和内核模块编程的知识。
就文件系统来说,用户空间的文件系统就不再是新奇的设计了。用户空间文件系统的商业实现与学术实现的实例包括:
- lufs 是一个混合用户空间的文件系统框架,它对用于任何应用程序无数的文件系统提供透明支持。大部分lufs 包括一个内核模块和一个用户空间的守护进程。从根本上来说,它将大部分 vfs 调用都委托给一个专用的守护进程来处理。
- userfs 让用户进程可以像普通的文件系统一样进行加载。这种概念性的原型提供了 ftpfs,这可以使用文件系统接口提供匿名 ftp 访问。
- ufo project 是为 solaris 提供的一个全局文件系统,它允许用户将远程文件真正当作本地文件一样对待。
- openafs 是 andrew filesystem 的一个开源版本。
- cifs 是 common internet filesystem 的简称。
与这些商业实现和学术实现不同,fuse 将这种文件系统的设计能力带到了 linux 中来。由于 fuse 使用的是可执行程序(而不像 lufs 一样使用的是共享对象),因此可以简化程序的调试和开发。fuse 可以在 2.4.x 和 2.6.x 的内核上使用,现在可以支持 java™ 绑定,因此您可以不必限定于使用 c 和 c++ 来编写文件系统了。(有关更多使用 fuse 的用户层的文件系统的内容,请参阅 参考资料。)
要在 fuse 中创建一个文件系统,您需要安装一个 fuse 内核模块,然后使用 fuse 库和 api 来创建自己的文件系统。
![]() ![]() |
![]()
|
展开 fuse
要开发一个文件系统,首先请下载 fuse 的源代码(请参阅 参考资料)并展开这个包:tar -zxvf fuse-2.2.tar.gz。这会创建一个 fuse 目录,其中保存的是源代码。fuse-2.2 目录的内容如下:
- ./doc 包含了与 fuse 有关的文档。现在,这只有一个文件 how-fuse-works。
- ./kernel 包含了 fuse 内核模块的源代码(对于使用 fuse 开发文件系统来说,您当然不用懂得这些代码的机制)。
- ./include 包含了 fuse api 头,您需要这些文件来创建文件系统。您现在唯一需要的就是 fuse.h。
- ./lib 中存放的是创建 fuse 库的源代码,您需要将它们与您的二进制文件链接在一起来创建文件系统。
- ./util 中存放的是 fuse 工具库的源代码。
- ./example 当然包含的是一些供您参考的例子,例如 fusexmp.null 和 hello 文件系统。
![]() ![]() |
![]()
|
编译并安装 fuse
- 在 fuse-2.2 目录中运行 configure 脚本:
./configure。这会创建所需要的 makefile 等内容。 - 运行
./make来编译库、二进制文件和内核模块。查看 kernel 目录中的文件 ./kernel/fuse.ko —— 这是内核模块文件。还要查看 lib 目录中的 fuse.o、mount.o 和 helper.o。 - 运行
./make install完成 fuse 的安装。
另外一种选择:如果您希望使用insmod自己将这个模块安装到内核中,就可以跳过这个步骤。例如:/usr/local/sbin/insmod ./kernel/fuse.ko或/sbin/insmod ./kernel/fuse.ko。记住要使用 root 特权才能安装所需要的模块。
如果希望,只在一个步骤中就可以完成上面的步骤。在 fuse-2.2 目录中,运行 ./configure; make; make install;。
重要提示:在编译 fuse 时,系统中需要有内核头文件或源代码。为了简单起见,请确保将内核源代码放到 /usr/src/ 目录中。
![]() ![]() |
![]()
|
定制文件系统
现在让我们来创建一个文件系统,这样就可以使用一个较旧的 linux 内核来访问一个具有最新内核的 linux 系统上的 afs 空间了。您需要两个进程:一个是在较旧的 linux 内核上运行的服务器进程,另外一个是在具有最新内核的 linux 系统上运行的一个 fuse 客户机进程。不论何时请求到达您的 fuse 客户机进程上时,它都会与远程服务器进程进行联系。为了进行通信,这个文件系统使用了 rx rpc 代码,这是 afs 的一部分,因此您需要编译 openafs。(图 1 给出了对这个 afs 文件系统的概述。)
图 1. afs-fuse 文件系统概述

编译 openafs
- 下载 openafs linux 源代码并展开源代码。
在展开源代码的目录中,运行
./make ./configure --enable-transarc-paths。如果./configure无法理解编译使用的 sysname,就请使用--with-afs-sysname选项提供正确的 sysname。要在 linux 2.4 内核上编译,请使用下面的命令:
./configure --enable-transarc-paths --with-afs-sysname=i386_linux24。 - 运行
./make,然后运行./make dest。检查在编译过程中出现的错误。如果编译过程一切顺利,那么 afs 源代码树就可以使用了。现在,您需要准备一个开发目录 afsfuse。在这个目录中,创建另外两个目录:
- include 目录包括 openafs 和 fuse 的 include 目录的头文件。
- lib 目录包含 openafs 和 fuse 的库文件。
- 拷贝头文件和库文件。
首先从 openafs 目录中拷贝 afs 的头文件,方法是将 dest/i386_linux24/include 中的目录和文件全部拷贝到 include 目录中。然后将 fuse-2.2 目录中的 fuse 的 include 目录拷贝到这个目录中。对库文件也重复相同的步骤,将它们全部拷贝到 lib 目录中。
- 创建应用程序的结构。
对于这两组进程,您需要使用两组文件。使用命名规则 afsfuse_client.* 来命名客户机进程的文件;使用命名规则 afsfuse_server.* 来命名服务器进程的文件。
这样您就有了一个 afsfuse_client.c 文件,其中包含了 fuse 进程的代码;一个 afsfuse_server.c 文件,其中包含了在远程机器上运行的进程使用的服务器代码;一个 makefile;一个 rxgen 文件,用来创建 rpc 头文件(例如 afsfuse.xg)。
afsfuse_client.c 文件可以创建 afsfuse_client 进程代码, fuse 文件系统调用它来创建文件系统(使用 fuse-2.2/example/fusexmp.c 来创建这个文件)。
定义需要的函数
要使用 fuse 来创建一个文件系统,您需要声明一个 fuse_operations 类型的结构变量,并将其传递给 fuse_main 函数。fuse_operations 结构中有一个指针,指向在执行适当操作时需要调用的函数。清单 1 给出了 fuse_operations 结构。
清单 1. fuse_operation 结构中需要的函数
|
这些操作并非都是必需的,但是一个文件系统要想正常工作,就需要其中的很多函数。您可以实现一个具有特殊目的的 .flush、.release 或 .fsync 方法的功能完备的文件系统。(本文不会介绍任何 xattr 函数。)清单 1 中给出的函数如下所示:
getattr: int (*getattr) (const char *, struct stat *);
这个函数与stat()类似。st_dev和st_blksize域都可以忽略。st_ino域也会被忽略,除非在执行 mount 时指定了use_ino选项。readlink: int (*readlink) (const char *, char *, size_t);
这个函数会读取一个符号链接的目标。缓冲区应该是一个以 null 结束的字符串。缓冲区的大小参数包括这个 null 结束字符的空间。如果链接名太长,不能保存到缓冲区中,就应该被截断。成功时的返回值应该是 “0”。getdir: int (*getdir) (const char *, fuse_dirh_t, fuse_dirfil_t);
这个函数会读取一个目录中的内容。这个操作实际上是在一次调用中执行opendir()、readdir()、...、closedir()序列。对于每个目录项来说,都应该调用filldir()函数。mknod: int (*mknod) (const char *, mode_t, dev_t);
这个函数会创建一个文件节点。此处没有create()操作;mknod()会在创建非目录、非符号链接的节点时调用。mkdir: int (*mkdir) (const char *, mode_t);rmdir: int (*rmdir) (const char *);
这两个函数分别用来创建和删除一个目录。unlink: int (*unlink) (const char *);rename: int (*rename) (const char *, const char *);
这两个函数分别用来删除和重命名一个文件。symlink: int (*symlink) (const char *, const char *);
这个函数用来创建一个符号链接。link: int (*link) (const char *, const char *);
这个函数创建一个到文件的硬链接。chmod: int (*chmod) (const char *, mode_t);chown: int (*chown) (const char *, uid_t, gid_t);truncate: int (*truncate) (const char *, off_t);utime: int (*utime) (const char *, struct utimbuf *);
这 4 个函数分别用来修改文件的权限位、属主和用户、大小以及文件的访问/修改时间。open: int (*open) (const char *, struct fuse_file_info *);
这是文件的打开操作。对open()函数不能传递创建或截断标记(o_creat、o_excl、o_trunc)。这个函数应该检查是否允许执行给定的标记的操作。另外,open()也可能在fuse_file_info结构中返回任意的文件句柄,这会传递给所有的文件操作。read: int (*read) (const char *, char *, size_t, off_t, struct fuse_file_info *);
这个函数从一个打开文件中读取数据。除非碰到 eof 或出现错误,否则read()应该返回所请求的字节数的数据;否则,其余数据都会被替换成 0。一个例外是在执行 mount 命令时指定了direct_io选项,在这种情况中read()系统调用的返回值会影响这个操作的返回值。write: int (*write) (const char *, const char *, size_t, off_t, struct fuse_file_info *);
这个函数将数据写入一个打开的文件中。除非碰到 eof 或出现错误,否则write()应该返回所请求的字节数的数据。一个例外是在执行 mount 命令时指定了direct_io选项(这于read()操作的情况类似)。statfs: int (*statfs) (const char *, struct statfs *);
这个函数获取文件系统的统计信息。f_type和f_fsid域都会被忽略。flush: int (*flush) (const char *, struct fuse_file_info *);
这表示要刷新缓存数据。它并不等于fsync()函数 —— 也不是请求同步脏数据。每次对一个文件描述符执行close()函数时,都会调用flush();因此如果文件系统希望在close()中返回写错误,并且这个文件已经缓存了脏数据,那么此处就是回写数据并返回错误的好地方。由于很多应用程序都会忽略close()错误,因此这通常用处不大。
注意:我们也可以对一个 open() 多次调用 flush() 方法。如果由于调用了 dup()、dup2() 或 fork() 而产生多个文件描述符指向一个打开文件的情况,就可能会需要这种用法。我们无法确定哪个 flush 操作是最后一次操作,因此每个 flush 都应该同等地对待。多个写刷新序列相当罕见,因此这并不是什么问题。
release: int (*release) (const char *, struct fuse_file_info *);
这个函数释放一个打开文件。release()是在对一个打开文件没有其他引用时调用的 —— 此时所有的文件描述符都会被关闭,所有的内存映射都会被取消。对于每个open()调用来说,都必须有一个使用完全相同标记和文件描述符的release()调用。对一个文件打开多次是可能的,在这种情况中只会考虑最后一次 release,然后就不能再对这个文件执行更多的读/写操作了。release 的返回值会被忽略。fsync: int (*fsync) (const char *, int, struct fuse_file_info *);
这个函数用来同步文件内容。如果datasync参数为非 0,那么就只会刷新用户数据,而不会刷新元数据。setxattr: int (*setxattr) (const char *, const char *, const char *, size_t, int);getxattr: int (*getxattr) (const char *, const char *, char *, size_t);listxattr: int (*listxattr) (const char *, char *, size_t);removexattr: int (*removexattr) (const char *, const char *);
这些函数分别用来设置、获取、列出和删除扩展属性。
获得的文件系统
您的文件系统将如下所示:
|
afsfuse_client 会将传递给它的文件系统调用转发给另外一台机器上的 afsfuse_server。afsfuse_server 会对客户机传递给它的所有请求进行处理,并将结果返回给客户机。它会执行所有必需的工作。rpc 使用的机制是 rx。数据或原数据都不会涉及缓存的问题。
![]() ![]() |
![]()
|
定义 rx rpc 层
在继续之前,您需要先定义 rx rpc 层。要实现这种功能,请为 rxgen 创建一个 .xg 文件,用来描述代理和与 afsfuse_client.c 和 afsfuse_server.c 进行链接的桩代码。清单 2 显示了如何创建一个具有如下内容的 afsfuse.xg 文件:
清单 2. 创建 afsfuse.xg 文件
|
在定义 rx rpc 层时,注意以下几点:
- 在
statfs、stat和fuse_file_info基础上定义了mystatfs、mystat和my_file_info的封装程序。它们都会使用所生成的 xdr 代码进行转换。(xdr(external data representation,外部数据表示)允许采用一种与体系结构无关的方式进行封装,这样就可以在异构计算机系统之间传输数据了。) - 您几乎要为
fuse_operations结构的每个成员都定义一个函数,它们几乎具有相同的参数,因为 afsfuse_client 的工作就是负责接管 fuse 文件系统中的调用,并将这些调用传递给 afsfuse_server。 - 您已经硬编码了一些值,例如
mymaxpath,这应该从系统中获得 —— 硬编码是为了简单性起见而这样做的。
![]() ![]() |
![]()
|
创建客户机和存根文件
接下来使用 rxgen 编译 afsfuse.xg 文件,从而创建客户机和存根文件。从包含 afsfuse_server 和 afsfuse_client 的源代码的目录中,运行命令 openafs-1.2.13/i386_linux24/dest/bin/rxgen afsfuse.xg。这会创建以下文件:
- afsfuse.cs.c 是与 afsfuse_client.c 进行链接的客户机存根代码。
- afsfuse.h 是包含您的 fuse rx 代码的各种定义的头文件。
- afsfuse.ss.c 是与 afsfuse_server 代码进行链接的服务器存根代码(代理代码)。
- afsfuse.xdr.c 包含了用来处理在 afsfuse.xg 中定义的 3 个结构所使用的代码。
现在为 afsfuse_client.c 和 afsfuse_server.c 添加一些执行实际工作的代码。大部分调用都如下所示:
our_call_in_afs_fuse_client()。分析参数并准备执行 rpc。对 rx [rpc] 调用 afsfuse_server。组合参数。将这些值拷贝到传递给这个函数的行参数中。our_call_in_afs_fuse_server()。组合参数。调用本地文件系统或 afs 特有的函数。分析参数准备执行 rpc。生成 rx rpc 调用。
afsfuse_client.c 调用如下所示:
|
afsfuse_server.c 调用如下所示:
清单 3. afsfuse_server.c 调用
|
简单地,您可以在其他函数中添加代码来对文件系统进行增强。
您需要创建一个 makefile 来编译代码。记住在编译 afsfuse_client 的代码时包括以下选项:-d_file_offset_bits=64 和 -dfuse_use_version=22。
清单 4. 生成编译客户机代码使用的 makefile
|
记住,您仍然需要使用 librx.a 和 liblwp.a 链接到 rx 和 rx 使用的 lwp 代码上。fuse/fuse.o、fuse/helper.o 和 fuse/mount.o 都是代码需要链接的 fuse 库。
![]() ![]() |
![]()
|
结束语
在本文中,您已经学习了如何安装 fuse 和 openafs,以及如何使用它们来创建并定制自己的用户空间文件系统,它可以成为 linux 中一个功能完备、稳定可靠的文件系统,这不需要对现有内核打任何补丁或重新编译 —— 您甚至都不需要成为内核模块程序员。您已经详细了解了启用 fuse 文件系统的两个关键概念:如何安装和配置 fuse 内核模块,以及如何充分利用 fuse 库和 api 的功能。
![]() ![]() |
![]()
|
下载
| 描述 | 名字 | 大小 | 下载方法 |
|---|---|---|---|
| afsfuse filesystem sample code | l-fuse.zip | 9kb | http |
![]() | ||||
![]() | 关于下载方法的信息 | ![]() | ![]() | get adobe® reader® |
![]() ![]() |
![]()
|
参考资料
学习- 您可以参阅本文在 developerworks 全球站点上的 英文原文。
- 有关使用 fuse 的例子,请参阅 richard jones' gmail filesystem hack page,它对 google gmail 进行了详细的介绍和剖析。
- 请阅读这篇有关 implementing fuse 的介绍性文章。
- “高级文件系统实现者指南”(developerworks)是一系列可以帮助您成为文件系统专家的文章。
- “管理处理器的亲和性(affinity)”(developerworks,2005 年 9 月)介绍了如何编写更好的用户空间的应用程序。
- “openafs 帮助聚集分布式数据”(developerworks,2005 年 5 月)提出了一种观点,认为 openafs 是 nfs 的下一代继承者。这真是一个有创意的想法。
- 在 developerworks linux 专区 中可以找到为 linux 开发人员准备的更多资源。
- 跟踪 developerworks 技术事件和 webcasts 的最新进展。
获得产品和技术
- 请下载 fuse 源代码。
- fuse 主页 上有下载、faq 和 wiki、邮件列表、使用 fuse 的文件系统清单 以及操作系统和支持 fuse 的操作系统的清单。
- fuse-j provides java bindings for fuse 以及它提供的 “概念性” zip 文件系统看起来相当稳定。
- 订购免费的 sek for linux,这有两张 dvd,包括最新的 ibm for linux 的试用软件,包括 db2®、lotus®、rational®、tivoli® 和 websphere®。
- 在您的下一个开发项目中采用 ibm 试用软件,这可以从 developerworks 上直接下载。





闽公网安备 35060202000074号