syscall(2) 間接システムコール

書式

#define _GNU_SOURCE /* feature_test_macros(7) 参照 */
#include <unistd.h>
#include <sys/syscall.h> /* SYS_xxx の定義用 */
int syscall(int number, ...);

説明

syscall() は、システムコールを起動する小さなライブラリ関数で、 number で指定されたアセンブリ言語インターフェースのシステムコールを、指定された引き数をつけて実行する。 syscall() が役に立つのは、例えば C ライブラリにラッパー関数が存在しないシステムコールを呼び出したい場合である。

syscall() は、システムコールを行う前に CPU レジスタを保存し、システムコールから返った際にレジスタを復元し、エラーが発生した場合はシステムコールが返したエラーコードを errno(3) に格納する。

システムコールのシンボル定数は、ヘッダファイル <sys/syscall.h> に書かれている。

返り値

返り値は呼び出されたシステムコールによって定義される。 一般に、返り値 0 は成功を表す。 -1 はエラーを表し、エラーコードは errno に入れられる。

注意

syscall() は 4BSD で最初に登場した。

アーキテクチャ固有の要件

各アーキテクチャの ABI には、 システムコールの引き数のカーネルへの渡し方に関する独自の要件がある。 (ほとんどのシステムコールのように) glibc ラッパー関数があるシステムコールでは、 glibc が詳細を処理し、アーキテクチャに応じた方法で引き数が適切なレジスタにコピーされる。 しかし、 システムコールを呼び出すのに syscall() を使う場合には、 呼び出し側でアーキテクチャ依存の詳細を処理しなければならない場合がある。 これはいくつかの 32 ビットアーキテクチャでは非常によくあることだ。

例えば、ARM アーキテクチャの Embedded ABI (EABI) では、 (long long などの) 64 ビット値は偶数番地のレジスタのペアに境界があっていなければならない。したがって、 glibc が提供するラッパー関数ではなく syscall() を使う場合には、 readahead() システムコールは ARM アーキテクチャの EABI では以下のようにして起動されることになる。

syscall(SYS_readahead, fd, 0,
        (unsigned int) (offset >> 32),
        (unsigned int) (offset & 0xFFFFFFFF),
        count);

オフセット引き数は 64 ビットで、最初の引き数 (fd) は r0 で渡されるので、呼び出し側では手動で 64 ビット値を分割して境界を合わせて、 64 ビット値が r2/r3 レジスタペアで渡されるようにしなければならない。このため、 r1 (2 番目の引数 0) としてダミー値を挿入している。

同様のことが、 MIPS の O32 ABI、 PowerPC の 32 ビット ABI や Xtensa でも起こりうる。

次のシステムコールに影響がある: fadvise64_64(2), ftruncate64(2), posix_fadvise(2), pread64(2), pwrite64(2), readahead(2), sync_file_range(2), truncate64(2)

アーキテクチャ毎の呼び出し規約

各アーキテクチャには、それぞれ独自のシステムコール起動方法とカーネルへの引き数の渡し方がある。 各種のアーキテクチャの詳細を以下の 2 つの表にまとめる。

最初の表は、 カーネルモードに遷移するのに使用される命令、 システムコール番号を示すのに使用されるレジスタ、 システムコールの結果を返すのに使用されるレジスタの一覧である (なお、 ここに載っているカーネルモードに遷移するのに使用される命令は、 カーネルモードに遷移する最速や最善の方法でない場合もあるので、 vdso(7) を参照する必要があるかもしれない)。

arch/ABIinstruction syscall #retval Notes

arm/OABIswi NR -a1 NR はシステムコール番号
arm/EABIswi 0x0 r7r0 
blackfinexcpt 0x0 P0R0 
i386int $0x80 eaxeax 
ia64break 0x100000 r15r10/r8  真偽値のエラー/
エラー値
pariscble 0x100(%sr2, %r0) r20r28 
s390svc 0 r1r2 下記参照
s390svc 0 r1r2 下記参照
sparc/32t 0x10 g1o0 
sparc/64t 0x6d g1o0 
x86_64syscall raxrax 

s390 と s390x では、 NR (システムコール番号) が 256 未満の場合 "svc NR" で NR が直接渡される場合がある。

2 つ目の表は、システムコールの引き数を渡すのに使用されるレジスタの一覧である。

arch/ABIarg1arg2arg3arg4arg5arg6arg7

arm/OABIa1a2a3a4v1v2v3
arm/EABIr0r1r2r3r4r5r6
blackfinR0R1R2R3R4R5-
i386ebxecxedxesiediebp-
ia64out0out1out2out3out4out5-
pariscr26r25r24r23r22r21-
s390r2r3r4r5r6r7-
s390xr2r3r4r5r6r7-
sparc/32o0o1o2o3o4o5-
sparc/64o0o1o2o3o4o5-
x86_64rdirsirdxr10r8r9-

これらの表にはすべての呼び出し規約が記載されているわけではない点に注意すること --- アーキテクチャによっては、ここに記載されていない他のレジスタが見境なく上書きされる場合もある。

#define _GNU_SOURCE
#include <unistd.h>
#include <sys/syscall.h>
#include <sys/types.h>
#include <signal.h>
int
main(int argc, char *argv[])
{
    pid_t tid;
    tid = syscall(SYS_gettid);
    tid = syscall(SYS_tgkill, getpid(), tid, SIGHUP);
}

この文書について

この man ページは Linux man-pages プロジェクトのリリース 3.65 の一部 である。プロジェクトの説明とバグ報告に関する情報は http://www.kernel.org/doc/man-pages/ に書かれている。