書式
エンコーディング:
bzz -e[blocksize] inputfile outputfileデコーディング:
bzz -d inputfile outputfile
説明
最初の書式では (オプション -e ) inputfile に指定したファイルを圧縮して、 outputfile にファイルを書き込みます。 二番目の書式では (オプション -d ) inputfile に指定したファイルをデコードして、 outputfile にファイルを書き込みます。
オプション
- -d
- デコードモード。
- -e[blocksize]
-
エンコードモード。
オプションの引数
blocksize
は Burrows-Wheeler 変換が使用するファイルのブロック数をキロバイト単位で指定します。
デフォルト値は 2048
KB
です。
最大ブロックサイズは 4096
KB
です。
大きいブロックサイズを指定すると圧縮比率が高くなり、エンコーダおよびデコーダ
のメモリ消費量が増大します。入力ファイルのサイズより大きなブロックサイズを
指定することはできません。
アルゴリズム
Burrows-Wheeler 変換は Karp-Miller-Rosenberg および Bentley-Sedgewick アルゴリズム とのコンビネーションで動作します。これは (Sadakane, DCC 98) に少しフレキシブルな ランキングスキームを加えたものに相当します。シンボルは発生頻度の推定値に基づいて 序列化されます。シンボルのランクはシンプルな固定のツリー構造と ZP バイナリアダプティブ コーダ (Bottou, DCC 98) を使用して符号化されます。Burrows-Wheeler 変換は有名な圧縮プログラム bzip2 でも使用されています。 bzz の特徴は ZP アダプティブコーダを使用していることです。 アダプテーションノイズは最大 5 程度ですが、アダプテーションの 利点で相殺できる程度のものです。
パフォーマンス
以下の表は Canterbury Corpus ( http://corpus.canterbury.ac.nz ) での比較結果 (1 文字あたりのビット数) です。 excl のスプレッドシートファイルでの bzz のパフォーマンスが非常に良いため、 fsmx のようなかなり洗練された圧縮ソフトよりも優れた加重平均値を示します。
|
エントリーされているプログラムのいくつかは DjVu の協力者が作成したものです。 プログラム compress は Joe Orost が作成しました。 プログラム ppmd は、 Paul Howard が発明した
PPM-C メソッドを改良したものです。
クレジット
プログラム bzz は Léon Bottou <[email protected]> が開発し、 Andrei Erofeev <[email protected]> および Bill Riemers <[email protected]> その他の方々により改良されました。 この man page は Nobchika Morimoto <[email protected]> が翻訳しました。