Jcode
日本語文字集合を扱う
use Jcode;
パッケージをロードする。
my $j = jcode($str,$icode);
$strを設定したインスタンスを生成する。$j = Jcode->new($str,$icode)でも同じ。
$icodeには、入力文字集合名を指定する。sjis, euc, jis, ucs2, utf8 のいずれか。
省略すると文字セットが自動判定される。
$j->set($str,$icode);
$strを設定する。インスタンスを繰り返し使う場合に使用する。
$j->append($str,$icode);
内部文字列に$strを加える。
文字列のエンコード
my $sjis = $j->sjis;
my $euc = $j->euc;
my $jis =
$j->jis;
my $ucs2 = $j->ucs2;
my $utf8 = $j->utf8; ※use
utf8 でもutf8フラグは付かない
my $mime_header = $j->mime_encode($lf, $bpl);
MIMEヘッダ用のBエンコードしたISO-2022-JP文字列を返す。
$lf : 改行コード。デフォルトは\n。
$bpl:折り返しバイト数。デフォルトは76。
my $mime_header = $j->MIME_Header;
MIMEヘッダ用のBエンコードしたUTF8文字列を返す。
my $j2 = $j->mime_decode;
MIMEヘッダ用のBデコードしたオブジェクトを返す。$j->mime_decode->utf8
などの記述ができる。
$j->h2z;
内部文字列を半角→全角変換したオブジェクトを返す。$j->h2z->sjis などの記述ができる。
$j->z2h;
内部文字列を全角→半角変換したオブジェクトを返す。$j->z2h->jis などの記述ができる。
$j->tr($from, $to, $opt);
tr/$from/$to/を適用したオブジェクトを返します。
$fromと$toは、EUC-JPの文字列です。Perl 5.8.1以降では、flag付きのUTF-8文字列も受け付けます。
$optをセットすると、tr/$from/$to/$optが適用されます。$optは 'c'、'd'あるいはそれらの組み合わせでなければなりません。
$j->s($patter, $replace, $opt);
s/$pattern/$replace/$optを適用したオブジェクトを返します。
$patternと$replaceは、EUC-JPの文字列です。Perl 5.8.1以降では、flag付きのUTF-8文字列も受け付けます。
$optは正規表現オプションと同じです。
@match = $j->m($pattern, $opt);
m/$patter/$optを適用してマッチした文字列を返します。このメソッドは”オブジェクトを返しません”。
$replaceは、EUC-JPの文字列です。Perl 5.8.1以降では、flag付きのUTF-8文字列も受け付けます。
$optは正規表現オプションと同じです。