Perl 5 再入門

人生において一体何度 Perl に入門したのだろうか。何度勉強しても次に必要になるときにはすっかり忘れている。記憶に残らないのは他の言語とは違い独特であることと一貫性がないからだろう。次に再入門するのがいつになるかはわからないが、いつかその日が来ることだけは間違いないだろう。

ドキュメント

list と array

list と array は似て非なるもの。意図的に似せているのだろうし、自動的に変換されるので違いに気づきにくい。

array は Perl のデータ構造の一つであり、スカラーのみを保持する。

list は代入や関数呼び出しの実引数などプログラム上では存在するが Perl のデータ構造は存在しない。スカラーのみではなく push(@x, $f); のように array も要素となる。

scalar context で評価すると list は最後の要素の値となり、 array は要素数となる。

$x = (4, 5); # 5
$x = @{[4, 5]}; # 2

lexical variable

my ($x, @x, %x);

3種類あるのが特異だが、それぞれ別個の変数である。 lexical variable には *x のような typeglob はない。代入されていない場合はそれぞれ undef, 空の array, 空の hash で初期化される。

一般的には @x は array の入れ物として説明されるが、別の考え方として内部的には array の reference の入れ物で @ は array の reference を dereference するものと考えたほうが一貫性があり、理解しやすい場合がある。 \@x はその内部的な array の reference そのものである。 typeglob とも一貫する。例えば次のコードを考える。

for (keys %y) {
    my @x;
	(...)
    $y{$_} = \@x;
}

ループの毎に @x は新しい空の array で初期化される。では \@x はループの毎に同じか違うか。答えはループ毎に違うものになるである。 @x が array の入れ物であると考えると、それへの reference は毎度同じなるようにも思える。 @x が array の reference の入れ物でそれを dereference したものと、そして \@x がその reference と考えると、ループ毎に違う reference になるのが理解しやすい。

Autovivification

undef を array や hash として dereference すると自動的に空の array や hash の reference が代入される。

my ($x, %y);
@$x = (1, 2, 3);
@{$y{rose}} = (4, 5, 6);

ただし、以下と同等なのでこちらのほうが素直である。

my ($x, %y);
$x = [1, 2, 3];
$y{rose} = [4, 5, 6];

Typeglob

use strict; では global symbol の変数は定義できないし、 Perl 5 では typeglob を使うことはほぼないだろう。

global な symbol table の entry が typeglob である。 typeglob は連想配列で以下のキーを持ち、それらの値としてスカラーやリファレンスを持つ。

SCALAR (スカラー $)
ARRAY (配列 @)
HASH (ハッシュ %)
CODE (コード &)
GLOB (型グロブ *)
IO (ファイルハンドル)

typeglob のなかに GLOB があるのは混乱を招くが Advanced Perl Programming のFigure 20.6: Glob value structureには GLOB は存在していないので、内部的には存在しないのだろう。

global symbol において @rose は @{*rose{ARRAY}} と同じであり、 \@rose は *rose{ARRAY} と同じである。

以下の２つは似ているがやっていることは違うので注意が必要。

# lily と rose が lily の typeglob が指すようになる
*rose = *lily

# rose の CODE のみ書き換わる
*rose = \&lily;