この間、「テキストマイニングをするので」と、日本語の文章切り出しを頼まれたので、久しぶりにActive perlをインストールした。
難しいことではないが、毎回調べ直すのが面倒なので、ここに記録。
# はじめの方に書くおまじないだと思ってよし。
# 内部はUTF8、外はShift-JISだという意味。
use utf8;
binmode STDIN, “:encoding(cp932)”;
binmode STDOUT, “:encoding(cp932)”;
# 入力ファイルをオープンした時
# 入力するファイルをShift-JISから変換するという意味。
open(FILE, $filename . $dirname) or die “$dirname: $!”;
binmode FILE, “:encoding(cp932)”;
# 出力ファイルをオープンした時
# ファイルに出力するとき、Shift-JISに変換せよという意味。
open(OFILE, “>” , “out.txt”);
binmode OFILE, “:encoding(cp932)”;