perlで日本語処理

この間、「テキストマイニングをするので」と、日本語の文章切り出しを頼まれたので、久しぶりにActive perlをインストールした。
難しいことではないが、毎回調べ直すのが面倒なので、ここに記録。

# はじめの方に書くおまじないだと思ってよし。
# 内部はUTF8、外はShift-JISだという意味。
use utf8;
binmode STDIN, “:encoding(cp932)”;
binmode STDOUT, “:encoding(cp932)”;

# 入力ファイルをオープンした時
# 入力するファイルをShift-JISから変換するという意味。
open(FILE, $filename . $dirname) or die “$dirname: $!”;
binmode FILE, “:encoding(cp932)”;

# 出力ファイルをオープンした時
# ファイルに出力するとき、Shift-JISに変換せよという意味。
open(OFILE, “>” , “out.txt”);
binmode OFILE, “:encoding(cp932)”;

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です