Perl初心者スレ(マジレス回答) (523レス)
Perl初心者スレ(マジレス回答) http://mevius.5ch.net/test/read.cgi/tech/1349538519/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
448: デフォルトの名無しさん [sage] 2018/11/11(日) 18:17:18.70 ID:t5AG7sJB たぶんそれだな。$line の中身が "テスト\r\n" または "テスト\n" になってそう。 http://mevius.5ch.net/test/read.cgi/tech/1349538519/448
449: デフォルトの名無しさん [sage] 2018/11/12(月) 00:16:54.10 ID:MtlIUxHY chomp($line); するべき http://mevius.5ch.net/test/read.cgi/tech/1349538519/449
450: デフォルトの名無しさん [] 2018/11/12(月) 07:45:13.53 ID:8fj5l105 遅くなりすみません。 テストファイルには改行を入れていなかったのですが、 chompが必要なのですね。 ファイルからレコードを取得するにはchompが必要と勉強になりました。 ありがとうございました。 http://mevius.5ch.net/test/read.cgi/tech/1349538519/450
451: デフォルトの名無しさん [] 2018/11/12(月) 09:22:08.61 ID:I5PkaEyl >>450 いや、改行は入っていると思うぞ。でなければあのプログラムでは一致する。 http://mevius.5ch.net/test/read.cgi/tech/1349538519/451
452: デフォルトの名無しさん [sage] 2018/11/13(火) 17:15:58.77 ID:WOZg75XW utf-8がボムがついている可能性もあるね http://mevius.5ch.net/test/read.cgi/tech/1349538519/452
453: デフォルトの名無しさん [] 2018/11/13(火) 17:46:33.84 ID:/6RlnNZj ところでUTF-8にBOMってなんか意味あるの? ビッグエンディアンで上のビットから詰め込んで並べている1パターンしかないよね? http://mevius.5ch.net/test/read.cgi/tech/1349538519/453
454: デフォルトの名無しさん [sage] 2018/11/13(火) 18:09:12.36 ID:3HdfrOce >>453 あるよ、BOMがあればUTF-8だと文字コードを 簡単に判定できる つまり、文字化け防止に役立つ みんなBOM付けるようにすれば良かったんだけどな http://mevius.5ch.net/test/read.cgi/tech/1349538519/454
455: デフォルトの名無しさん [] 2018/11/13(火) 19:44:37.81 ID:/6RlnNZj あー。magic用か。 http://mevius.5ch.net/test/read.cgi/tech/1349538519/455
456: デフォルトの名無しさん [sage] 2018/11/14(水) 00:34:48.87 ID:efwoHdbt >>450 ですが、改行が入っていました。 遅くなりすみません。 すみませんでした。確認をしっかりします。 もう一つ質問があるのですが、>>450の環境にて、パターンマッチングを、全角、半角、ひらがな、カタカナ、大文字、小文字を区別することなく行いたいのですが、方法をご教示いただけますでしょうか。 http://mevius.5ch.net/test/read.cgi/tech/1349538519/456
457: デフォルトの名無しさん [] 2018/11/14(水) 09:45:09.68 ID:bDqFuzUS >>456 手順としてはまず比較に都合のいいように比較する側とされる側の文字列を正規化する。 例えば半角は全て全角にし、濁点や半濁点はそれを含んだ文字にし、英小文字は大文字にする。 それから比較を行う。 ただし使われている文字がASCIIの文字だけならば // のオプションで i が使えるので正規化不要。 http://mevius.5ch.net/test/read.cgi/tech/1349538519/457
458: デフォルトの名無しさん [sage] 2018/11/14(水) 12:24:46.73 ID:XfG22Q3S 教えて下さい。 my @str4=['a','b','c','d','e']; my $ref4=\@str4; print $str4[0][1],"\n"; # b print @{ $str4[0] },"\n"; # abcde ref4を使って同様に b と abcde を表示するには、どうしたらいいですか? http://mevius.5ch.net/test/read.cgi/tech/1349538519/458
459: デフォルトの名無しさん [sage] 2018/11/14(水) 12:38:11.11 ID:XfG22Q3S うっかり自己解決しました。数時間悩んだのに。 print @{ ${ $ref4 }[0] }; print @{ ${ $ref4 }[0] }[1]; http://mevius.5ch.net/test/read.cgi/tech/1349538519/459
460: デフォルトの名無しさん [sage] 2018/11/14(水) 19:36:24.69 ID:dXHPcciK >>457 オプションで可能であればと思ったのですが、マッチング文字列と対象を同じ文字種にしないといけないんですね。 ActivePerlでUnicode::Japanese でUTF8から変換して書いてみたのですが、cp932にencodeすると、化けてしまい、使用できませんでした。 ActivePerlで使用可能なモジュールあればコードではなくてかまいませんので、何かあれば紹介してもらえますでしょうか。 http://mevius.5ch.net/test/read.cgi/tech/1349538519/460
461: デフォルトの名無しさん [] 2018/11/14(水) 20:41:47.52 ID:bryEJhFF UNICODEにはcomposed、decomposedというややこしいものもあるんだよね。 https://pointoht.ti-da.net/e8205606.html Unicode::Normalizeってのがあるけど、日本語を特別扱いしてくれたりはしなさそうな予感。 http://mevius.5ch.net/test/read.cgi/tech/1349538519/461
462: デフォルトの名無しさん [sage] 2018/11/14(水) 22:57:23.73 ID:otO/yyOk >>453-455 Linux では、BOM なしUTF-8 を使う、アプリ開発者が多く、 BOMありにするとバグるアプリがあるから、BOMなしを使っているけど、 そうすると、Windows では、sjis と区別がつかなくなり、 Explorer での文字列検索ができなくなる だから、Windows10 で、WSL, Ubuntu を導入して、grep を使っている http://mevius.5ch.net/test/read.cgi/tech/1349538519/462
463: 462 [sage] 2018/11/14(水) 23:51:54.30 ID:otO/yyOk 結合文字列をUnicode正規化で合成する方法の危険性 https://qiita.com/monokano/items/d4c37d9bc9833eaeda6e 濁点・半濁点を別の1文字として扱う、結合文字列はMac だけだから、Mac を使わないなら関係ない Unicode正規化は、日中韓で、別の漢字に変換されるものがあるから使えない Ruby では、sjis・UTF-8 の変換は、ファイル読み書き時に指定できる。 CRLF・LF の改行コードの違いは、意識したことがない。 chomp とか、どちらの改行コードでも、正常に動く http://mevius.5ch.net/test/read.cgi/tech/1349538519/463
464: 462 [sage] 2018/11/15(木) 00:11:38.19 ID:g74yzjtM 【 nkf 】コマンド――文字コードと改行コードを変換する http://www.atmarkit.co.jp/ait/articles/1609/29/news016.html これで全角・半角の変換もできる Perl にも、モジュールもあるのでは? http://mevius.5ch.net/test/read.cgi/tech/1349538519/464
465: デフォルトの名無しさん [sage] 2018/11/21(水) 22:55:48.65 ID:M0TZNmLm >>464 有料ですがnkfのActivePerl用をnamazuというところから購入しましたが、 nkfで変換後、utf8でマッチングが不可能で調査中です。 http://mevius.5ch.net/test/read.cgi/tech/1349538519/465
466: デフォルトの名無しさん [sage] 2018/11/21(水) 23:00:44.11 ID:M0TZNmLm ハッシュを要素に持つハッシュへのアクセスについて ご教示いただけますでしょうか。 下記のコードで、読込は正常に完了しますが、出力が不可能です。 $$を使用したり、試しましたがギブアップです。 #hash.txtの中身(タブ区切り) #1 10 テスト1 #2 5 テスト2 use Encode; use utf8; my %table; my %rec; open (FILE, "<:utf8", "hash.txt") or (die "$!"); while(my $line = <FILE>){ chomp($line); @d = split(/\t/, $line); %rec = ('id' => $d[0], 'count' => $d[1], 'name' => $d[2]); $table{$d[0]} = \%rec; print encode('cp932', $table{$d[0]}{'id'})."\t". encode('cp932', $table{$d[0]}{'count'})."\t".encode('cp932', $table{$d[0]}{'name'})."\n"; } close(FILE); print Encode::encode('cp932', "読込完了\n"); foreach my $row (@$wrote_num){ #出力不可能 print encode('cp932', $row{'id'})."\t". encode('cp932', $row{'count'})."\t".encode('cp932', $row{'name'})."\n"; } print Encode::encode('cp932', "$出力完了\n"); http://mevius.5ch.net/test/read.cgi/tech/1349538519/466
467: デフォルトの名無しさん [sage] 2018/11/22(木) 00:04:25.39 ID:V9xGGA7p wrote_numが何か分からんけど my %rec; はwhile内にしたらどうですか あと、$rowはハッシュのリファレンスだろうから$row->{'id'}では http://mevius.5ch.net/test/read.cgi/tech/1349538519/467
468: デフォルトの名無しさん [sage] 2018/11/22(木) 10:12:03.32 ID:iCX1SQ90 >>467 すみません、レス用に書き換えた元がwote_numでした 下記の様に変えましたが、アクセスできません。 意外と難しいですね。 use Encode; use utf8; my %table; open (FILE, "<:utf8", "hash.txt") or (die "$!"); while(my $line = <FILE>){ chomp($line); @d = split(/\t/, $line); my %rec = ('id' => $d[0], 'count' => $d[1], 'name' => $d[2]); $table{$d[0]} = \%rec; print encode('cp932', $table{$d[0]}{'id'})."\t". encode('cp932', $table{$d[0]}{'count'})."\t".encode('cp932', $table{$d[0]}{'name'})."\n"; } close(FILE); print Encode::encode('cp932', "読込完了\n"); foreach my $row (@$table){ print encode('cp932', $row->{'id'})."\t". encode('cp932', $row->{'count'})."\t".encode('cp932', $row->{'name'})."\n"; } print Encode::encode('cp932', "$出力完了\n"); 実行結果:まだアクセスできません >hash_test.pl 1 10 テスト1 2 5 テスト2 読込完了 出力完了 http://mevius.5ch.net/test/read.cgi/tech/1349538519/468
469: デフォルトの名無しさん [sage] 2018/11/22(木) 10:30:19.76 ID:Enb78Zev これでいけると思いましたが、玉砕でしたw foreach my $row (@$table){ while (my ($id, $count, $name) = each(%row)){ print encode('cp932', "$id\t$count\t$name\n"); } http://mevius.5ch.net/test/read.cgi/tech/1349538519/469
470: デフォルトの名無しさん [sage] 2018/11/22(木) 10:54:51.08 ID:iCX1SQ90 これでいけました! foreach my $row (keys %table){ print encode('cp932', "$table{$row}{'id'}\t$table{$row}{'count'}\t$table{$row}{'name'}\n"); } >hash_test.pl 1 10 テスト1 2 5 テスト2 読込完了 1 10 テスト1 2 5 テスト2 出力完了 ただ、key を外して foreach my $row (%table)とすると下記の通り改行が入ります 1 10 テスト1 2 5 テスト2 出力完了 http://mevius.5ch.net/test/read.cgi/tech/1349538519/470
471: デフォルトの名無しさん [sage] 2018/11/22(木) 11:07:56.03 ID:Enb78Zev これで全てのハッシュ要素を出力できますが、 カラム順が不確定になってしまいますね。 ハッシュなので仕方ないことですかね。 foreach $row (sort keys %table) { foreach $col (sort keys %{$table{$row}}) { print encode('cp932', "$table{$row}{$col}\t"); } print "\n"; } >hash_test.pl 1 10 テスト1 2 5 テスト2 読込完了 5 2 テスト2 10 1 テスト1 出力完了 http://mevius.5ch.net/test/read.cgi/tech/1349538519/471
472: デフォルトの名無しさん [] 2018/11/22(木) 12:53:27.47 ID:+z2Jd1go >>471 キーだけ別の配列に取っといてそれ使えば? http://mevius.5ch.net/test/read.cgi/tech/1349538519/472
473: デフォルトの名無しさん [sage] 2018/11/25(日) 19:58:05.78 ID:Ngr2zrFy >>472 できれば要素をカラム名でアクセスしたいのでハッシュの方がいいのですが、カラム順固定出力は配列しかないということですね。 http://mevius.5ch.net/test/read.cgi/tech/1349538519/473
474: デフォルトの名無しさん [sage] 2018/11/25(日) 21:54:59.45 ID:CqrOufwt 両方使えば良いのでは たまにやるよ http://mevius.5ch.net/test/read.cgi/tech/1349538519/474
475: デフォルトの名無しさん [sage] 2018/11/26(月) 04:07:41.06 ID:LFi/GsCA >>471 foreach $col (sort keys %{$table{$row}}) { を foreach $col (qw/id count name/) { とかでは? keyの名前も順番も分かってるんだし。 http://mevius.5ch.net/test/read.cgi/tech/1349538519/475
476: デフォルトの名無しさん [sage] 2019/06/24(月) 04:43:33.88 ID:4+LiJo6+ 自分が昔質問したことにたいして今なら回答できる <> は <STDIN> の単なる略ではなく @ARGV が捕れない副作用があった そこに詰まっていた #!/usr/bin/env perl use 5.010; if (-p STDIN) { print "May be pipe is used. I've got STDIN as below\n"; # my @lines = <STDIN>; # when <> used, perl think no @ARGV map {state $i; ++$i;print "$i $_" } <STDIN>; } else { print "This may be just single running.\n"; } map {state $i; ++$i; print "$i argment found ==> $_\n"} @ARGV; http://mevius.5ch.net/test/read.cgi/tech/1349538519/476
477: デフォルトの名無しさん [sage] 2019/08/29(木) 20:58:11.72 ID:72vdfcsY タグを除去したいのですが、<>も文に入っているため <.*?>ではなく<("[^"]*"|'[^']*'|[^'">])*>を使いたいのですが perl -pe '<("[^"]*"|'[^']*'|[^'">])*>' にする場合どれどれをエスケープすればよいでしょうか? ’だけだと動きませんでした。 perl -pe '<("[^"]*"|\'[^\']*\'|[^'">])*>' http://mevius.5ch.net/test/read.cgi/tech/1349538519/477
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 46 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.007s