Perl初心者スレ(マジレス回答) (523レス)
Perl初心者スレ(マジレス回答) http://mevius.5ch.net/test/read.cgi/tech/1349538519/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
460: デフォルトの名無しさん [sage] 2018/11/14(水) 19:36:24.69 ID:dXHPcciK >>457 オプションで可能であればと思ったのですが、マッチング文字列と対象を同じ文字種にしないといけないんですね。 ActivePerlでUnicode::Japanese でUTF8から変換して書いてみたのですが、cp932にencodeすると、化けてしまい、使用できませんでした。 ActivePerlで使用可能なモジュールあればコードではなくてかまいませんので、何かあれば紹介してもらえますでしょうか。 http://mevius.5ch.net/test/read.cgi/tech/1349538519/460
461: デフォルトの名無しさん [] 2018/11/14(水) 20:41:47.52 ID:bryEJhFF UNICODEにはcomposed、decomposedというややこしいものもあるんだよね。 https://pointoht.ti-da.net/e8205606.html Unicode::Normalizeってのがあるけど、日本語を特別扱いしてくれたりはしなさそうな予感。 http://mevius.5ch.net/test/read.cgi/tech/1349538519/461
462: デフォルトの名無しさん [sage] 2018/11/14(水) 22:57:23.73 ID:otO/yyOk >>453-455 Linux では、BOM なしUTF-8 を使う、アプリ開発者が多く、 BOMありにするとバグるアプリがあるから、BOMなしを使っているけど、 そうすると、Windows では、sjis と区別がつかなくなり、 Explorer での文字列検索ができなくなる だから、Windows10 で、WSL, Ubuntu を導入して、grep を使っている http://mevius.5ch.net/test/read.cgi/tech/1349538519/462
463: 462 [sage] 2018/11/14(水) 23:51:54.30 ID:otO/yyOk 結合文字列をUnicode正規化で合成する方法の危険性 https://qiita.com/monokano/items/d4c37d9bc9833eaeda6e 濁点・半濁点を別の1文字として扱う、結合文字列はMac だけだから、Mac を使わないなら関係ない Unicode正規化は、日中韓で、別の漢字に変換されるものがあるから使えない Ruby では、sjis・UTF-8 の変換は、ファイル読み書き時に指定できる。 CRLF・LF の改行コードの違いは、意識したことがない。 chomp とか、どちらの改行コードでも、正常に動く http://mevius.5ch.net/test/read.cgi/tech/1349538519/463
464: 462 [sage] 2018/11/15(木) 00:11:38.19 ID:g74yzjtM 【 nkf 】コマンド――文字コードと改行コードを変換する http://www.atmarkit.co.jp/ait/articles/1609/29/news016.html これで全角・半角の変換もできる Perl にも、モジュールもあるのでは? http://mevius.5ch.net/test/read.cgi/tech/1349538519/464
465: デフォルトの名無しさん [sage] 2018/11/21(水) 22:55:48.65 ID:M0TZNmLm >>464 有料ですがnkfのActivePerl用をnamazuというところから購入しましたが、 nkfで変換後、utf8でマッチングが不可能で調査中です。 http://mevius.5ch.net/test/read.cgi/tech/1349538519/465
466: デフォルトの名無しさん [sage] 2018/11/21(水) 23:00:44.11 ID:M0TZNmLm ハッシュを要素に持つハッシュへのアクセスについて ご教示いただけますでしょうか。 下記のコードで、読込は正常に完了しますが、出力が不可能です。 $$を使用したり、試しましたがギブアップです。 #hash.txtの中身(タブ区切り) #1 10 テスト1 #2 5 テスト2 use Encode; use utf8; my %table; my %rec; open (FILE, "<:utf8", "hash.txt") or (die "$!"); while(my $line = <FILE>){ chomp($line); @d = split(/\t/, $line); %rec = ('id' => $d[0], 'count' => $d[1], 'name' => $d[2]); $table{$d[0]} = \%rec; print encode('cp932', $table{$d[0]}{'id'})."\t". encode('cp932', $table{$d[0]}{'count'})."\t".encode('cp932', $table{$d[0]}{'name'})."\n"; } close(FILE); print Encode::encode('cp932', "読込完了\n"); foreach my $row (@$wrote_num){ #出力不可能 print encode('cp932', $row{'id'})."\t". encode('cp932', $row{'count'})."\t".encode('cp932', $row{'name'})."\n"; } print Encode::encode('cp932', "$出力完了\n"); http://mevius.5ch.net/test/read.cgi/tech/1349538519/466
467: デフォルトの名無しさん [sage] 2018/11/22(木) 00:04:25.39 ID:V9xGGA7p wrote_numが何か分からんけど my %rec; はwhile内にしたらどうですか あと、$rowはハッシュのリファレンスだろうから$row->{'id'}では http://mevius.5ch.net/test/read.cgi/tech/1349538519/467
468: デフォルトの名無しさん [sage] 2018/11/22(木) 10:12:03.32 ID:iCX1SQ90 >>467 すみません、レス用に書き換えた元がwote_numでした 下記の様に変えましたが、アクセスできません。 意外と難しいですね。 use Encode; use utf8; my %table; open (FILE, "<:utf8", "hash.txt") or (die "$!"); while(my $line = <FILE>){ chomp($line); @d = split(/\t/, $line); my %rec = ('id' => $d[0], 'count' => $d[1], 'name' => $d[2]); $table{$d[0]} = \%rec; print encode('cp932', $table{$d[0]}{'id'})."\t". encode('cp932', $table{$d[0]}{'count'})."\t".encode('cp932', $table{$d[0]}{'name'})."\n"; } close(FILE); print Encode::encode('cp932', "読込完了\n"); foreach my $row (@$table){ print encode('cp932', $row->{'id'})."\t". encode('cp932', $row->{'count'})."\t".encode('cp932', $row->{'name'})."\n"; } print Encode::encode('cp932', "$出力完了\n"); 実行結果:まだアクセスできません >hash_test.pl 1 10 テスト1 2 5 テスト2 読込完了 出力完了 http://mevius.5ch.net/test/read.cgi/tech/1349538519/468
469: デフォルトの名無しさん [sage] 2018/11/22(木) 10:30:19.76 ID:Enb78Zev これでいけると思いましたが、玉砕でしたw foreach my $row (@$table){ while (my ($id, $count, $name) = each(%row)){ print encode('cp932', "$id\t$count\t$name\n"); } http://mevius.5ch.net/test/read.cgi/tech/1349538519/469
470: デフォルトの名無しさん [sage] 2018/11/22(木) 10:54:51.08 ID:iCX1SQ90 これでいけました! foreach my $row (keys %table){ print encode('cp932', "$table{$row}{'id'}\t$table{$row}{'count'}\t$table{$row}{'name'}\n"); } >hash_test.pl 1 10 テスト1 2 5 テスト2 読込完了 1 10 テスト1 2 5 テスト2 出力完了 ただ、key を外して foreach my $row (%table)とすると下記の通り改行が入ります 1 10 テスト1 2 5 テスト2 出力完了 http://mevius.5ch.net/test/read.cgi/tech/1349538519/470
471: デフォルトの名無しさん [sage] 2018/11/22(木) 11:07:56.03 ID:Enb78Zev これで全てのハッシュ要素を出力できますが、 カラム順が不確定になってしまいますね。 ハッシュなので仕方ないことですかね。 foreach $row (sort keys %table) { foreach $col (sort keys %{$table{$row}}) { print encode('cp932', "$table{$row}{$col}\t"); } print "\n"; } >hash_test.pl 1 10 テスト1 2 5 テスト2 読込完了 5 2 テスト2 10 1 テスト1 出力完了 http://mevius.5ch.net/test/read.cgi/tech/1349538519/471
472: デフォルトの名無しさん [] 2018/11/22(木) 12:53:27.47 ID:+z2Jd1go >>471 キーだけ別の配列に取っといてそれ使えば? http://mevius.5ch.net/test/read.cgi/tech/1349538519/472
473: デフォルトの名無しさん [sage] 2018/11/25(日) 19:58:05.78 ID:Ngr2zrFy >>472 できれば要素をカラム名でアクセスしたいのでハッシュの方がいいのですが、カラム順固定出力は配列しかないということですね。 http://mevius.5ch.net/test/read.cgi/tech/1349538519/473
474: デフォルトの名無しさん [sage] 2018/11/25(日) 21:54:59.45 ID:CqrOufwt 両方使えば良いのでは たまにやるよ http://mevius.5ch.net/test/read.cgi/tech/1349538519/474
475: デフォルトの名無しさん [sage] 2018/11/26(月) 04:07:41.06 ID:LFi/GsCA >>471 foreach $col (sort keys %{$table{$row}}) { を foreach $col (qw/id count name/) { とかでは? keyの名前も順番も分かってるんだし。 http://mevius.5ch.net/test/read.cgi/tech/1349538519/475
476: デフォルトの名無しさん [sage] 2019/06/24(月) 04:43:33.88 ID:4+LiJo6+ 自分が昔質問したことにたいして今なら回答できる <> は <STDIN> の単なる略ではなく @ARGV が捕れない副作用があった そこに詰まっていた #!/usr/bin/env perl use 5.010; if (-p STDIN) { print "May be pipe is used. I've got STDIN as below\n"; # my @lines = <STDIN>; # when <> used, perl think no @ARGV map {state $i; ++$i;print "$i $_" } <STDIN>; } else { print "This may be just single running.\n"; } map {state $i; ++$i; print "$i argment found ==> $_\n"} @ARGV; http://mevius.5ch.net/test/read.cgi/tech/1349538519/476
477: デフォルトの名無しさん [sage] 2019/08/29(木) 20:58:11.72 ID:72vdfcsY タグを除去したいのですが、<>も文に入っているため <.*?>ではなく<("[^"]*"|'[^']*'|[^'">])*>を使いたいのですが perl -pe '<("[^"]*"|'[^']*'|[^'">])*>' にする場合どれどれをエスケープすればよいでしょうか? ’だけだと動きませんでした。 perl -pe '<("[^"]*"|\'[^\']*\'|[^'">])*>' http://mevius.5ch.net/test/read.cgi/tech/1349538519/477
478: デフォルトの名無しさん [] 2019/08/30(金) 12:09:22.02 ID:VkI78Ia/ 除去?だったらs/パターン//gみたいにやらないと何も変わらないのでは? てか、それエラーにならないの? http://mevius.5ch.net/test/read.cgi/tech/1349538519/478
479: デフォルトの名無しさん [sage] 2019/08/30(金) 13:51:46.18 ID:XCxRWcZV 5chの書き込みのほう、つけ忘れてました perl -pe 's/<("[^"]*"|'[^']*'|[^'">])*>//g' です perl -pe 's/<.*?>//g'は動くんですけど perl -pe '<("[^"]*"|\'[^\']*\'|[^'">])*>'だと動かないんですよね http://mevius.5ch.net/test/read.cgi/tech/1349538519/479
480: デフォルトの名無しさん [sage] 2019/08/30(金) 13:52:36.95 ID:XCxRWcZV またやっちゃった perl -pe 's/<("[^"]*"|\'[^\']*\'|[^'">])*>//g' http://mevius.5ch.net/test/read.cgi/tech/1349538519/480
481: デフォルトの名無しさん [sage] 2019/08/30(金) 17:21:58.25 ID:8Dc5lx9D こうか? perl -pe 's/<("[^"]*"|'"'"'[^'"'"']*'"'"'|[^'"'"'">])*>//g' perlというよりシェルのシングルクォートの問題 http://mevius.5ch.net/test/read.cgi/tech/1349538519/481
482: デフォルトの名無しさん [sage] 2019/08/30(金) 17:42:16.91 ID:fIMZQtfT そこまでするくらいなら HTML::Parser を使う方がいいと思うよ。 http://mevius.5ch.net/test/read.cgi/tech/1349538519/482
483: デフォルトの名無しさん [sage] 2019/08/30(金) 17:56:41.24 ID:XCxRWcZV >481 できました!、ありがとうございます。 'を'""'で括るのですね なんで\でエスケープにならないんでしょうね http://mevius.5ch.net/test/read.cgi/tech/1349538519/483
484: デフォルトの名無しさん [sage] 2019/08/30(金) 18:04:26.61 ID:XCxRWcZV パーサーも一度使ってみたんですが <p>hoge</p><p>hoge</p> pタグが一行に2つあると誤作動したりするんですよね http://mevius.5ch.net/test/read.cgi/tech/1349538519/484
485: デフォルトの名無しさん [sage] 2019/08/30(金) 23:22:18.80 ID:fIMZQtfT その誤作動がパーサーのせいかどうかは判らないが、少なくとも HTML::Parser でそんなことは起こらないから安心してほしい。 たとえばテキスト部分だけを出力したいならこんな感じでできる。 my $parser = HTML::Parser->new( text_h => [sub { print( $_[0]) },'text'], ); $parser->parse_file( \*STDIN); http://mevius.5ch.net/test/read.cgi/tech/1349538519/485
486: デフォルトの名無しさん [sage] 2019/08/31(土) 00:18:32.04 ID:mx6W2BK8 >485 参考になります。 パーサーもいろいろ種類あるみたいですね。 自分の使ってたのはhtml-xml-utilsというやつでした。 http://mevius.5ch.net/test/read.cgi/tech/1349538519/486
487: デフォルトの名無しさん [sage] 2021/04/21(水) 00:35:38.31 ID:J2c8I4ei @aに0を100ケ追加するには、pushをforで100回回す以外の方法ありますか http://mevius.5ch.net/test/read.cgi/tech/1349538519/487
488: デフォルトの名無しさん [sage] 2021/04/21(水) 03:07:59.27 ID:aE0oGLsa push(@a, (0) x 100); http://mevius.5ch.net/test/read.cgi/tech/1349538519/488
489: デフォルトの名無しさん [sage] 2021/04/27(火) 18:16:47.03 ID:OX0aAdkQ >>488 ありがとうございました 俺が遅くなりまして申し訳ありません http://mevius.5ch.net/test/read.cgi/tech/1349538519/489
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 34 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.007s