[過去ログ] 正規表現道場@2ch Part3 s/煽り|荒らし/あぼーん/g (989レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
270
(9): 04/02/24 21:18 ID:1VWZCh18(1/2) AAS
質問です。
アルファベットのみで構成される6文字以上10文字以下の文字列、をcygwinのgrepを用いて検索したいのですが…。

正規表現の紹介をしているところを読んで回り、
^「A-Za-z]{6,10}
で、アルファベット6文字以上10文字以下、を表すということが分かったのですが、

grep -i "^[a-z0-9./]{6,9}"
としてみても何も反応が無く、

egrep -i "^[a-z0-9./]{6,9}"
とすると、11文字や12文字の文字列も引っかかってきてしまいます。

どう書けばアルファベットのみで構成される、6文字以上10文字以下の文字列、を正確に検索出来るのでしょうか?
省1
271: 04/02/24 21:22 ID:??? AAS
>>270
egrep -iw "^[a-z0-9./]{6,10}"

途方に暮れて質問させていただいた直後に我に返りました。
wというコマンドを使えば出来ました。

スレ汚し失礼しました…。
272
(1): 270 04/02/24 23:35 ID:1VWZCh18(2/2) AAS
スミマセン…もう一度質問させてください…。

外部リンク[html]:koho.ktplan.jp

ここを例にして説明します。
上のサイトを開いて、全部選択してテキストにコピペしてy.txtとして保存。
この中から、6文字以上、10文字以下の英単語だけを抜き取ろうとしています。

$ egrep -iw "^[a-z]{6,10}" y.txt

とすると、
省14
274: 270 04/02/24 23:46 ID:??? AAS
>>273
即レスありがとうございます…。

$ egrep -iw "^[a-z]{6,10}+$" y.txt

$ egrep "/^[a-z]{6,10}$/i" y.txt

共にだめでした…。
悩んでみます。
276: 270 04/02/25 00:11 ID:??? AAS
>>275
あ、スミマセン。。。

egrep -iw "^[a-z]{6,10}$" y.txt

です。
何も起きないのです…。
278: 270 04/02/25 00:22 ID:??? AAS
>>277
egrepだと、とりあえず>>272の状態まではたどり着くのですが、
$ grep -iw "^[a-z]{6,10}" y.txt
これだと何も起きないのです…。
そもそもgrepやegrepだと無理…なのかな…。
280
(1): 270 04/02/25 01:07 ID:??? AAS
>>279
FreeBSD、ググッテ見ましたが、自分にはよく理解できませんでした。

自分は
外部リンク:sources.redhat.com
このcygwinというのを使用しています。

$ egrep -V
egrep (GNU grep) 2.5

と言うことでした。
つまり、これでは出来ない、ということですかね…。
ありがとうございました。
省4
284
(1): 270 04/02/25 02:48 ID:??? AAS
>>283
遅くにスミマセン…調べ調べて、

$ grep "^[a-z0-9./]\{6,10\}" y.txt

これで出来ました…。
本当に出来てるのか、検証していきたいと思います。

$ egrep -iw "^[[:space:]]*[a-z]{6,10}[[:space:]]*$" y.txt

これでも出来ました!まずは…この意味を解読することから勉強して行きたいと思います…。
省2
285: 270 04/02/25 02:50 ID:??? AAS
>>284
訂正!

$ grep -iw "^[a-z0-9./]\{6,10\}" y.txt

でした!

|彡サッ
286
(1): 270 04/02/25 03:34 ID:??? AAS
$ grep "^[a-z0-9./]\{6,10\}" y.txt

$ egrep -iw "^[[:space:]]*[a-z]{6,10}[[:space:]]*$" y.txt

どちらを使っても、y.txtの中の改行をすべて空白に変えてみて、一面単語の海にすると取り出せないですね…。
もう諦めてマジ寝ます。
また明日悩みます。
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.041s