w3m その8 (738レス)
前次1-
抽出解除 レス栞

317
(1): 2011/09/02(金)13:50:48.56 AAS
>>314
見るのをやめる
433: 2012/06/26(火)19:10:25.56 AAS
vimperator 使ってるのに未だに w3m が並んで動いている。
軽いからかな…うーん、いや…
582
(3): 2017/12/07(木)12:48:07.56 AAS
>>580 俺のところもなるわ。

HTMLのソースを見ると当該部分は
<a href="/admin/serial/01/ubuntu-recipe/0019?page=2" rel="next">
となっているから、hrefのリンク先が '/' で始まってると
w3mはローカルファイルへのリンクと判断して "file://" を補うみたいね。

おそらくページ作成者はサーバのルートからの絶対アドレスとして
"外部リンク:gihyo.jp が補われると想定して書いてるのだと思う。
実際に "外部リンク:gihyo.jp で次のページが見られるし。

HTMLの文法としてどちらが正しいのか知らんけど、とりあえず現象の分析まで。
622
(1): 2019/06/23(日)06:25:15.56 AAS
>>621
2のpythonのプログラムを標準入力で受け取って標準出力で表示するように作れば、
w3m 〜 | python 〜 | w3m …
という方法で渡していける。

ただ、pythonの出力がただのテキストなら、3をw3mで受ける必要があるか。
lessで十分だと思う。
w3m 〜 | python 〜 | less
pythonがhtmlを出力するなら、3のw3mのオプション(…の部分)は
-T text/html とする。
w3m 〜 | python 〜 | w3m -T text/html
645: 2019/09/06(金)18:14:55.56 AAS
#!/bin/zsh
test "${QUERY_STRING%%&*}" = $(basename $( factor $PPID |md5sum )) \
&& UNIQ=$(basename $( factor $PPID |md5sum ))

case "$QUERY_STRING" in
${UNIQ}\&rotate\&*) # 次のページへ、時間指定等の対応。
URL="外部リンク:www.google.co.jp cut -d '&' -f 3- <<<$QUERY_STRING )";;
${UNIQ}\&decode\&*) # ここから再検索して下さいの対処。
URL="外部リンク:www.google.co.jp\
$(nkf --url-input <( sed 's/\([^&]*&\)\{2\}//; s/%25/%/g' <<<$QUERY_STRING ))";;
*) #default, またはformから流れてくるもの。
URL="外部リンク:www.google.co.jp
UNIQ=$(basename $( factor $PPID |md5sum ));;
esac

<<EOF
Content-Type: text/plain
w3m-control: GOTO $URL
w3m-control: VIEW
w3m-control: PIPE_BUF sed 's%<form.*value="\(.*\)"[^>]*name="q".*/form>'\
'%<form action="file:///cgi-bin/google.zsh">'\
'<input type=text value="\1"></form>%;'\
's%\(<span[^>]*>\|</span>\)%%g; s%<div[^>]*>%%g; s%</div>%<div>&%g;'\
's,\(<a [^>]*href="\)/url?q=/search%3F\(q%3D[^"]*"\)'\
',\1file:///cgi-bin/google.zsh?${UNIQ}\&decode\&\2,;'\
's%\(<a [^>]*href="\)/url?%\1外部リンク:www.google.co.jp\
's%\(<a [^>]*href="\)/search?\([^"]*"\)'\
'%\1file:///cgi-bin/google.zsh?${UNIQ}\&rotate\&\2%g'
w3m-control: VIEW
$( printf '%s\n' 'w3m-control: DELETE_PREVBUF'{,,,} )

EOF
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ

ぬこの手 ぬこTOP 1.234s*