w3m その8 (738レス)
1-

688: 2019/09/09(月)18:59 AAS
すまん。xselなくてもいけるなPIPE_BUFでも普通に%s使えるっぽいな。
直すか。
689: 2019/09/09(月)19:18 AAS
いや、どうやら無理だな。後sedで変更する値が見えてるままの値じゃなくて
検索に入ってる文字列を変更するようになってるけと、これは直さないほうが使いやすいな。
後ほんとsedに流し込んでるだけなので、危険な事すれば危険なのでね。
690: 2019/09/09(月)19:36 AAS
# 下部分だけちょっと改良。
# でも前のほうがxsel -sにurlがそのまま入ってる形だけど。
# xselを一時fileにしたほうが素直だと思うけどrm使うのは頭働かせないと怖いからやらない。
<<EOF
Content-Type: text/plain
w3m-control: GOTO $URL
w3m-control: EXTERN echo %s |sed 's/&/\\\&amp;/g' |xsel -s
w3m-control: VIEW
w3m-control: PIPE_BUF sed "s,<body [^>]*&\$(xsel -s)<br /;"\
's%\(<input[^>]*\)Shift_JIS%\1UTF-8%; s%\(<form \)\([^>]*>\)'\
'%\1action="file:///cgi-bin/google.zsh" \2<input name=$UNIQ type=hidden value="form">%;'\
's,</form&<form action="file:///cgi-bin/google.zsh">'\
'<input name=$UNIQ value="option" type=hidden>'\
'<input name=field value='"\$(xsel -s)"' type=hidden>'\
'<input type=text></form;'\
's%\(<span[^>]*>\|</span>\)%%g; s%<div[^>]*>%%g; s%</div>%<div>&%g;'\
's,\(<a [^>]*href="\)/\(search?\|url?q=/search%3F\)\([^"]*"\)'\
',\1file:///cgi-bin/google.zsh?${UNIQ}=rotate\&\2\3,g;'\
's%\(<a [^>]*href="\)/url?%\1外部リンク:www.google.co.jp
w3m-control: VIEW
$( printf '%s\n' 'w3m-control: DELETE_PREVBUF'{,,,} )

EOF
691: 2019/09/09(月)19:58 AAS
どうでもいいだろうけど以下の部分は、""いらないな。
'<input name=field value='"\$(xsel -s)"' type=hidden>'\
こう見たほうが素直に何してるか分かるかも。\\\&が非常に自分でも分かり辛い。
'<input name=field value='\$(xsel -s)' type=hidden>'\
692: 2019/09/11(水)02:42 AAS
w3mは適当にformだけを切り出してもちゃんと描画してくれるから、
適当に抜き出してw3m-control: SUBMITを使えば、
10行20行に満たないコードでいろいろ書けちゃうね。shで書くよりも短く書ける。
やっぱw3m作った人はセンスの塊だと思うわ。いつか俺はテコ入れしてバージョン上げたいね。
色々書いたから載せたい所だか、まあ間違い直しでスレッドが埋まっちゃうから無理だな。
5chはmoreなんだな。lessじゃない。
693: 2019/09/11(水)17:50 AAS
自己顕示欲の塊みたいなやつだな
694: 2019/09/19(木)19:41 AAS
5chでよく聞く気持ち悪い台詞だな。
695: 2019/09/20(金)08:49 AAS
そんなにたくさん5chを見てるのか
696
(1): 2019/12/07(土)20:24 AAS
「誰に向けて書いてんだよ?」とは思うけど、どうせ過疎スレだし…
そんなことより Google の仕様がまた変わったな。
テキストがリンクになってる。a 要素の中に div 要素が無い。
まあ、この変更に気付いたのは lynx で見てる時なんだが。
697: 2019/12/08(日)08:31 AAS
俺の環境だとgoogle検索結果の <a> 要素中に <div> が入ってる。
User-Agent を見て出力形式を振り分けてるのかも知れん。
lynx は対応してるけど w3m は放置されてる感じで。
698
(1): 2019/12/16(月)05:18 AAS
Lynx で google が使えなくなった視覚障害者の話がちょっと前にバズってたけど
ちょっとは影響があったのかな? でも、リンクが辿れるだけマシになったとは言え、
圧倒的に情報量が少ない。

User-Agent が Mozilla 系でも使えた頃が一番見やすかった。まだ今年の話だと思うが、
まともに見られなくなり User-Agent を Lynx 系にして凌いでいた。しかし、1 ヶ月
ちょっと前に完全にダメになってしまった。それまでにもちょいちょい表示が崩れることが
あったが大抵リロードで解決できていたのに。JavaScript 必須、GET より POST の時代ですな。

StartPage もいつからか次ページに移動できなくなったし、DuckDuckGO も何だか
見辛かったのだが、今回の騒動で Lite 版があるのを知って使い勝手がマシになった。
とは言え、タイトルはぶったぎりだし、検索の質はやはり劣るか。

本家の CVS から落とせなくなってからは、Debian 管理化の Git リポジトリを利用してるけど
User-Agent を Lynx 系にしようとしたとき siteconf に対応していることに気付いた。
それ以来便利に使っている。
699: 2019/12/19(木)22:17 AAS
>>698
w3mは高機能でテーブルのレイアウトができて視覚障害者は利用しないので、Lynx対応の方が社会的な要求が強いのでしょうね。
いきなりLynx-devのメール流量が増えた時は、私も驚きました。
700: 2020/06/30(火)16:54 AAS
googleさんの検索結果ページだけど、またw3mで使い物になるように改善されたかな。
皆さんどうですか?

自分とこ、色々手を入れちゃったせいで一般的な環境じゃないんだわ。
701: 2020/07/11(土)18:42 AAS
書き込みがあったとは、気付かなかった。ほら、過疎スレだからさ…

w3m も lynx も、a 要素の中に div 要素があると hidden link になるけど
特に困ることじゃない。
w3m の場合はリンク番号を表示させれば済む。
Google で hidden link になってた時期は >>616 から >>696 まで。
702: 2020/10/13(火)23:15 AAS
ぬるぽ
703: 2020/10/15(木)17:32 AAS
ぬるぬるぽ
704: 2020/12/09(水)09:26 AAS
画像リンク

705: 2020/12/17(木)07:19 AAS
Twitter 逝ったぁ!
706
(2): 2020/12/17(木)20:49 AAS
Twitter 閲覧する local CGI とか作ってる方っていらっしゃらないですかね……?
707: 2020/12/19(土)05:44 AAS
>>706
スクレイピングする方法はググれば沢山見つかるから簡単に自作できるんじゃない?
っていうか自分もこれから作ろうと思ってる

あんま関係ないけど、とあるサイトで w3m で画像が表示されなくなったことがあって
なんか lazy load とかいうやつらしくて
そのときは串自作して対応したよ
708
(1): 2020/12/19(土)09:31 AAS
>>706
Twitterは、user-agentをBot等に変えれば行けませんか?
709
(4): 2020/12/21(月)23:40 AAS
>>708
いままで mobile.twitter.com でモバイル版が提供されてて
w3m などのテキストブラウザでも HTML で直接閲覧できていたんですが、
2020-12-16 で mobile.twitter.com 自体が廃止になったので、
今後は API 叩いたり JSON いじったりしないとダメじゃないかと思います。
710
(1): 2020/12/22(火)07:39 AAS
試してみれば見れるのは分かるだろうに
なんで適当な事書くのかね
711: 2020/12/22(火)07:57 AAS
そっか、検索でツイート引っかかるよう抜け道残してあるんだな
712: 709 [site] 2020/12/22(火)09:45 AAS
>>710
失礼しました。「user_agent」を「Bot」にしたら確かに見れますね。
だいぶ読みづらくはなりますが……。
713
(1): 2020/12/23(水)20:46 AAS
え、User-Agentを「Bot」にしても、ログインすると
「このブラウザは現在サポートされていません。」
と出るんだけど、何か足りない設定があるのかな
714
(1): 2020/12/24(木)07:16 AAS
>>713
ログインしない状態での閲覧はできましたが、ログインしてからの操作は、こちらもできませんでした。
user-agent以外の手段が必要そうです。
なお、閲覧するだけなら、nitterを使うとすっきりした表示になるようです。
715: 2020/12/25(金)00:27 AAS
ありがとう、やっぱり見れないのね
JavaScriptの勉強してlocal CGIを書くかなあ
716: 709 2020/12/25(金)09:34 AAS
すみません、私は普段ログインせずに閲覧するだけなのでなんとか見れるようになりましたが、
確かにログインするとダメですね……。

ちなみに、 UA をボットにするのは、 README.siteconf にそのものズバリな例が載っていました。
717: 709 2020/12/25(金)09:37 AAS
あ、あと、ボットにして見れるのも最新 20 件くらいだけで、ページ送りはできないみたいですね。
1-
あと 21 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ

ぬこの手 ぬこTOP 0.023s