[過去ログ]
くだすれPython(超初心者用) その46【Ruby禁止】 (1002レス)
くだすれPython(超初心者用) その46【Ruby禁止】 http://mevius.5ch.net/test/read.cgi/tech/1577948214/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
46: デフォルトの名無しさん [sage] 2020/01/05(日) 01:19:33.03 ID:MK0cWPLh 超初心者です。Pythonのscrapyについて教えていただきたいです。 一つのspiderを作って、crawlすることはできたのですが、 (scrapy crawl xxxxx -o sample_data.csv) yyyyy.pyとzzzzz.pyというspiderを同じディレクトリに作成し、 (x,y,zは別ドメイン別サイトで同じような情報が掲載されている。 もちろん構造が違うためxpathはサイトごとに違う。) 連続で実行する方法があったら知りたいです。 ググったのですが、scrapyでそういうことができるかどうか、 わからなかったので、質問させていただきました。 spiderの.pyのみx,y,zと複数作って管理保守を楽にしたいです。 xxxxx.pyに複数のclassを書いて、上から順に実行していくという方法に なるのでしょうか。 わかりづらくて申し訳ないです。ご教示よろしくお願いいたします。 http://mevius.5ch.net/test/read.cgi/tech/1577948214/46
74: デフォルトの名無しさん [] 2020/01/07(火) 12:42:25.03 ID:j68rdTp2 もちろんできないのであきらめる http://mevius.5ch.net/test/read.cgi/tech/1577948214/74
172: デフォルトの名無しさん [sage] 2020/01/12(日) 15:47:52.03 ID:iU1LDXiT いつのまにかインデントが崩れて正常に動作しなくなってた でも中括弧がないので元の状態が分からない 元に戻せない http://mevius.5ch.net/test/read.cgi/tech/1577948214/172
289: デフォルトの名無しさん [sage] 2020/01/18(土) 18:17:17.03 ID:bny/49Iw >>288 これはできますね。 間にエクセルを入れるとどうもおかしなことになるみたいです。 エクセルって書き出し時のコード指定できないみたいだし。 http://mevius.5ch.net/test/read.cgi/tech/1577948214/289
349: デフォルトの名無しさん [] 2020/01/23(木) 14:01:15.03 ID:rTyMrtC+ 仕事で使用している上に特定のソフトのスクリプトなので詳しいことが書けないのですが、 以下のようにクラス変数をチェックするコードを書くと何故かcheck1の値は6になってるのに、check2の値は0のままみたいなことが起きてしまいます。 class testClass(): def __init__(self): self.test = 0 def set_test(self,a,b,c): self.test = a+b+c print("check1:"+str(self.test)) def print_test(self): print("check2:"+str(self.test)) testClass = testClass() testClass.set_test(1,2,3) testClass.print_test() この↑のサンプルスクリプト自体はどっちも6と正しく表示されるのですが、これに似たスクリプトでおかしなことになって困っています。 何か思い当たる節のある方がいたら教えてください。。。 http://mevius.5ch.net/test/read.cgi/tech/1577948214/349
471: デフォルトの名無しさん [sage] 2020/02/05(水) 20:21:18.03 ID:3A2Vd31x cとPHPとシェルとストアドプロシージャ位しか書けないんだけど パイソンでDLバリバリになるには何の書籍から始めるのが良い? やっぱ統計学はやんなきゃ話にならない? http://mevius.5ch.net/test/read.cgi/tech/1577948214/471
496: デフォルトの名無しさん [sage] 2020/02/06(木) 12:35:55.03 ID:/hIhK6yv 要素を非同期処理で読み込むから、要素が存在しないとか、 サイトの構成が変わったとか、 XPath/CSS セレクターが間違っているとか、 相手がアクセスをブロックしてくるとか スクレイピングは、相手のサイトを分析するのが難しいのと、 適切に限定される、セレクターを作るのが難しい API が公開されているなら、APIを使った方がよい 漏れは、Ruby で、Selenium WebDriver, Nokogiri などで、 Chrome, Edge などのブラウザーを自動操作して、スクレイピングするけど ここに書いておいた 【VBScript】WSHについて話し合うスレ【JScript】 https://mevius.5ch.net/test/read.cgi/tech/1578522041/24-27 http://mevius.5ch.net/test/read.cgi/tech/1577948214/496
599: デフォルトの名無しさん [sage] 2020/02/11(火) 14:25:45.03 ID:L4MHQKAq Pythonの初級を受けた人いますか? どのような勉強されたか教えてください m(__)m http://mevius.5ch.net/test/read.cgi/tech/1577948214/599
604: デフォルトの名無しさん [] 2020/02/11(火) 16:01:24.03 ID:BVyNsmkt それにしても、金になると思うとすぐ資格ビジネス屋が群がりやがって http://mevius.5ch.net/test/read.cgi/tech/1577948214/604
696: デフォルトの名無しさん [sage] 2020/02/16(日) 11:27:23.03 ID:17VZ7Cpd >>695 2行目には禿同 >ローカル変数なんて全部一文字でいい ここまでがんばる必要はない http://mevius.5ch.net/test/read.cgi/tech/1577948214/696
715: デフォルトの名無しさん [sage] 2020/02/16(日) 16:53:49.03 ID:17VZ7Cpd >>714 > ほぼほぼ作ったのが後々改造できなくて > 投げ捨てるはめになってる www わかるwwwww始めたばっかりの頃のあるあるwwwwwわかるwwwww オライリーの リーダブルコード ISBN-10: 4873115655 ISBN-13: 978-4873115658 (あるいは ビューティフルコード ISBN-10: 4873113636 ISBN-13: 978-4873113630 ) を 買って読んでみたらー 中古でも安くなってないだけのことはあるでよー http://mevius.5ch.net/test/read.cgi/tech/1577948214/715
864: デフォルトの名無しさん [sage] 2020/02/23(日) 22:05:12.03 ID:SvXUu1bl >>862 もともと>>801ではインデントにスペースとタブを問題ないということを説明し、ただし例外として 一貫性のない使い方(とpython処理系が判断した場合)にエラーになると補足した訳だが、 >>856はまさにそれを裏付けてくれたわけだろう。 http://mevius.5ch.net/test/read.cgi/tech/1577948214/864
875: デフォルトの名無しさん [] 2020/02/23(日) 23:43:16.03 ID:uUFeESNP >>872 いや、辞書じゃなくて計算ツールです。 理想としては、 回答入力→解答と照合→数値変換→計算なんですけど 解答と照合と数値変換の過程が分からなくて… http://mevius.5ch.net/test/read.cgi/tech/1577948214/875
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
1.640s*