検索エンジンをつくりたい (281レス)
上下前次1-新
1(13): yam ◆AyW.Rdbg [yamtoshi@hotmail.com] 01/12/22 23:16 ID:??? AAS
ヤフーのような検索エンジンを作って、
自力で商用化をしたいんだけれど、
開発費用っていくらぐらいかかる?
信頼のおける技術者も探しています。
201: [晒しアゲ] 04/12/20 08:16 ID:??? AAS
ロボット型検索エンジン作りたい奴、
頼むから爆撃アクセスするようなロボットは作らないでくれな。
robot.txtやMETAタグには従うように。
どうせIPで弾くだろうけどな。
202: 04/12/20 10:55 ID:SmxJcj5b(1) AAS
うわーすごいのびてる。
さっき書き込んだときは60くらいだったのに。
さすが2チャンネルだなぁ。
203: 04/12/23 23:53 ID:yKblct4O(1) AAS
検索エンジンをつくりには、
1.Inverted File Structureを勉強すること。
2.形態素解析
3.ロボットのこと テキストだけ抜き鳥。
204: 04/12/24 00:28 ID:nkV22Kja(1) AAS
2chスレ:news4vip
205: 05/03/13 19:43 ID:cxiEkR1N(1) AAS
第2回検索エンジンアンケート実施中!
外部リンク[php]:hp6.0zero.jp
206: [zc] 05/03/14 19:36 ID:??? AAS
鯰じゃだめなのか?
207: [sd] 2005/03/22(火)21:31 ID:??? AAS
鯰でいい。
208(1): 2005/03/23(水)03:34 ID:NriJPZTB(1) AAS
正直このスレでいいのか分からないのですが、
検索ロボットとオンラインブックマークの関係について教えて下さい。
(初心者用質問スレが落ちたみたいなので?こちらに書いています)
具体的には、
オンラインブクマに登録されたサイトは検索ロボに登録されてしまうのか
が知りたいのです。
サイト自体は.htaccess、robot.txt、METAタグで
省9
209: 2005/03/23(水)07:21 ID:??? AAS
>>208
設定とロボットしだいでしょ
GoogleとかYahooはrobot.txtで拒否できるから
210(2): 2005/04/30(土)21:14 ID:MqigPbvB(1) AAS
ちょっと真面目に検索エンジンについての話なんだが、
登録数100万件なら、どのぐらいのスペック(サーバー)が必要なんだ?
情報求む。
211(1): 2005/04/30(土)22:49 ID:??? AAS
>>210
簡単なサンプルプログラムを用意してみたら?
っていうか、どんなシステムよ
212(1): [ ] 2005/05/06(金)00:17 ID:??? AAS
>>211
「簡単なサンプルプログラム」とは?210じゃないけど。
というか、ロボットは別としてディレクトリ型で
大手の検索エンジン以外で数十万単位の登録ってあるんだろうか?
そしてテキストだけならほぼ普通のレン鯖でも処理出来る気が
するのだが、あくまでも「気がする」程度なのだろうか・・。
213(1): 2005/05/06(金)17:34 ID:??? AAS
>>212
いきなり、実稼動するわけじゃないんだから。。。
ローカルで動くシステムを作ってみれば
どのくらいの負荷がかかるとかわかるでしょ?
そこに、信頼性や要求なんかを加味して
そこから逆算してくださいな
ってことです
省2
214(1): [ ] 2005/05/24(火)18:49 ID:??? AAS
>>213
かなり遅レスで悪いけど、ローカルだと所詮LAN内だから
実際の処理スピードなんて測れ無くないか?
それよりも”100万件”というのが、普通のディレクトリ型の
検索エンジンで可能なのだろうか?ある意味100万件
ジャンル別に集められる検索エンジンがあれば
そこそこ利用してもらえる気がする。
215: 2005/05/24(火)23:12 ID:??? AAS
>>214
計れないのは、通信速度であって
処理速度はLANであろうと、WANであろうと変わらない
100万件のデータを扱うなら通信速度よりも処理速度の方が重要だろうと
まぁ、言い訳がましく言うと
もちろん、通信速度も重要だけど
>>210がスペックの話をしていたから処理速度の話だと思った
省2
216: 2005/05/25(水)16:09 ID:??? AAS
yahoo.co.jpでもカテゴリの登録数は100万行ってないはず。
30万ぐらいじゃなかったか?
217: 2005/05/25(水)21:56 ID:??? AAS
Yahoo!の検索ビジネス戦略を探る
外部リンク:internet.watch.impress.co.jp
> 今現在登録されているサイトの総数は40万件以上になっています。
218: 2005/05/26(木)07:37 ID:??? AAS
100万件あればソコソコどころじゃないって事かw
219: [ ] 2005/05/28(土)03:56 ID:??? AAS
よし、とりあえず真面目に話すか。
100万件がどうのという話をしているが、それは=ディレクトリ型
というわけだろ?その時点でどういう検索エンジンであったとしても
二番煎じな気がする。
けど、ネットを利用してみて「欲しい情報を手に入れたい」と
思う人は多いわけで、だからこそ検索エンジンが使われるわけだ。
YAHOO!は知名度で成り立っているから、検索機能としては凄いわけではない。
省4
220(1): 2005/05/28(土)14:02 ID:??? AAS
どんなものを必要とするか分からない以上、
回避するには更に莫大な情報が必要ですよ。
221(1): [ ] 2005/05/28(土)17:11 ID:??? AAS
>>220
じゃ、とりあえず「何を必要とするか」を出していけば
自ずとまとまってくるんじゃないか?一人一つでも出せれば。
俺は「見づらいサイトを排除して欲しいor見やすさ重視」
色のカラーバランスや文字組みの構成を認識して
それによって順位が変動する検索表示だと良いかなって思ってる。
例えば、マイナーワードで古くからあるサイトとか
省3
222(1): 2005/05/30(月)11:04 ID:??? AAS
>221のアプローチだとyahooにもgoogleの既存システムの弱点回避を
導くよりは、gooラボで研究されて、下手すると実運用してないくせに
特許だけとられてがんじがらめにされてるようなアイデアを出しそうだ。
gooラボでのテーマや成果をみていると。
検索エンジンへの欲求は情報の鮮度と、アクセシビリティにつきると思う。
あとはパーソナライズね。鮮度を保証するために、機械で膨大なサンプルを網羅して
後は統計で個人ごとに異なる要求に応えるか、検索とは違うけどallAboutみたいに
省10
223(1): [ ] 2005/06/01(水)06:19 ID:??? AAS
>>222
すまん、また書くのが遅れた。
gooラボを出しているが、あれ自体が物凄く重くないか?
また、何かソフト入れなきゃ駄目だったろ。確か。
だから色物扱いされて、反響無かったと思うが。
あと、君は俺の1案に対してつっこみを入れているだけで
「自分が欲しい意見」というのを出していない気がするが。
省3
224(1): [ ] 2005/06/01(水)06:22 ID:??? AAS
それと企業的な観点からものを言いすぎる。
この板の特質上、あくまで個人のプログラマーが
検索エンジンを作る上で、どのような検索エンジンだと
反響があるのだろうか?使いやすいだろうか?
と言うことを話し合うスレだと思うが。
いわば開発アイディアの検証だ。
そうじゃなくて222のような企業的思考で難しいこと言ってても
省1
225(1): 2005/06/01(水)15:23 ID:??? AAS
で、お前は批判しかしないんだな。
どうせ自覚も無いんだろ。口だけなんだから素直にバイトでも探してろ。
226: 2005/06/01(水)15:53 ID:??? AAS
>>225まんまお前に当てはまるのなw
223-224は221で意見述べてるだけお前よりはマシw
227(1): 2005/06/01(水)18:56 ID:??? AAS
バイト探しの方が100倍建設的だろうが。脳味噌膿んでんのか?
228: 2005/06/01(水)18:58 ID:??? AAS
>>227
いいからたまには外に出ろ
229(1): 2005/06/01(水)19:04 ID:??? AAS
おいおい、もうオウム返しかよw 早すぎww
230: 2005/06/01(水)19:05 ID:??? AAS
>>229
オウム返しの意味もわからないで使うなよw
231(3): 2005/06/03(金)19:34 ID:vAHoocN8(1) AAS
要はブレストの段階で議論を始めると話が進まないという事かね。
つー訳で、とりあえずドンドンと意見を出して行こうぜ。素人考えだろうが
何だろうが、まずは案を挙げまくって、それから議論という事だ。
非アダルトの情報を欲して検索をかけても、アダルトの類のページが
検索にかかる割合が高い。オプション指定するだけで、キレイに検索から
アダルトを排除できる仕組みが欲しい。
逆に、アダルト検索用のオプションも欲しい。アダルトを検索にかけようと
省4
232(2): 2005/06/04(土)01:31 ID:??? AAS
逆に、アダルトを主体的にデータ化していき、
そこにない差分データはとりあえず非アダルトということに
233(2): [ ] 2005/06/05(日)09:34 ID:??? AAS
>>231-232
とりあえず、俺はこの板に来たらなんか書くようにするから
他のみんなもどんどん意見を出して欲しいと思う。
んで、231の方法はmetaとかページのテキストから
アダルト関連のワードを拾うことで、アダルトサイトを
ほぼ完全排除出来ないかな?
最近のサイト制作の傾向として、1つの検索エンジンのみを
省4
234: [ ] 2005/06/05(日)09:38 ID:??? AAS
それで次のアイディアだけど、よくあるかもしれないが
それでいて大手検索エンジンで使われていないのだが
ランダム検索と、ソート機能ってあれば面白いと思う。
ランダム検索機能はテキストボックスにキーワードを入れて
「ランダム検索」のボタンをクリックすると、ランダムな
検索結果を表示する。これで下位に埋もれるサイトを
見られる可能性が増える。
省5
235(1): 2005/06/05(日)10:29 ID:??? AAS
>>233
まぁ、言っていることは妥当だと思われ
ただ、問題なのはどうやってアダルト関連のキーワードを判断するかだね
人手で作ってちゃ馬鹿だし
ベイジアンフィルタなんてのもあるから
その応用なんだろうけど
236(1): [ ] 2005/06/05(日)16:15 ID:??? AAS
>>235
アダルト関連のワードってめちゃくちゃ細かいのも排除するの?
例えば、AV女優の名前とか。
とりあえず、「アダルト」「風俗」「AV」とかそういうおなじみの
ワードを省くだけで良いと思う。管理者が入力するタイプでも。
237(1): 2005/06/05(日)22:44 ID:??? AAS
>>236
っていうか、どこまでをアダルトと認識するかによって異なる
例えば、アダルト:アダルトチルドレンなんて様に
特定のキーワードを含む=アダルトサイト
ってわけにはいかないからね
子供向けのフィルタを作る or 特定の分野に特化する
なら話は違ってくるけどさ
省2
238(1): [ ] 2005/06/06(月)00:20 ID:??? AAS
>>237
そう言われればそうだよね。AVでもAV機器ってあるしな・・。
とりあえず、+で含まれるワードはどうだろ?
「ホームページ」「制作」でホームページ制作をフィルタするように
「アダルト」+「AV女優」とか加えてフィルタにするとか。
でも、なかなか難しそうだな。なんか騙しリンクとか
そういうのを完全排除出来る、フィルタリング対応検索エンジン
省1
239: 2005/06/06(月)12:46 ID:??? AAS
>>238
まぁ、その辺を考えるんなら
既存のフィルタリング技術とかアプリケーションを
調べてみても面白いかも
有害コンテンツを子供に閲覧させないためのフィルタとかね
色んなサービスなんかあるし
240: 2005/06/06(月)16:24 ID:??? AAS
とりあえず2ch.netも全カットだなw
241: 2005/06/07(火)22:37 ID:??? AAS
参考スレ
超高機能なサーチエンジンを作りたいんだけど
2chスレ:tech
242(1): 2005/06/13(月)04:28 ID:??? AAS
スレが進んでるのにびっくりした。
>>223-224
企業的視点であり、自分の意見の欲しい形を言ってないとの事だが、
そうではなく企業ですでに目をつけてるものをやっても仕方ない
と思う反面で、企業体が研究している分野を否定して需要がない所を
掘り込むのもどうかと思う(企業的規模で成功するためにじゃなく、
使ってもらってフィードバックしてもらうってレベルでね)から、
省13
243: [ ] 2005/06/14(火)15:42 ID:??? AAS
>>242
すまん、「何が言いたいか分からない」
244: 2005/06/15(水)03:24 ID:??? AAS
みんなに謝らなきゃいけないことがある。
このスレのタイトルを見たとき俺は、、、、、、、
検索ニンジンをつくりたい
かと思ってしまったんだ。すまない。
245: 2005/06/15(水)03:46 ID:??? AAS
絶対に許さない
246(1): [ ] 2005/06/15(水)06:28 ID:??? AAS
検索エンジンにオークション的機能があっても面白いかも。
247(1): 2005/06/15(水)12:04 ID:??? AAS
>>246
詳しく。
248(1): 2005/06/15(水)19:00 ID:SDEIoMgZ(1) AAS
俺データベースが苦手で
エクセルのCSVを多様して検索システムをつくった
いまんとこ1000件データをいれてためしたが
結構早く検索する・・どれぐらいたえれるのだろうか・・・・
データベース俺のまえにたちはだかってやがる・・・
ショップサイトも検索サイトもすべてCSVで処理してる俺は首すんぜんだろうか・・・
249: [ ] 2005/06/15(水)22:08 ID:??? AAS
>>247
・評価機能
・指定日時が過ぎると表示されない
・ポイントに応じて表示順位が変わる(ランキング?)
>>248
DBを使ったら恐ろしく多大なデータを処理出来るよ。
PHPとMySQLが軽くて最高だと思う。
省2
250: [あげ] 2006/11/11(土)21:19 ID:??? AAS
AA省
251: 2006/12/01(金)22:51 ID:??? AAS
Googleの検索コマンドを使いこなせば、
このスレに出てるほとんどのアイディアが実現できる気がする。
252: たま 2007/02/02(金)10:45 ID:QBCmJWsF(1) AAS
検索エンジンのPHPスクリプトを配布しているところを探しています。
どなたかご存じでしょうか??
宜しくお願い致します。
253: 2007/02/02(金)11:27 ID:??? AAS
yomi php
で検索しろ
254: ◆hb//x7qyug 2007/02/02(金)12:12 ID:DuFcC87D(1) AAS
>>1
おもしろそう。協力しようか?
255: 2007/02/03(土)03:54 ID:??? AAS
おま・・いくらなんでも2001年の>>1にレスするのは・・・。
256: 2007/02/07(水)08:59 ID:CGn0u8gT(1) AAS
おまえらquery文字のパースってDBと連携してどうやってる?
googleライクに
"unko unko" -hogehoge (aaaa or "cc cc")
みたいなの
257: 2007/02/08(木)09:24 ID:??? AAS
実験でbisonで作ったパーサをモジュールの形でPHPに組み込んだことあるよ。
...めんどくさいけどね。でもPHPでパーサを書く場合でも.yの書き方は参考になる。
RubyならRacc
258: 2007/02/13(火)02:21 ID:??? AAS
ロボット検索自体を避けるように仕込んでなければ片っ端からサイトを拾ってくれるような
お行儀の悪い検索エンジンを使いたいです。
259: 2007/02/20(火)18:20 ID:??? AAS
ファイルを読み込んだ時にJavwScriptのコードを除外するいい方法はないですか?
フィルターとかあれば良いんですけど・・
260: 2007/10/31(水)21:21 ID:nkFoGGXY(1) AAS
259は新開発したか
261: 2007/11/07(水)06:37 ID:??? AAS
s/\<script.*\/script\>//gi;
262: ギニア3世 2007/11/16(金)21:23 ID:idEdN7T0(1) AAS
グーグルよりすごい?検索エンジン
外部リンク:www.quintura.com
263: 2008/06/08(日)13:47 ID:oe9fgjbi(1) AAS
2003年から工藤智行氏が開発を続けている検索エンジン「FINDSPOT」
外部リンク[html]:21news.cocolog-nifty.com
連載:検索エンジンを作る|gihyo.jp … 技術評論社
外部リンク:gihyo.jp
264: 2008/06/24(火)02:01 ID:iHrl1LSI(1) AAS
>>5 バロスww
265: 2008/06/27(金)00:50 ID:gBJjjQVQ(1) AAS
携帯検索エンジン
携帯サイトおもちの方必見!
携帯で登録できるよ
外部リンク:search-k.net
266: 2008/12/07(日)23:00 ID:WE1pXcYe(1) AAS
マーズフラグってなかなかいいかも
外部リンク:www.marsflag.com
267: 2008/12/20(土)23:38 ID:WN7kdZGE(1) AAS
外部リンク:www.kokoni.com
268: 2008/12/22(月)00:27 ID:9ZqbUAej(1) AAS
eltg33.no-ip.info
anonymouse:0123456789
Search script配布
269: yamtoshi@hot .com 2008/12/31(水)16:10 ID:??? AAS
検索結果にサムネを出すってアイデアも前スレにありましたが・・・
どうでしょう?
270: 2008/12/31(水)22:33 ID:MitumZi6(1) AAS
東京大学うぜーよ!!!!
てめーの研究室がクロールされろ!!!
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
省5
271: 2008/12/31(水)23:04 ID:??? AAS
池■田大■作の本名はソン・テチャク。小泉純一郎、小沢一朗は朝鮮人。
911では小型の水爆が使用されている。
外部リンク:ri■ch■ardkosh■im■izu.at.webry.info/
創価の保険金殺人事件。
オウム事件は、統一・創価.北朝鮮の共同犯行である。CIAが監修している。
外部リンク:www15.ocn.ne.jp■ako■don/kok_web■site/ir■iguc■hi.htm
与党も野党もメディアも全部朝鮮人だった。
省11
272: 忍法帖【Lv=3,xxxP】 2011/06/18(土)02:06 ID:??? AAS
test
273: 忍法帖【Lv=7,xxxP】 2011/06/19(日)12:32 ID:??? AAS
test
274: 名無しさん 2011/10/13(木)00:52 ID:/EgVNFsq(1) AAS
取り越し苦労
275: 電脳プリオン 忍法帖【Lv=40,xxxPT】(3+0:8) 【14.6m】 2013/02/02(土)22:46 ID:??? AAS
AA省
276: 2017/01/21(土)18:58 ID:iuL6ICc7(1) AAS
ぬるぽ
277: 2017/12/30(土)15:50 ID:YhlYw6jg(1) AAS
誰でも簡単にネットで稼げる方法など
参考までに、
⇒ 『半藤のブブイウイウレレ』 というサイトで見ることができます。
グーグル検索⇒『半藤のブブイウイウレレ』
V50O6JDAJX
278: 2019/11/04(月)23:27 ID:hIibPdWp(1) AAS
プライバシー保護検索エンジン探しているならこれ見といた方がいい
外部リンク:chierou.com
279: 2022/02/25(金)06:16 ID:W8SDnGbv(1) AAS
プーチンロシアはウクライナに何てことするんだよ
280: ロシアによる北方領土進出企業への税優遇は「遺憾」 2022/03/10(木)16:17 ID:ZzSzzF4L(1) AAS
松野博一官房長官は10日午前の会見で、ロシアが北方領土に進出する企業に対して税制の優遇措置を設けたことは「遺憾」であり、改めて日本の立場をロシア側に申し入れたと語った。
北方領土(北方四島、ロシア名クリル諸島)は、日本が領有権を主張し、ロシアが実効支配している。
ロシアの新制度では、北方領土を含む島の税制について、ロシア政府の登録を受けた企業に法人税や固定資産税など最大20年間の優遇措置を設けるなどとしている。松野長官は「北方4島に対する日本の立場や、首脳間の合意に基づき日ロ間で議論してきた北方4島における共同経済活動の主旨と相容れない」と述べた。
ウクライナのクレバ外相は9日、ロシア軍が占拠しているチェルノブイリ原子力発電所の電源が喪失したと明らかにした。これに関連し松野長官は「先に行われたザポロジエ原発への攻撃を含め、原子力施設に対するロシアの一連の行為を強く非難する」と語り、ロシアに対して同様の行為を即座に停止するよう強く求めた。
<穀物価格、情報の収集・分析進める>
省3
281: 2023/09/12(火)06:12 ID:??? AAS
あんた、ちょっとヘンやろ
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.819s*