AIXスレッド Technology Levels 06(Part6) (793レス)
AIXスレッド Technology Levels 06(Part6) http://mevius.5ch.net/test/read.cgi/unix/1193791491/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
202: 120 [] 2008/05/04(日) 15:49:57 >>198 うちのルールでは幹線で固定設定できるところは固定することになっている。 例えばサーバーとネットワーク機器との間は固定to固定で接続して パソコンショップで売っている安いSW-HUBとの間だとAuto-to-Autoで 接続することになっている。 今回の現象は別の問題でAIX ODMでは100M/Full設定なのが何故動作が 100M/Halfになっちまったか? これが問題なのです。で問題はそれ1回でそれからはまったく発生しません。 現時点での対応は原因不明扱いとしてシステムを起動してからちゃんと 100M/Fullになっているか確認することでOKって指示をしておきました。 そして100M/Halfだったらオイラを呼べと.... 今は判明していることはAutoの切り替えの後だった。オペレーションは 慣れている人がおこなっておりミスは無いと思われる。 つまり何かの手順でおこなうとODMの情報がデバイスに反映されないことが あるらしい。でも電源OFFからの起動では問題が発生しない。 どういう手順でおこなうと発生するのか?これの解明なのです。 再現無しで問題が発生しなってのは余計にやっかいなのです。 今世間はGWなのにAIXでない別の問題を抱えちまって、これまた頭の痛い状態なのです。 でもこっちは再現性100%なので問題が解明できそうです。 http://mevius.5ch.net/test/read.cgi/unix/1193791491/202
203: 120 [] 2008/05/04(日) 15:54:56 AIXとは関係ないのでここには書きのはちょっとと思うが....すみません。 現象 あるサーバーとサーバーとの間でftpを使ったファイル転送が大量に(と言っても約60GB/day) おこなわれている。ファイル転送は1個も失敗しないが転送している途中で一瞬止まる。 これは何故か?これを調べてくれ。と言われてしまった。 解析するとL4でACKが戻ってこないでTCPがTimeoutして再送していることが判明。 驚いたことに問題を報告してこない別の組織でも同じネットワーク機器とサーバー の組み合わせを使っている所があり、同じ現象が発生していた。 (つまり問題に気がついていない。) Timeoutを検地しているのはftpdがファイルを送信しているときに送信側で発生している。 次はL3でチェック。サーバー側で送信したハズのパケットが受信側に届いていないことが判明。 (これじゃL4でTimeoutする訳だ。) パケットはネットワーク機器でdropしている。原因を調べるとネット機器のInputでCRCエラー 1つは140171833中2845CRC Error 0.002%。もう1つは276601434中61117CRC Error 0.022% 僅かなCRC Errorなので運用上は問題がないと思われるが何故かが気になるし、 報告書を書かなければならない。CRC Error 0が普通の環境なのに.... つまりL2での問題。救えるのは両者が同じ組み合わせで発生しているということ。 同じ型番のネットワーク機器で同じ型番のサーバーと同じOSの同じバージョンで ノミ問題が発生していること。 この手のトラブルは原因を解析しやすい。アナライザーをつないでCRC Errorを 拾えばいいからだ。 さて原因はネットワーク機器なのか?デバイスなのか?OSのドライバーなのか? これを探すのも1つの楽しみである。AIXとはまったく関係ないのでこれでオシマイ。 http://mevius.5ch.net/test/read.cgi/unix/1193791491/203
204: 名無しさん@お腹いっぱい。 [sage] 2008/05/05(月) 00:15:47 イーサネットのフレームが壊れることはめずらしくない。 なのためのCRCかL4なのか。。。 L3ではヘッダーのチェックサムだけだよな? http://mevius.5ch.net/test/read.cgi/unix/1193791491/204
205: 203 [] 2008/05/05(月) 09:37:25 話題が変わったので120→203 >>204 >イーサネットのフレームが壊れることはめずらしくない。 Yes でもうちではSW-HUB,Router周りは0がでふぉ CRC等でSWでドロップされTCPがTimeoutで待たされるのが嫌だから。当然サーバーも No Carrier Sense: 0 CRC Errors: 0 Max Collision Errors: 0 No Resource Errors: 0 Late Collision Errors: 0 Receive Collision Errors: 0 Deferred: 0 Packet Too Short Errors: 0 SQE Test: 0 Packet Too Long Errors: 0 Timeout Errors: 0 Packets Discarded by Adapter: 0 Single Collision Count: 0 Receiver Start Count: 0 Multiple Collision Count: 0 が基本。 >なのためのCRCかL4なのか。。。 前にDSで土曜日の朝になるとCRC Errorが発生していて、原因を調査したら掃除のおばさんが使っている業務用の掃除機からノイズが廻っていたってことが....そんな時、指示ミスで”こぉらって”怒られる。 インターネット経由以外でL4 Timeout系トラブルは回線が細くでNetwork機器のBuffer overflowで落ちるから。この時も”誰だトラフィックの想定流量を見誤った奴は?” ってやっぱり”こぉら!”って怒られる。つまりカウントしていて”こぉら!”って怒るときに使うもの。:-) sh int f3/40とかnetstat -p tcpするのが嫌いさ。 >L3ではヘッダーのチェックサムだけだよな? Yes RFC791嫁 でも30436 input errors, 29851 CRC, 15640 frame, 585 overrun, 0 ignored ってのも理由があれば許される。原因不明とか想定外があるとNG http://mevius.5ch.net/test/read.cgi/unix/1193791491/205
206: 名無しさん@お腹いっぱい。 [sage] 2008/05/05(月) 22:44:25 >>205 スレ違いなのでネットワーク板でお願い http://mevius.5ch.net/test/read.cgi/unix/1193791491/206
207: 名無しさん@お腹いっぱい。 [sage] 2008/05/11(日) 21:58:51 AIX上でRAIDの構成情報は、どのようにして見るんでしょうか? http://mevius.5ch.net/test/read.cgi/unix/1193791491/207
208: 名無しさん@お腹いっぱい。 [sage] 2008/05/11(日) 22:26:18 smitty http://mevius.5ch.net/test/read.cgi/unix/1193791491/208
209: 名無しさん@お腹いっぱい。 [sage] 2008/05/11(日) 22:54:21 ハードウェアRAIDならAIXからは一つのhdiskとしか見えないんじゃないか? LVMミラーをRAIDとは言わないしなあ。 http://mevius.5ch.net/test/read.cgi/unix/1193791491/209
210: 名無しさん@お腹いっぱい。 [sage] 2008/05/11(日) 23:16:03 ストレージかRAIDカードのマニュアル見ろ AIXからはpdiskで見えてる事が多いが http://mevius.5ch.net/test/read.cgi/unix/1193791491/210
211: 名無しさん@お腹いっぱい。 [sage] 2008/05/12(月) 07:08:23 >>209 >LVMミラーをRAIDとは言わないしなあ。 ソフトウェアRAIDという概念もあることをお忘れ無く。 あと、RAIDの構成情報なんて使ってるディスク装置によって見方が違うんだから、 せめて使ってるディスク装置の名前くらいは出したらどうだ? http://mevius.5ch.net/test/read.cgi/unix/1193791491/211
212: 名無しさん@お腹いっぱい。 [sage] 2008/05/12(月) 07:34:56 >>211 >ソフトウェアRAIDという概念もあることをお忘れ無く。 うん、でもLVMミラーは「ソフトウェアRAID」ではないよ。 http://mevius.5ch.net/test/read.cgi/unix/1193791491/212
213: 名無しさん@お腹いっぱい。 [sage] 2008/05/12(月) 09:31:59 >>212 どこでどう間違ったことを教えられたのかはしらんが、 AIXのLVMミラーはソフトウェアRAIDそのものなわけだが・・・・。 もしかして、HWとしてRAIDコントローラーが無いとRAIDって言わないと思ってたりする? http://itpro.nikkeibp.co.jp/article/COLUMN/20060712/243118/ http://publib.boulder.ibm.com/infocenter/pseries/v5r3/index.jsp?topic=/com.ibm.aix.baseadmn/doc/baseadmndita/mirstrip.htm この辺りを読み直して勉強し直した方が良いと思われ。 http://mevius.5ch.net/test/read.cgi/unix/1193791491/213
214: 名無しさん@お腹いっぱい。 [sage] 2008/05/13(火) 23:57:26 LVMとRAID1はちょっと違うと思うな。 LVMでミラーやストライピングができる。 RAIDの中には0や1もある。 でもLVMのミラーはRAID1ではない。 http://mevius.5ch.net/test/read.cgi/unix/1193791491/214
215: 名無しさん@お腹いっぱい。 [sage] 2008/05/14(水) 00:50:38 >214 お前のRAID1の定義を教えてくれ http://mevius.5ch.net/test/read.cgi/unix/1193791491/215
216: 名無しさん@お腹いっぱい。 [sage] 2008/05/14(水) 02:19:14 >>214 4行目の結論と2,3行目の説明が全く繋がってないことわからない? 100%君のRAID1の定義が間違ってるから君の中の脳内RAID1仕様を教えてくれ。 http://mevius.5ch.net/test/read.cgi/unix/1193791491/216
217: 名無しさん@お腹いっぱい。 [sage] 2008/05/15(木) 09:43:04 1台のHDDドライブでミラーリングできるのか? http://mevius.5ch.net/test/read.cgi/unix/1193791491/217
218: 名無しさん@お腹いっぱい。 [sage] 2008/05/15(木) 20:25:35 >>214 LVMを中心に考えるからダメなんだ。 RAID1=ミラーリング RAID1を構成する手段の一つとしてLVMミラーリングが存在する。 ちなみに青本ではLVMミラーリングをRAID1って言っているお。 http://mevius.5ch.net/test/read.cgi/unix/1193791491/218
219: 名無しさん@お腹いっぱい。 [sage] 2008/05/15(木) 20:29:59 http://publib.boulder.ibm.com/infocenter/pseries/v5r3/topic/com.ibm.aix.prftungd/doc/prftungd/lvm.htm?resultof=%22%52%41%49%44%22%20%22%72%61%69%64%22%20 LVM でサポートされる RAID オプション AIX(R) LVM は 3 つの RAID オプションをサポートしています。 RAID 0 ストライピング RAID 1 ミラーリング RAID 10 または 0+1 ミラーリングとストライピング http://mevius.5ch.net/test/read.cgi/unix/1193791491/219
220: 名無しさん@お腹いっぱい。 [sage] 2008/05/15(木) 23:06:25 そもそもRAID自体に正式な規格が存在するわけじゃないしな〜。 ディスク2本に何らかの形で同時に書き込みを行って、どちらかが壊れても片方で読み書きができる → こいつがミラーリングの大原則(RAID1) 上の大原則が満たせればなんでも良いわけで、DSのコントローラーで実現しようが AIXのLVMで実現しようがどれでやってもRAID1ってことなんだよな。 Windows ServerのダイナミックディスクでもRAID1は構成できるし、 RAID1を実現するためには色々な方法論があってLVMもその一つってことだな。 http://mevius.5ch.net/test/read.cgi/unix/1193791491/220
221: 名無しさん@お腹いっぱい。 [] 2008/05/18(日) 21:32:29 >>217 >1台のHDDドライブでミラーリングできるのか? 設定できるか?と言われればYesだが1台のPVにPP(領域)を2or3個使ってLPでLVを作っても 壊れるときは殆どPV単位だから無意味だし、それにクソ遅い。 http://mevius.5ch.net/test/read.cgi/unix/1193791491/221
222: 名無しさん@お腹いっぱい。 [sage] 2008/05/18(日) 22:09:14 目的と手段が入れ替わっている人がいるみたい。 http://mevius.5ch.net/test/read.cgi/unix/1193791491/222
223: 名無しさん@お腹いっぱい。 [sage] 2008/05/19(月) 00:48:59 HDDドライブはやめてくれ http://mevius.5ch.net/test/read.cgi/unix/1193791491/223
224: 名無しさん@お腹いっぱい。 [sage] 2008/05/19(月) 01:04:13 IPプロトコルやTCPプロトコルとかも苦しいな。 ところで仮想化ってどうですか? x86のバイナリが動くんだとか? http://mevius.5ch.net/test/read.cgi/unix/1193791491/224
225: 名無しさん@お腹いっぱい。 [sage] 2008/05/19(月) 01:06:32 あれ?ハードディスクドライブドライブ、君は使ってないの? 大流行だぜ? http://mevius.5ch.net/test/read.cgi/unix/1193791491/225
226: sage [] 2008/05/22(木) 17:37:28 entstatで、NICの統計情報を定期的に収集し、 OS levelでサーバのトラフィックを計測しています。 気づいたのですが、entstatのPackets行の値って、 TransmitとReceive逆じゃないでしょうか・・・? Byte行とま逆になるんですよね…。 5300-05-06 5300-07-03-0811 両TL/SPで試しましたが、同じでした。 http://mevius.5ch.net/test/read.cgi/unix/1193791491/226
227: 226 [sage] 2008/05/22(木) 17:38:38 すみません、久しぶりにブラウザから投稿したもんで、 sageを入れる欄間違えました…。 http://mevius.5ch.net/test/read.cgi/unix/1193791491/227
228: 名無しさん@お腹いっぱい。 [sage] 2008/05/22(木) 17:41:57 IBMだからしかたがない http://mevius.5ch.net/test/read.cgi/unix/1193791491/228
229: 名無しさん@お腹いっぱい。 [sage] 2008/05/22(木) 18:34:46 >>226 そういうのは他の人の為にもSTSCに連絡しておいてくれー。 http://mevius.5ch.net/test/read.cgi/unix/1193791491/229
230: 名無しさん@お腹いっぱい。 [] 2008/05/25(日) 01:11:27 >>226 そういうことはIBMではよくあること http://mevius.5ch.net/test/read.cgi/unix/1193791491/230
231: 名無しさん@お腹いっぱい。 [sage] 2008/05/25(日) 23:31:28 出荷前の検査が足りなかったか? それともそもそも検査項目に入っていなかった? http://mevius.5ch.net/test/read.cgi/unix/1193791491/231
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 562 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.009s