AIXスレッド Technology Levels 06(Part6) (793レス)
前次1-
抽出解除 レス栞

リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
203
(1): 120 2008/05/04(日)15:54 AAS
AIXとは関係ないのでここには書きのはちょっとと思うが....すみません。

現象

あるサーバーとサーバーとの間でftpを使ったファイル転送が大量に(と言っても約60GB/day)
おこなわれている。ファイル転送は1個も失敗しないが転送している途中で一瞬止まる。
これは何故か?これを調べてくれ。と言われてしまった。

解析するとL4でACKが戻ってこないでTCPがTimeoutして再送していることが判明。
驚いたことに問題を報告してこない別の組織でも同じネットワーク機器とサーバー
の組み合わせを使っている所があり、同じ現象が発生していた。
(つまり問題に気がついていない。)

Timeoutを検地しているのはftpdがファイルを送信しているときに送信側で発生している。
次はL3でチェック。サーバー側で送信したハズのパケットが受信側に届いていないことが判明。
(これじゃL4でTimeoutする訳だ。)
パケットはネットワーク機器でdropしている。原因を調べるとネット機器のInputでCRCエラー

1つは140171833中2845CRC Error 0.002%。もう1つは276601434中61117CRC Error 0.022%

僅かなCRC Errorなので運用上は問題がないと思われるが何故かが気になるし、
報告書を書かなければならない。CRC Error 0が普通の環境なのに....

つまりL2での問題。救えるのは両者が同じ組み合わせで発生しているということ。
同じ型番のネットワーク機器で同じ型番のサーバーと同じOSの同じバージョンで
ノミ問題が発生していること。

この手のトラブルは原因を解析しやすい。アナライザーをつないでCRC Errorを
拾えばいいからだ。
さて原因はネットワーク機器なのか?デバイスなのか?OSのドライバーなのか?
これを探すのも1つの楽しみである。AIXとはまったく関係ないのでこれでオシマイ。
205
(1): 203 2008/05/05(月)09:37 AAS
話題が変わったので120→203

>>204
>イーサネットのフレームが壊れることはめずらしくない。
Yes でもうちではSW-HUB,Router周りは0がでふぉ

CRC等でSWでドロップされTCPがTimeoutで待たされるのが嫌だから。当然サーバーも
No Carrier Sense: 0 CRC Errors: 0

Max Collision Errors: 0 No Resource Errors: 0
Late Collision Errors: 0 Receive Collision Errors: 0
Deferred: 0 Packet Too Short Errors: 0
SQE Test: 0 Packet Too Long Errors: 0
Timeout Errors: 0 Packets Discarded by Adapter: 0
Single Collision Count: 0 Receiver Start Count: 0
Multiple Collision Count: 0
が基本。

>なのためのCRCかL4なのか。。。
前にDSで土曜日の朝になるとCRC Errorが発生していて、原因を調査したら掃除のおばさんが使っている業務用の掃除機からノイズが廻っていたってことが....そんな時、指示ミスで”こぉらって”怒られる。

インターネット経由以外でL4 Timeout系トラブルは回線が細くでNetwork機器のBuffer overflowで落ちるから。この時も”誰だトラフィックの想定流量を見誤った奴は?”
ってやっぱり”こぉら!”って怒られる。つまりカウントしていて”こぉら!”って怒るときに使うもの。:-)
sh int f3/40とかnetstat -p tcpするのが嫌いさ。

>L3ではヘッダーのチェックサムだけだよな?
Yes RFC791嫁

でも30436 input errors, 29851 CRC, 15640 frame, 585 overrun, 0 ignored
ってのも理由があれば許される。原因不明とか想定外があるとNG
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ

ぬこの手 ぬこTOP 0.026s