AIXスレッド Technology Levels 06(Part6) (793レス)
1-

202: 120 2008/05/04(日)15:49 AAS
>>198

うちのルールでは幹線で固定設定できるところは固定することになっている。

例えばサーバーとネットワーク機器との間は固定to固定で接続して
パソコンショップで売っている安いSW-HUBとの間だとAuto-to-Autoで
接続することになっている。

今回の現象は別の問題でAIX ODMでは100M/Full設定なのが何故動作が
100M/Halfになっちまったか?

これが問題なのです。で問題はそれ1回でそれからはまったく発生しません。

現時点での対応は原因不明扱いとしてシステムを起動してからちゃんと
100M/Fullになっているか確認することでOKって指示をしておきました。

そして100M/Halfだったらオイラを呼べと....

今は判明していることはAutoの切り替えの後だった。オペレーションは
慣れている人がおこなっておりミスは無いと思われる。

つまり何かの手順でおこなうとODMの情報がデバイスに反映されないことが
あるらしい。でも電源OFFからの起動では問題が発生しない。

どういう手順でおこなうと発生するのか?これの解明なのです。

再現無しで問題が発生しなってのは余計にやっかいなのです。

今世間はGWなのにAIXでない別の問題を抱えちまって、これまた頭の痛い状態なのです。
でもこっちは再現性100%なので問題が解明できそうです。
203
(1): 120 2008/05/04(日)15:54 AAS
AIXとは関係ないのでここには書きのはちょっとと思うが....すみません。

現象

あるサーバーとサーバーとの間でftpを使ったファイル転送が大量に(と言っても約60GB/day)
おこなわれている。ファイル転送は1個も失敗しないが転送している途中で一瞬止まる。
これは何故か?これを調べてくれ。と言われてしまった。

解析するとL4でACKが戻ってこないでTCPがTimeoutして再送していることが判明。
驚いたことに問題を報告してこない別の組織でも同じネットワーク機器とサーバー
の組み合わせを使っている所があり、同じ現象が発生していた。
(つまり問題に気がついていない。)

Timeoutを検地しているのはftpdがファイルを送信しているときに送信側で発生している。
次はL3でチェック。サーバー側で送信したハズのパケットが受信側に届いていないことが判明。
(これじゃL4でTimeoutする訳だ。)
パケットはネットワーク機器でdropしている。原因を調べるとネット機器のInputでCRCエラー

1つは140171833中2845CRC Error 0.002%。もう1つは276601434中61117CRC Error 0.022%

僅かなCRC Errorなので運用上は問題がないと思われるが何故かが気になるし、
報告書を書かなければならない。CRC Error 0が普通の環境なのに....

つまりL2での問題。救えるのは両者が同じ組み合わせで発生しているということ。
同じ型番のネットワーク機器で同じ型番のサーバーと同じOSの同じバージョンで
ノミ問題が発生していること。

この手のトラブルは原因を解析しやすい。アナライザーをつないでCRC Errorを
拾えばいいからだ。
さて原因はネットワーク機器なのか?デバイスなのか?OSのドライバーなのか?
これを探すのも1つの楽しみである。AIXとはまったく関係ないのでこれでオシマイ。
204
(1): 2008/05/05(月)00:15 AAS
イーサネットのフレームが壊れることはめずらしくない。
なのためのCRCかL4なのか。。。
L3ではヘッダーのチェックサムだけだよな?
205
(1): 203 2008/05/05(月)09:37 AAS
話題が変わったので120→203

>>204
>イーサネットのフレームが壊れることはめずらしくない。
Yes でもうちではSW-HUB,Router周りは0がでふぉ

CRC等でSWでドロップされTCPがTimeoutで待たされるのが嫌だから。当然サーバーも
No Carrier Sense: 0 CRC Errors: 0

Max Collision Errors: 0 No Resource Errors: 0
Late Collision Errors: 0 Receive Collision Errors: 0
Deferred: 0 Packet Too Short Errors: 0
SQE Test: 0 Packet Too Long Errors: 0
Timeout Errors: 0 Packets Discarded by Adapter: 0
Single Collision Count: 0 Receiver Start Count: 0
Multiple Collision Count: 0
が基本。

>なのためのCRCかL4なのか。。。
前にDSで土曜日の朝になるとCRC Errorが発生していて、原因を調査したら掃除のおばさんが使っている業務用の掃除機からノイズが廻っていたってことが....そんな時、指示ミスで”こぉらって”怒られる。

インターネット経由以外でL4 Timeout系トラブルは回線が細くでNetwork機器のBuffer overflowで落ちるから。この時も”誰だトラフィックの想定流量を見誤った奴は?”
ってやっぱり”こぉら!”って怒られる。つまりカウントしていて”こぉら!”って怒るときに使うもの。:-)
sh int f3/40とかnetstat -p tcpするのが嫌いさ。

>L3ではヘッダーのチェックサムだけだよな?
Yes RFC791嫁

でも30436 input errors, 29851 CRC, 15640 frame, 585 overrun, 0 ignored
ってのも理由があれば許される。原因不明とか想定外があるとNG
206: 2008/05/05(月)22:44 AAS
>>205
スレ違いなのでネットワーク板でお願い
207: 2008/05/11(日)21:58 AAS
AIX上でRAIDの構成情報は、どのようにして見るんでしょうか?
208: 2008/05/11(日)22:26 AAS
smitty
209
(1): 2008/05/11(日)22:54 AAS
ハードウェアRAIDならAIXからは一つのhdiskとしか見えないんじゃないか?
LVMミラーをRAIDとは言わないしなあ。
210: 2008/05/11(日)23:16 AAS
ストレージかRAIDカードのマニュアル見ろ
AIXからはpdiskで見えてる事が多いが
211
(1): 2008/05/12(月)07:08 AAS
>>209
>LVMミラーをRAIDとは言わないしなあ。
ソフトウェアRAIDという概念もあることをお忘れ無く。

あと、RAIDの構成情報なんて使ってるディスク装置によって見方が違うんだから、
せめて使ってるディスク装置の名前くらいは出したらどうだ?
212
(1): 2008/05/12(月)07:34 AAS
>>211
>ソフトウェアRAIDという概念もあることをお忘れ無く。
うん、でもLVMミラーは「ソフトウェアRAID」ではないよ。
213: 2008/05/12(月)09:31 AAS
>>212
どこでどう間違ったことを教えられたのかはしらんが、
AIXのLVMミラーはソフトウェアRAIDそのものなわけだが・・・・。
もしかして、HWとしてRAIDコントローラーが無いとRAIDって言わないと思ってたりする?

外部リンク:itpro.nikkeibp.co.jp
外部リンク[jsp]:publib.boulder.ibm.com

この辺りを読み直して勉強し直した方が良いと思われ。
214
(3): 2008/05/13(火)23:57 AAS
LVMとRAID1はちょっと違うと思うな。
LVMでミラーやストライピングができる。
RAIDの中には0や1もある。
でもLVMのミラーはRAID1ではない。
215: 2008/05/14(水)00:50 AAS
>214
お前のRAID1の定義を教えてくれ
216: 2008/05/14(水)02:19 AAS
>>214
4行目の結論と2,3行目の説明が全く繋がってないことわからない?
100%君のRAID1の定義が間違ってるから君の中の脳内RAID1仕様を教えてくれ。
217
(1): 2008/05/15(木)09:43 AAS
1台のHDDドライブでミラーリングできるのか?
218: 2008/05/15(木)20:25 AAS
>>214
LVMを中心に考えるからダメなんだ。
RAID1=ミラーリング

RAID1を構成する手段の一つとしてLVMミラーリングが存在する。

ちなみに青本ではLVMミラーリングをRAID1って言っているお。
219: 2008/05/15(木)20:29 AAS
外部リンク[htm]:publib.boulder.ibm.com

LVM でサポートされる RAID オプション

AIX(R) LVM は 3 つの RAID オプションをサポートしています。
RAID 0 ストライピング
RAID 1 ミラーリング
RAID 10 または 0+1 ミラーリングとストライピング
220: 2008/05/15(木)23:06 AAS
そもそもRAID自体に正式な規格が存在するわけじゃないしな〜。

ディスク2本に何らかの形で同時に書き込みを行って、どちらかが壊れても片方で読み書きができる
→ こいつがミラーリングの大原則(RAID1)

上の大原則が満たせればなんでも良いわけで、DSのコントローラーで実現しようが
AIXのLVMで実現しようがどれでやってもRAID1ってことなんだよな。
Windows ServerのダイナミックディスクでもRAID1は構成できるし、
RAID1を実現するためには色々な方法論があってLVMもその一つってことだな。
221: 2008/05/18(日)21:32 AAS
>>217
>1台のHDDドライブでミラーリングできるのか?

設定できるか?と言われればYesだが1台のPVにPP(領域)を2or3個使ってLPでLVを作っても
壊れるときは殆どPV単位だから無意味だし、それにクソ遅い。
222: 2008/05/18(日)22:09 AAS
目的と手段が入れ替わっている人がいるみたい。
223: 2008/05/19(月)00:48 AAS
HDDドライブはやめてくれ
224: 2008/05/19(月)01:04 AAS
IPプロトコルやTCPプロトコルとかも苦しいな。
ところで仮想化ってどうですか?
x86のバイナリが動くんだとか?
225: 2008/05/19(月)01:06 AAS
あれ?ハードディスクドライブドライブ、君は使ってないの?
大流行だぜ?
226
(3): sage 2008/05/22(木)17:37 AAS
entstatで、NICの統計情報を定期的に収集し、
OS levelでサーバのトラフィックを計測しています。

気づいたのですが、entstatのPackets行の値って、
TransmitとReceive逆じゃないでしょうか・・・?
Byte行とま逆になるんですよね…。

5300-05-06
5300-07-03-0811
両TL/SPで試しましたが、同じでした。
227: 226 2008/05/22(木)17:38 AAS
すみません、久しぶりにブラウザから投稿したもんで、
sageを入れる欄間違えました…。
228: 2008/05/22(木)17:41 AAS
IBMだからしかたがない
229: 2008/05/22(木)18:34 AAS
>>226
そういうのは他の人の為にもSTSCに連絡しておいてくれー。
230: 2008/05/25(日)01:11 AAS
>>226

そういうことはIBMではよくあること
231
(1): 2008/05/25(日)23:31 AAS
出荷前の検査が足りなかったか?
それともそもそも検査項目に入っていなかった?
1-
あと 562 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ

ぬこの手 ぬこTOP 0.013s