KuriKumaChan’s diary

Kuri ちゃんと Kuma ちゃんの飼い主の独り言

自宅 NAS 交換 (9) 仕様外パーツによる不具合発生のお知らせと QNAPオンラインサポートについて

昨年ご紹介してきた QNAP の NAS TS-453Be ですが、ご紹介したパーツに仕様外となるパーツがあり、それに伴うと考えられる不具合が発生していましたのでお知らせします。不具合自体はパーツ交換にて現在は解消しました。
もし記事でご紹介した仕様外のパーツを参照して購入されている方がいらっしゃいましたらお詫び申し上げます。
その上で、QNAP のサポートを受けて当時原因不明だった不具合も解消できたという顛末と、そんな経験無い方が良いに決まっていますが万一サポートを受けなければならなくなった時にはこんな情報提供が必要だよ、というお話をご紹介します。

現象について

大きく2種類の不具合が発生していました。

  1. まれに NAS が勝手に再起動をしてしまう。

  2. まれに NAS はハードウェア上ランプが点灯し稼働しているように見えるが、ネットワークドライブにアクセスできず、QTS にログインできない状態になっている。

1 は夜寝ていると、NAS が「ピー」と音を発することがあり、その際に再起動していました。最初に音を聞いた時には分からなかったのですが、翌日に NAS にアクセスしようとするとネットワークドライブのマウントが外れていることがあったことと、QTS にログインすると「ドライブがクリーンではない」旨のメッセージが表示されていたり、アップタイムが極端に少ない(つまり最近再起動した)ということで気づきました。毎日パソコンをシャットダウンしていると気づきにくいのですが、QTS のアップタイムをチェックするなどするとわかりやすいかもしれません。
2 は頻度は 1 より少ないですが、パソコンからネットワークドライブにアクセスしようとすると反応がなく、QTS にログインしようとしてもパネルが表示されないことがあり、NAS 本体のランプを確認すると特に異常はなく、やむなく本体の電源スイッチの off/on で再起動して回復したことがありました。

不具合の原因 - 仕様の上限を超えたメモリーの装着だったと考えられる

いきなりの結論ですが、原因は TS-453Be の仕様である最大メモリ容量の 8GB を超えた 16GB を装着した事によると考えられます。導入当初 8GB x 2 の 16GB を装着して QTS 上 16GB の搭載と認識されて稼働していたので問題なしと考えていましたが、下記原因特定の経緯に従い 4GB x 2 の 8GB に変更したところ、しばらく様子を見ていましたが上記の不具合は全く発生しなくなったためにこれが原因だったと考えています。

f:id:KuriKumaChan:20210323141759p:plain
TS-453Be の仕様では最大メモリは 8 GB (2 x 4 GB) と明記

www.qnap.com

原因特定の経緯

当初はパーツの接続不良等を疑い再装着など行いましたが解決せず、QNAP のオンラインサポートに問い合わせたところ、"SOP (unexpected reboot/hang/shutdown)" という問題判別のための標準操作手順書 (the Standard Operating Procedure) が提供されました。そのドキュメントではスタンドアロンのメモリーテストを行う手順の説明なのですが、その事前確認事項の一つに

4. Have user upgraded the NAS memory (DRAM)? If yes, please make sure the memory size is within the spec. limitation.

とあり、「ああ、そうだったのか」となりました。つまりメモリーテスト実施以前の確認事項にひっかかっていたのです。


QNAP オンラインサポートを受けるにあたっての注意

結局正規のサポートをもらったらすぐに原因の特定につながった、というお話なのですが、どんな製品でも同じだとは思いますが、しっかりしたテクニカルサポートを受けるにはユーザー側もそれなりにしっかりした input は必要です。なんとなくSNS やフォーラムのようなところに書けば答えてくれる、というものではありませんので注意が必要です。せっかくなので QNAP のオンラインサポートを実際に使った経験から、ユーザー側で準備しなければならないことをまとめておきます。今回は一発で原因究明に至ったのですがそれは幸運なケースであって、これらは必要最小限の情報ということになると思います。

QNAP ID が必要です。

オンラインサポートを受けるには、QNAPサービスポータルにログインする必要がありますが、そのためには QNAP ID が必要となります。私はリモートから NAS にアクセスしたり状態を確認するために、QNAP ID を取得していましたのでそれを利用すればよかったのですが、そういったネットワークサービスを利用していない方は新たに QNAP ID を取得する必要があります。
ユーザー登録のついでに利用製品の登録も済ませておくと良いと思います。

www.qnap.com

QTS にアクセスできることが必要です。

この後もう少し詳しく説明しますが、NAS のファームウェア・バージョンやシリアル番号の確認が必要なので、QTS(NAS の OS で各種情報や機能を GUI で表示する) にログインしてコントロールパネルを参照する必要があります。
また、ログの添付も必要です。ログはデフォルトで自動的に記録されていますので、それを QTS を介して NAS からパソコンにダウンロードし、オンラインサポートに提供する必要があります。

質問は英語で‥

実は私は日本語で質問してしまったのです。QNAPサービスポータル自体が日本語表示になっていたので、「お、これは日本語 OK なんだ!」と思ったのです。しかし、24時間以内にまず返信があるとのことだったが 2日経っても返信がなく 3日目くらいに返信があり、
「ここはグローバルサポートなので英語しかわからないんだ。しかしあなたの質問を Google 翻訳にかけたらこのような内容だった。SOP の手順つけるからまずこれ確認してね。」
と、親切にも質問を却下せずにわざわざ翻訳して確認して対応も教えてくれました。
ということで、QNAP は親切だったのですけれども英語で質問しましょう!というのが一つのメッセージなのですが、それでは「お前だけ日本語で楽しやがって!」とお叱りを受けそうなので、実際にサービスポータルで問い合わせるにあたってのポイントをいくつかご紹介して、最小限の英語のやりとりで済ませるお手伝いをしておこうと思います。

QNAP オンラインサポートってどんなものなの?

よくある IT 系の問題報告システムと考えていただければ間違いありませんが、今回のケースで QNAP ID 以外に事前に手元に置いておかないとならない(入力を求められる)情報がありますのでその入力フォームを添付しておきます。

f:id:KuriKumaChan:20210323172046p:plain
「サポートチケット作成」画面。ここでトラブル内容も含めて記載する。

シリアル番号、ファームウェア・バージョン

QTS のコントロールパネルの先頭に、ファームウェア・バージョン、シリアル番号、CPU、メモリ容量と合わせて表示されていますので、確認の上転記します(コピペができない!)

f:id:KuriKumaChan:20210323172746p:plain
コントロールパネルに表示されている

ログ一式

サポートチケットの作成画面に「QTS ヘルプデスクアプリからの診断ログの添付をおすすめします」と記載されているので、私は NAS がらダウンロードして添付しました。表現はオプション扱いですが、今回のようなケースはログがあった方が間違いなく良いはずなので添付しました。 NAS からのダウンロード方法はサポートチケット作成画面に記載されています。 なお、ログ一式と表現していますが、ダウンロードされるファイルは zip ファイル一つでその中に様々な情報が含まれています。zip の最上位に内容を表示する html ファイルがあり、そこから各種情報を参照することができます。種類にもよりますが、Event Log などは購入以降のイベントがまだ削除されずに記録されているようでした。
余談ですが、素人ながら私の NAS に不具合が発生した日時の情報をいくつかのログで見てみると、最初に書いた現象 #1 の突然の再起動は、特別エラーメッセージも表示なくある時再起動が始まっている、という感じでした。現象 #2 のアクセス不能の方は発生のタイミングが不明確なので Event Log を眺めても分かりませんが、何か他の情報を見れば何かしらの状況がわかったのかもしれません。ただし、QNAP 側のサポート側で解析するのが主目的なのでユーザー側でログを覗いて見るようなことは必須な対応ではありません。あくまでも興味の範囲ということで。

書かなければならないポイント

上で「英語で書きましょう!」と突き放したようなことを書いてしまいましたが、今回のような現象は結構あるようで、今回サポート側から提供された "SOP (unexpected reboot/hang/shutdown)" はそう言った場合に対応する手順が書かれたものでした。
"SOP (unexpected reboot/hang/shutdown)" の PDF がどこかに公開されていればそのリンクをご紹介すれば良いのですが、公開されていないようなので勝手に先頭部分だけ引用させてもらいます。本来ユーザー向けでは無いような気もしますが、この部分をユーザーと共有すること自体は QNAP さんにとっても手間が省けるはずなのでご容赦いただけると思いますので。

Please provide the following when you submit the mantis about hang/reboot/shutdown issue.
1. NAS behavior:
A. NAS hang and need to manually power off and then power on. / NAS cannot boot up.
B. NAS reboot by itself.
C. NAS shutdown by itself, and need to manually power it on.
D. Others, please provide the detail behavior.
2. Any operation / running services / schedule jobs executing when the issue happens?
3. When did the issue start to happen? After firmware upgrade? How long will the problem occur after turn on the NAS? etc.
4. Have user upgraded the NAS memory (DRAM)? If yes, please make sure the memory size is within the spec. limitation. Please also ask user to try the memory test per the following SOP: https://wiki.qnap.com/wiki/Memory_Test [^] [^]
Note: Use only QNAP memory modules to maintain system performance and stability. For NAS devices with more than one memory slot, use QNAP modules with identical specifications. Warning: Using unsupported modules may degrade performance, cause errors, or prevent the operating system from starting.
5. Are all HDDs on the NAS compatibility list? Check the result of disabling HDD standby? Check all HDDs if there is any bad block (Bad block scan / SMART complete Test)
6. Have user enable SSD cache? Check the result of disabling SSD cache?

タイトルに「書かなければいけない」と書きましたが、書かなくても怒られることはないでしょうが、これに沿って英文を作っていくのが効率的だと思います。簡単な英文ですし、この中の文章を自分の状況に合わせて切り貼りするだけでも十分状況は伝わりやすいと思います。 特に "1. NAS behavior" は A-D のどれに該当するかを明確にすることで問題判別の大きな方向性が決まるのだと思います。

1. NAS behavior
挙動ですが、どんな状態かを A-D の 4パターンが例示してありますので、当てはまる内容を書けば良いと思います。

  • A NAS がハングアップして(ネットワーク経由ではアクセスできず)手動でパワーオフオンしなければならなくなった。もしくは起動しなくなった。

  • B NAS が勝手に再起動した。

  • C NAS が勝手にシャットダウンしたままで、手動で電源を入れないと起動しない。

  • D その他

D の場合に限っては頑張って詳細な状況を英作文しなければなりませんがおそらく大半のケースが A-C なのでしょうね。私の場合は、A と B が両方、ということです。

2. Any operation / running services / schedule jobs executing when the issue happens?
私の場合は NAS のドライブにアクセスしているときにはほとんど問題は発生していなく、夜寝ているとぴーという音がして再起動していたようなので、そういったことを書けば良いと思います。他の例としてはネットワークドライブにファイルを n GB 書き込んだら、バックアップを取得していたら、とかでしょうか。

3. When did the issue start to happen? After firmware upgrade? How long will the problem occur after turn on the NAS? etc.
問題が発生するきっかけですね。特定のファームウェアを更新した直後から、とか長時間稼働しているととか。私の場合には現象 #2 があると必ず再起動していたので「数ヶ月たつと発生」という類ではないのでこれに関しては何も記載していません。

4. Have user upgraded the NAS memory (DRAM)? If yes, please make sure the memory size is within the spec. limitation. Please also ask user to try the memory test per the following SOP:
メモリーのアップグレードの有無。もししていたら仕様の上限以内であることを確認。
私がこのドキュメントを読むに当たって、最初はこの後に書かれているスタンドアロンのメモリーテストをやろうかと考えていたのですが、こうハッキリ書かれていると仮にメモリーテストを実施して問題なくても確実に「仕様の範囲のメモリーに戻して確認して欲しい」と言われるはずで、メモリーテストはせずに即座に使用の範囲の上限メモリー (4GB x2) にすることに決めました。ちなみに本体に一枚 4GB が刺さっていたのでその一枚の 4GB で使うか、追加でもう一枚買って上限の 8GB にするという選択もあったのですが、メーカーの違うものをペアで使うのももし何かあったときにめんどくさいので、新たに 2枚組を購入しました。

5. Are all HDDs on the NAS compatibility list? Check the result of disabling HDD standby? Check all HDDs if there is any bad block (Bad block scan / SMART complete Test)
私は compatibility list (稼働確認済リスト)はチェックしていませんが、WD の NAS 用 HDD 使っているので問題ないだろうと勝手に思ったのと、smart 情報は QTS から問題ないことを確認しています。

6. Have user enable SSD cache? Check the result of disabling SSD cache?
キャッシュを使っている場合は disable に一旦してみてね、ということですが、私はこれは確認済でした。(disable にしても再現したということです)

解説を長々としていますが、実際問題に遭遇した場合上記のどれに当てはまるかチェックして、該当する場合はそれを表す英単語を組み合わせていけばなんとかなると思います。多分難しいのは英語より不具合の状況を説明することなので、それが上記の 1-5 に照らし合わせて説明できれば十分だと思います


メモリー交換(16GB → 8GB)後のパフォーマンスは相変わらず絶好調!

もともと 16GB を認識していたと言っても、仕様の上限を超えていたので有効活用されていたわけでは無いでしょうけれども、ちょっとはパフォーマンスが気になりましたので測定してみました。

f:id:KuriKumaChan:20210323183006p:plain
10GbE と Cache のおかげで Write 450MBps 超え、Read 650MBps 超えで相変わらず絶好調!

余談

昨年夏に TS-453Be を 16GB で導入し問題に気づかなかったのはなぜか?と今考えるといくつか理由がありそうです。一つは毎週スケジューラーで NAS を再起動させていたので、勝手な再起動が少なかったのかもしれません。他には Mac を使用後にシャットダウンしていたので毎回ネットワークドライブは Qfinder から毎度再マウントしていたので気づかなかったのでは無いかと思います。
そういう意味でも QTS のパネルをたまには表示したり、スマホアプリの Qmanager を開いたりしていると気づきやすいですね。そしてあまり長期間稼働していたら手動で再起動しておくのも現実的かもしれません。 NAS はクラウドストレージではなく自分が管理するサーバーマシンであることを理解しておく必要があります。

f:id:KuriKumaChan:20210325161422p:plain
Qmanager アプリ。たまにはアップタイムを確認してみてはいかが?


最後に念のためですが、今回は最初に搭載した 8GB x2 のメモリーパーツそのものの不具合や品質の問題ではなく、本体仕様を超えた容量のメモリーを装着したことが問題と考えられることを再度書かせていただきます。