Japan IBM Storage User Group

FlashSystem 900 AE3のOOPSに注意!

By Keitaro Imai posted Thu May 21, 2020 06:08 AM

  
FlashSystem 900 AE3はFlashのモジュール自体に圧縮機能が備わっており、搭載されている物理容量よりも多くの容量を提供できます(オーバープロビジョニングといいます)。

しかしながら、この機能自体は挙動はシンプロと同じですので、圧縮率の見積もりが過大だったり、不要になったデータ領域を開放できないと想定以上に容量を消費し、使い尽くす可能性があります。
こうなると、ストレージへの書き込みができなくなりますので、サーバーからストレージへのアクセスができない状態になる可能性があります。
これをOut of Physical Space(OOPS)と呼びます。まさにやっちゃった!という感じなのですが、それよりもむしろ大事ですね。。。

OOPSを避けるためには、以下の点に留意ください。

・容量の正確な見積もり
Comprestimatorによる見積もりを行い必要な容量を算出ください。
また、提供するプロビジョニング容量は物理容量の85%以下に収まるようにしてください。
例えば、圧縮率が2倍で物理用量が77.7TiB(=85.5TB=8.5TBモジュールx12)といった場合、
77.7x0.85x2≒132TiB
までのプロビジョニング容量に収めたほうが良いでしょう。

・FlashSystem 900の容量監視を行う
GUI、CLI、Spectrum Control(v5.3.0以降)での定常的な監視やメール、SNMP、Call homeによる通知を行うようにしてください。なお、SVCやStorwizeで仮想化している場合は、必ずFS900の方にログインして監視してください。SVCやStorwizeのレイヤーではFS900の容量監視はできません。

CLIの場合、lsarray(lsmdisk。同じアウトプット)及びlsmdiskgrpで容量の確認が可能です。
特に物理空き容量を見ておけば良いでしょう。

IBM_FlashSystem:FlashSystem900-3:superuser>lsarray 0
mdisk_id 0
status online
mode array
capacity 200.0TB ←最大実行容量
block_size
controller_name
raid_status online
raid_level raid5
redundancy 1
rebuild_priority rebuildweighted
rebuild_ahead off
encrypt no
enclosure_id 1
reserved_size 0
scrub_rate 1
scrub_progress 89
over_provisioned yes
supports_unmap yes
physical_free_capacity 77.6TB ←物理空き容量
physical_capacity 77.6TB ←物理容量
write_protected no
warning 50

IBM_FlashSystem:FlashSystem900-3:superuser>lsmdiskgrp 0
id 0
name mdiskgrp0
status online
mdisk_count 1
vdisk_count 40
capacity 199.99TB ←最大プロビジョニング容量
free_capacity 190.23TB ←プロビジョニング可能容量
virtual_capacity 9.77TB ←ボリュームに割り当てられている仮想化容量(virtual=used=real)
used_capacity 9.77TB ←ボリュームとして使用済みの容量
real_capacity 9.77TB ←ボリュームに割り当てられているストレージ容量
parent_mdisk_grp_id 0
parent_mdisk_grp_name mdiskgrp0
child_mdisk_grp_count 0
child_mdisk_grp_capacity 0.00MB
type parent
encrypt
physical_capacity 77.61TB ←物理容量
physical_free_capacity 77.56TB ←物理空き容量
GUIでは以下のように表示されますので、「物理容量」の「使用可能な容量」を確認ください。
・SCSI UNMAP機能が正常に機能するようにする
FS900をホストから直接使用する場合は、ホスト側がSCSI UNMAPが使用可能なこと、SVCやStorwizeで仮想化している場合は、バージョン8.1.1.2以降であることが強く推奨されます。
そうでないと、無駄領域によって容量が逼迫することになります。
なお、既にFS900 AE3を使用中のSVC/Storwize環境で、SVC/Storwizeのバージョンが8.1.1.2未満の場合、8.1.1.2以降にバージョンアップしたとしても既に無駄になった領域を開放することはできません。
この場合は、FS900のボリューム(SVC/Storwize上ではMdisk)を削除しないと開放できませんのでご注意ください。
SVC系及びFlashSystemの推奨バージョンはこちらをご覧ください。

FlashSystem Code Recommendations
http://www-01.ibm.com/support/docview.wss?uid=ssg1S1009645

SCSI UNMAPについては以下の記事も参考にしてください。
シンプロとレクラメーションとSCSI UNMAP【その1 概要編】
http://www-01.ibm.com/support/docview.wss?uid=ibm10717303


OOPSの詳細については以下のWhite Paperを参考にしてください。
White Paper - Best Practices Details for Managing Physical Space on FlashSystems 900-AE3
なお、FlashSystem V9000やFlashSystem 9100、FlashSystem A9000等はFlashそのものの容量監視は不要ですが、シンプロ(A9000ではデフォルト)やDRPを使用している場合は従来どおりレクラメーションによる容量開放は意識しておくべきでしょう。

#flashsystem-900
#oops
#scsi-unmap
#reclamation
0 comments
8 views

Permalink